На главную страницу ЗАО Софткей
 Главная   Новости   Статьи   Пресс-релизы   Рассылки 
 
MS O365 test

Роман с яблоком

29.09.2002 / Программы / Николай Надеждин

С программами распознавания текстов так или иначе сталкивалось большинство пользователей. Идея обработать отсканированное изображение газетной страницы, книги или машинописной копии и получить в результате оцифрованный текст выглядит очень привлекательно. Действительно, что такое отсканированная страница текста? Всего лишь картинка. Ни цитату вытащить, ни слово поправить. А распознанный и переведенный в компьютерный формат текст - это готовый документ, который не придется перенабирать вручную, но при этом можно править или верстать.

Для частного пользователя, компьютер которого стоит дома, программа распознавания едва ли ни первая затея со вновь приобретенным сканером. Например, отыскать в залежах старых бумаг свои же газетные статьи пятнадцатилетней давности, да перевести их в привычный word'овский формат. Вдруг пригодится? Или отсканировать редкие книжки, владеть которыми не получается, но на день-два можно перехватить в библиотеке или у друзей. Зато потом эту книжку элементарно просто раздергивать на цитаты, пополнить ею свою электронную библиотеку, или, если очень приспичило, распечатать хотя бы фрагментами... Да мало ли что придет в голову компьютеризированному человеку?

Гораздо более серьезные задачи возлагаются на программы распознавания профессионалами. В редакциях периодических изданий, куда до сих пор несут отпечатанные на старомодных машинках статьи, компьютер со сканером и программой распознавания позволяет отказаться от услуг машинистки (компьютеризированной донельзя, но все такой же рассеянной). В государственной конторе программа распознавания помогает избавиться от завалов лишних бумаг, позволяя организовать электронный архив. На коммерческом предприятии - наладить цивилизованный документооборот, а с ним навести порядок в учете. В банке - окончательно перевести самые расхожие документы в компьютерный формат. И так далее...

С программами распознавания большинство из нас знакомо еще и потому, что их облегченные версии входят в комплект планшетных сканеров, причем, любых - от самых дешевых бытовых моделей, до профессиональных аппаратов, выпускаемых для нужд полиграфии. Везде, где есть "планшетник", найдется применение и программе распознавания.

За полнофункциональные пакеты приходится платить отдельно, но они того стоят. Для любого пишущего человека, журналиста или литератора, для специалиста, имеющего дело с какими-либо документами, программа распознавания станет инструментом на каждый день, избавляя пользователя от рутинной и напрасной работы...

Пора ее назвать - рядом все равно ничего нет. Конкуренция в области программных средств распознавания текстов давно утратила былую остроту. В лидерах прочно утвердился FineReader компании ABBYY Software House. Конкуренты отстали если ни на шаг, то на полшага точно. И в сознании большинства российских пользователей само слово "распознавание" ассоциируется с FineReader, как слово Macintosh - с отличными компьютерами от Apple.

Почему именно Macintosh? Во-первых, FineReader 5 Pro for Mac, а речь идет именно об этой версии, непохожа на FineReader 6.0 Professional для Windows ровно настолько, насколько компьютер Macintosh непохож на РС. Во-вторых, особенности аппаратно-программного обустройства Macintosh придают FineReader недоступные компьютерам РС возможности, вроде поддержки AppleScript, позволяющей в значительной степени автоматизировать процесс распознавания. В-третьих... Хорошей программе нужен хороший компьютер. Разве не повод?

Что, кроме загадочного (исключительно для меня) AppleScript, FineReader в версии для Mac'ов умеет делать такого, что не по силам версии для Windows? В общем-то ничего - обе версии работают с одинаковым успехом, а потому краткое описание функциональных возможностей пакета справедливо для них в равной степени.

Macintosh готов к распознаванию текста
В программе FineReader реализованы сразу три технологии - целостного, целенаправленного и адаптивного распознавания. Перед запуском распознавания можно задать целый ряд параметров, увеличив скорость обработки изображений высокого качества, улучшив распознавания плохо пропечатанного текста (в ущерб скорости) или включив механизм автоматического определения параметров изображения (процесс идет с переменной скоростью). В любом случае результат получается неплохим. Пусть и не безошибочно, но FineReader справляется даже со старой пожелтевшей от времени газетой с подслеповатой печатью мелким кеглем. Проверял лично.

Важное достоинство FineReader - автоматическое сохранение исходного форматирования текста. Если картинка содержит таблицу, программа распознавания прочтет данные и выведет их именно в виде таблицы. Если текст на отсканированной страничке оформлен в несколько колонок, FineReader выдаст именно многоколонник... Хотя в настройках программы эту функцию можно отключить - чтобы, к примеру, в результате распознавания пяти газетных колонок получить однородный текст без всякого оформления.

Из новых, ранее невиданных функций в FineReader введено автоматическое переформатирование распознанного текста в web-страницу. Удобно необыкновенно! Текст в формате html занимает меньше места, чем в традиционных форматах MS Word. Просмотреть архивный документ легче и быстрей в быстром браузере, чем в неповоротливом и громоздком текстовом редакторе. Плюс отсутствие путаницы - все документы, включая иллюстрации, могут храниться в едином формате

Другая новинка - возможность автоматического создания файлов типа pdf для просмотра распознанных документов в популярнейшей "читалке" Adobe Acrobat. Параметры форматирования задаются перед запуском процесса распознавания - взаимное расположение текста и картинок, вывод текста без картинок или картинок без текста.

Две упомянутые опции в программе FineReader Pro for Mac снимают проблему совместимости форматов. Хоть и хвалится MS Word тем, что умеет читать документы Macintosh, а с файлами html ему справиться все-таки легче. То же касается и Acrobat'а - распознанные тексты будут прочитаны на любой машине - хоть на Mac'е, хоть на РС...

Работает проверка орфографии
Очень впечатляет работа встроенного в FineReader орфографического корректора. В отличие от текстового редактора и других офисных программ, в которых орфокорректор зачастую выглядит бесполезным довеском, в FineReader модуль контроля правописания во многом определяет качество распознавания. Он автоматически производит замену неправильно распознанных знаков, выделяя их цветом. У пользователя остается возможность проверить результат работы программы, подкорректировав текст вручную.

Заключительный штрих - FineReader 5 Pro for Mac, как и его "родной брат" FineReader 6.0 Professional для Windows, понимает 117 языков. Говорят, он может распознавать даже головоломную арабскую вязь. Чему лично я очень даже верю, поскольку на моем ноутбуке (увы, вовсе не на Mac'e) давным-давно стоит именно FineReader. И он ни разу меня не разочаровал.

Ссылки по теме:

Автор статьи: Николай Надеждин


Рубрики статей
Все статьи
Аналитика
Программы
Игры
Интернет
Авторские права
Интервью
События в мире ПО
Рассылки
Новости мира ПО
Статьи: Мир ПО
Статьи: Программы
Статьи: Игры
Архив выпусков
  «   Апрель 2018   »  
Пн Вт Ср Чт Пт Сб Вс
      1
2345678
9101112131415
16171819202122
23242526272829
30      
Поиск в архиве

Логин / пароль:
запомнить




Наши партнеры:

 САПР и графика



Написать редактору  | RSSЭкспорт новостей и обзоров


Rambler's
Top100 Rambler's Top100

Разработка компании «Битрикс»
Разработано
«Битрикс»


Copyright © 2001-2018 ЗАО «Софткей»