На главную страницу ЗАО Софткей
 Главная   Новости   Статьи   Пресс-релизы   Рассылки 
 
MS O365 test

Обзор программы ABBYY FineReader 14. Лучшая OCR для работы с PDF-документами

20.02.2017 / Программы / Артем Левичев

ABBYY FineReader 14

FineReader – программа для обработки и распознавания отсканированных документов и PDF-файлов, выпускаемая российской компанией ABBYY. Фирма начала свою работу почти три десятилетия назад, в 1989 году, с выпуска словаря Lingvo. Сейчас это известный разработчик решений в области лингвистики и распознавания текстов (OCR). Решения компании используют свыше сорока миллионов клиентов в двух сотнях стран мира. В частности, ее заказчиками являются "Альфа-банк", "Роснефть", "Транснефть", "Райффайзенбанк", "Кофемания".

У компании ABBYY есть пять известных продуктов. В их числе – FineReader, Compreno, FlexiCapture, Lingvo и система автоматизированного перевода SmartCAT. FineReader используется в бизнес-среде – для повышения эффективности работы с документами. С 2008 года она по лицензии поставляется с устройствами Samsung, Xerox, Fujitsu и Panasonic, это международно признанный продукт с одной из лучших в мире систем оптического распознавания символов (OCR). С ней можно переводить любые изображения со сканера или других устройств – к примеру, фотографии или скомпилированные PDF-файлы – в другие форматы, а также редактировать их на месте. Форматов очень много, с одиннадцатой версии документы можно сохранять даже в виде DjVu. В мире программой пользуются больше двадцати миллионов человек. Продукт был награжден десятками наград и медалей, получил несколько званий "Лучший софт года" от различных журналов. А 24 января 2017 года у него вышла новая, четырнадцатая, версия. Как раз хороший повод рассмотреть программу, которой я и сам пользуюсь уже больше десяти лет.

Установка

Программа работает на Windows, Mac OS и Linux. Для Windows подходят только относительно свежие версии – от Windows 7 и Windows Server 2008 до Windows 10 и Windows Server 2016. Предъявляются требования и к аппаратуре компьютера. ОЗУ – от 1 ГБ (оптимально 4 ГБ), частота процессора – от 1 ГГц, а также не менее 1,2 ГБ места на диске.

Установка ABBYY FineReader 14

Языков для установки и для интерфейса предлагается почти три десятка. Среди них, разумеется, есть и русский. Для установки утилиты в нужной вам версии можно скачать файл прямо с Softkey.ru. Инсталлятор весит 410 МБ. После "подписания" лицензионного соглашения мы можем запустить обычную или выборочную установку компонентов программы. Разницы здесь почти нет, никаких дополнительных сервисов вроде "Яндекс.Бара" программа нам не навязывает, что даже освежает. Можно смело запускать обычную установку, никакие компоненты здесь отключать не придется. А еще очень радует, что разработчики утилиты доверяют своему пользователю достаточно, чтобы дать ему в руки все рычаги для установки программы именно в том формате, в котором ему захочется. Если надо, уже на этом этапе можно отключить проверку обновлений ABBYY FineReader 14. Или запретить ей запускаться при загрузке системы. Или сделать ее программой по умолчанию для просмотра документов PDF. Очень удобно.

Сама утилита в итоге у меня на диске заняла 996 МБ, если не считать файлы, изначально созданные распаковщиком для проведения установки. Если учитывать, какие мощные задачи по распознаванию файлов она выполняет, такой объем кажется даже маленьким.

Интерфейс

Кстати, говоря об удобстве. Интерфейс в программе великолепен. Да, это не традиционный Word, и он под него не мимикрирует. Если вы уже сильно привыкли к работе с продуктами Microsoft (или онлайн-документами Google, которые копируют тот же стиль, с большой многофункциональной линейкой вверху), возможно, вам что-то не понравится. Но в остальном ABBYY FineReader 14 – это все та же классика. Наглядное пособие того, как вместить максимальное число возможностей в минимальный объем пространства.

ABBYY FineReader 14

По умолчанию девяносто процентов окна утилиты отдается вашему документу, PDF-файлу. Если есть желание, это пространство можно даже расширить. И при этом вся (неслабая!) функциональность утилиты доступна за два-три клика мышки. Плюс почти каждая функция обладает горячей клавишей, и все эти горячие клавиши сразу же представлены на панели, их видно. Если вы любите свою клавиатуру больше, чем свою мышку, работать с такой утилитой будет вдвойне приятно. Чтобы скрыть или показать окна, можно, например, нажать F5 (чтобы убрать окно "Страницы"), F6 (для окна "Изображение"), F7 ("Изображение" и "Текст") и F8 ("Текст"). Также позволяется менять размер и расположение окон – попросту двигая разделители между ними, зажав левую кнопку мышки. Рабочее пространство можно полностью настроить по своему усмотрению. Даже панель быстрого доступа и горячие клавиши в ABBYY FineReader 14 являются кастомизируемыми.

ABBYY FineReader 14

Для программы есть подробная инструкция на русском языке (и вообще на любом языке, для которого разработан интерфейс). Также всегда можно почитать гайды онлайн или посмотреть видео. Утилита является очень популярной, про нее всегда найдется нужная информация.

Функциональность

Программа помогает работать с отсканированными бумажными документами и PDF-файлами. Их можно создавать, распознавать, редактировать, сравнивать, согласовывать, конвертировать и защищать. Передовая OCR-технология позволяет конвертировать сканы бумаг и PDF-документы в готовые файлы Excel и Word, которые потом можно свободно редактировать. Она способна распознавать даже таблицы и однорядные математические формулы, а при экспорте в Word – сохранять стили текста. Возможности редактирования доступны и в самой ABBYY FineReader 14 – как для обработанных, так и для только что отсканированных PDF-файлов. Можно объединять несколько документов в один, выполнять по ним поиск, конвертировать их в другие форматы, заполнять формы, накладывать цифровые подписи и так далее.

ABBYY FineReader 14

Сравнение документов – аспект программы, которому было уделено особое внимание в FineReader 14. Возможности утилиты здесь серьезно расширились, и проверка соответствия текста в бумажном и в отсканированном документах теперь не является такой изнурительной. Не надо построчно сравнивать документы, программа сама может быстро найти разницу в словах или символах в двух версиях своих файлов – и укажет вам на это несоответствие. Достаточно воспользоваться инструментов "Сравнение документов" и выбрать две копии одного и того же бумажного файла, которые нужно сравнить между собой. Сравнение доступно даже для файлов в разных форматах: файлов MS Office, отсканированных PDF, сканированных изображениях документов. Поддерживаются 35 языков, причем язык документа может определяться автоматически. Найденные различия выделяются в обоих документах, их легко сравнивать и редактировать при помощи режима синхронной прокрутки. Что еще интересно, FineReader может не замечать маленькие отличия вроде лишнего отступа, другого интервала или шрифта. Так можно сосредоточиться на важных несоответствиях, снизить шанс того, что вы или редактор их случайно пропустите.

Разумеется, специализация ABBYY FineReader – работа с PDF-файлами. Их можно свободно редактировать и конвертировать, объединять, защищать. Изменять порядок страниц и изображений, заполнять бланки, выполнять поиск в файле. Конвертация документов сильно упрощена благодаря инструменту Hot Folder. Он позволяет обрабатывать файлы по расписанию и умеет автоматически конвертировать те документы, которые попали в определенную папку.

Программа поддерживает файлы всех популярных графических форматов – от JPEG и BMP до TIFF и PNG. Она умеет работать даже с XPS, JBIG2 и DjVu. Разумеется, с ней хорошо работать в документах DOC(X), XLS(X), TXT, RTF, PDF. А еще можно сохранять документы в виде электронных книг FB2 и EPUB.

ABBYY FineReader 14

С ABBYY FineReader, как понятно уже из названия, можно неплохо читать. Лично я свои лайт-новеллы, переведенные на английский с китайского и японского стараниями пользователей NovelUpdates.com и Reddit, читаю именно в FineReader, потому что в нем легко открываются любые расширения файлов, включая обычные сканы картинок. А если вдруг возникла какая-то ошибка в форматировании (что для таких "фановых" переводов явление крайне частое), в FineReader ее быстро и удобно можно поправить. В том же MS Word добрая половина форматов у меня бы попросту не открывалась, а обработать отсканированные изображения, сделать их читабельными стало бы целой отдельной проблемой. А с программой от ABBYY рычаги управления всегда остаются в моих руках и я знаю, что любой скачанный или отсканированный документ, в каком состоянии бы он ни был, я смогу, проведя несколько операций, привести в более-менее нормальный вид.

Программа умеет работать с MS Word, MS Excel, MS PowerPoint и MS SharePoint. Она поддерживает Adobe Acrobat, LibreOffice Writer, Apache OpenOffice Writer. Утилита распознает документы на 192 языках, ей не страшны иероглифы, арабский алфавит, армянский, греческий и латиница.

ABBYY FineReader 14

Для работы с только что отсканированными файлами и PDF-документами на рынке однозначно не найти ничего с более совершенной функциональностью. Adobe Acrobat Reader неплохо подходит для обычного просмотра, но полного спектра возможностей ABBYY FineReader 14 даже он не предлагает. Acrobat Pro Extended может делать что-то похожее. Там есть и OCR, и функции редактирования, и работа с 3D-графикой, и даже возможности вставки и преобразования файлов в видеоформаты FLV и H.264. Но стоимость у той программы оказывается безумно высокой, фактически позволить ее себе могут только очень крупные и успешные фирмы. Одна копия стоит $699. Если работать вы собираетесь с текстом, а не с видеофайлами и 3D-графикой, смысла платить такие серьезные деньги нет. А на ABBYY FineReader 14, к счастью, можно очень хорошо сэкономить...

Покупка

У программы есть бесплатный 30-дневный период (на 100 первых обработанных страниц). Дальше придется покупать одну из версий. Их здесь три: Standard, Business (Corporate) и Enterprise. Первая подходит для частных пользователей, она дешевле всего, от 6990 рублей за полную лицензию. В нее включены возможности по редактированию и комментированию PDF-документов, преобразованию PDF-файлов и сканов. Здесь также есть профессиональные системы для оптического распознавания текста.

ABBYY FineReader 14

Вторая по уровню версия – Business. Она подходит для использования в организациях, в офисах. Здесь появляются возможности автоматической конвертации файлов. Для ускорения программа поддерживает работу с двумя ядрами процессора. Ограничение на обработку текста – 5000 страниц в месяц. Такая лицензия стоит 11 990 рублей.

Самая продвинутая версия – Enterprise за 38 990 рублей. Она предназначена для использования в больших корпорациях, для работы с огромными объемами документов. Поддерживаются четыре ядра процессора, утилита может обрабатывать до 10 000 страниц в месяц. Ускорение за счет поддержки многоядерной обработки файлов – минимум в 1,8 раза. Можно сравнивать документы в любых форматах, причем в полуавтоматическом режиме. Если у вас крупная организация, постоянно работающая с PDF и отсканированными данными, такая версия будет самой желанной.

Есть и еще один трюк, позволяющий сэкономить несколько тысяч рублей. Вместо того чтобы сразу покупать версию Business или Enterprise, лучше сначала попробовать себя на лицензии Standard. Апгрейд с нее стоит меньше, чем разница в цене между версиями. Например, за расширение с редакции Standard на редакцию Business надо заплатить 4000 рублей, так что в итоге лицензия Business выйдет в 10 990 рублей, что позволит сэкономить тысячу. А самая существенная экономия получается при апгрейде со Standard на Enterprise. Вы платите 6990 плюс 25 600 рублей, то есть 32 590 рублей, а получаете версию Enterprise, которая сама по себе стоит 38 990 рублей. Получается 6400 рублей экономии, что сравнимо с ценой самой версии ABBYY FineReader 14 Standard.

Так что если вы, например, частный пользователь, который желает развить свой оборот до масштабов компании, на этом трюке в будущем можно хорошо сэкономить. Если у вас или ваших сотрудников уже есть базовые версии утилиты, намного выгоднее будет расширить их, а не покупать с нуля новые лицензии.

Итоги

Программа – лучшая в своей категории, по соотношению цены и качества у нее нет альтернативы. В ней объединены все самые востребованные задачи по работе с PDF-файлами и бумажными документами. За счет этого, например, сокращается время на обучение персонала и на поддержку ПО.

ABBYY FineReader 14

Утилита умеет работать с двумя сотнями языков, включая азиатские. Она поддерживает словари. В ней очень простой пользовательский интерфейс, в котором можно быстро освоиться. Наиболее востребованные функции сразу видны в стартовом окне, каждый из этапов нагляден, все русифицировано, большинство задач могут выполняться с помощью горячих клавиш, что оценят профессионалы, которые будут использовать программу каждый день. Прямо в интерфейсе утилиты можно сравнивать исходный документ или отформатированный текст, даже если они изначально были в разных форматах. Проверять текст на ошибки, неточности, несоответствия – максимально удобно.

Технология OCR у ABBYY дает максимальную точность распознавания текста. В изображениях, в отсканированных бумагах. Система не идеальная, иногда она допускает ошибки, особенно с таблицами. К сожалению, не распознается рукописный текст, но здесь ничего пока что не исправить. Рукописный текст может быть настолько индивидуален, у него есть столько вариаций в зависимости от человека, что задачу его распознавания можно решить разве что с использованием искусственного интеллекта. Что, в свою очередь, вызовет массу дополнительных проблем. Если Microsoft пока что еле-еле научила своего "умного робота" распознавать, улыбается или грустит человек на картинке (и сколько ему ориентировочно может быть лет), то что говорить о тысячах вариантов написания буквы "д" или "м". От программы нельзя требовать невозможного.

В остальном утилита чувствует даже форматирование, логическую структуру документа, шрифты, абзацы, колонтитулы. А процедура распознавания занимает минимальный срок благодаря использованию нескольких ядер компьютера. Российские разработчики из ABBYY, как и эксперты из "Лаборатории Касперского", не просто вышли на мировой уровень, а занимают лидирующую позицию в своей индустрии.


Ссылки по теме:

Автор статьи: Артем Левичев


Рубрики статей
Все статьи
Аналитика
Программы
Игры
Интернет
Авторские права
Интервью
События в мире ПО
Рассылки
Новости мира ПО
Статьи: Мир ПО
Статьи: Программы
Статьи: Игры
Архив выпусков
  «   Ноябрь 2018   »  
Пн Вт Ср Чт Пт Сб Вс
   1234
567891011
12131415161718
19202122232425
2627282930  
Поиск в архиве

Логин / пароль:
запомнить




Наши партнеры:

 САПР и графика



Написать редактору  | RSSЭкспорт новостей и обзоров


Rambler's
Top100 Rambler's Top100

Разработка компании «Битрикс»
Разработано
«Битрикс»


Copyright © 2001-2018 ЗАО «Софткей»