FineReader OCR Pro — дебют лучшей OCR в OS X (+конкурс!)

Приложение: FineReader OCR Pro | 3290 руб. | Для OS X

Флагманским продуктом компании ABBYY безусловно является система распознавания текстов FineReader. Компания, конечно, делает и словари Lingvo и много мобильных приложений, но для большинства знакомство с компанией началось именно с «Ридера». Пользователи OS X долгое время были вынуждены довольствоваться облегченной «экспресс-версией» программы. Но на днях, компания объявила о выходе полноценной версии программы, адаптированной для OS X.

0 Icon

Я сильно сомневаюсь, что есть люди, которые не знают, для чего нужен FineReader, но на всякий случай все-таки вкратце объясню. По-английски программы такого типа называют OCR (сокращение от «Optical Character Recognition») или по-русски «оптическое распознавание символов». Все дело в том, что многие задачи, которые кажутся элементарными для человека (ну для большинства людей), представляют большое затруднение для компьютера. Одним из главных примеров таких задач является распознание образов. Любой из нас способен без труда посмотреть на фотографию и сказать, что на ней изображено: кошка или собака. Для компьютера, в общем случае, эта задача фактически неразрешима. Дело тут, как вы понимаете, не в кошках и собаках (пример я выбрал произвольно), а вообще в неспособности компьютера «думать» образами. Разумеется, печатный и рукописный текст не стали исключением из этого правила: если у вас есть страница отсканированного или сфотографированного текста, то для компьютера она так и останется простым изображением, не имеющим больше никакого смысла.

Новая задача

Как быть, если мы хотим извлечь из картинки текст и работать с ним как с документом? Именно тут приходят на помощь системы распознавания текстов. Используя сложные алгоритмы, программы «читают» текст и переводят его в электронную форму. Именно к числу таких программ и относится FineReader (причем он уверенно занимает верхнюю строчку в списках самых популярных и самых «умных» программ этого рода).
Распознанная страница

Главная задача FineReader — распознавание печатного текста, рукописный текст он не понимает, но зато со своей задачей он справляется великолепно.
Выбор языков

Дистрибутив программы очень большой, в установленном виде программа занимает больше гигабайта, но это связано в первую очередь с количеством поддерживаемых языков: FineReader понимает 189 языков, включая азиатские (да-да, иероглифы), поэтому для ее загрузки из Mac App Store лучше запастись быстрым интернетом.

Интерфейс программы спроектирован так, чтобы максимально упростить работу пользователей. Сразу после запуска FineReader предложит вам выбрать из готовых шаблонов задач, определяющих, откуда вы будете получать изображения, и в какой формат потом переводить распознанный текст. Источником могут быть как файлы изображений на вашем компьютере (или даже PDF-файлы без текстового слоя), так и любые внешние устройства, начиная со сканеров и заканчивая iPhone. Я жалею о том, что во времена моего студенчества технический прогресс не дошел до камерофонов. Представляете, как удобно: пришел в библиотеку, сфотографировал нужные страницы на iPhone, и за несколько минут распознал дома на MacBook с помощью FineReader.

Коррекция изображений

Форматов, в которые FR умеет сохранять результаты своей работы, также немало: DOCX, ODT, RTF, XLSX, PDF и PDF/A, PPTX, HTML, EPUB, FB2 и, конечно же, простой текст.

В самом простом случае вам хватит автоматического режима работы: вы указываете то, что хотите подать на вход, через несколько минут на выходе получаете нужного формата документ. Но иногда документы имеют сложную структуру, и тогда требуется ручная доводка.

В этом случае лучше всего начать с создания нового документа FineReader, потом добавить в него страницы, выключив автоматическое распознание. Если качество изображений недостаточно — их можно улучшить, используя встроенные средства коррекции изображений. Они позволяют поправить яркость, контраст, разнообразные геометрические искажения, стереть ненужные элементы и многое другое.

Сложные страницы

Следующим шагом является разметка блоков: вы указываете FineReader где находится текст, графика, таблицы, и остальные части изображения. Делать это обычно приходится только в самых крайних случаях, FineReader за годы эволюции обрел недюжинный интеллект и чаще всего справляется с этой задачей на автомате.

Следующие шаги — распознание и экспорт текста — не представляют никаких трудностей.

Распознавание

FineReader в своем отточенном автоматизме настолько напомнил мне японскую лесопилку из анекдота, что я не смог отказать себе в удовольствии сунуть ему железобетонную шпалу. В ее роли выступил первый попавшийся учебник высшей математики на 300 с лишним страниц, полный таблиц и формул в формате PDF и, разумеется, без OCR слоя. Зарядив его в FineReader, я запустил секундомер и замерил время до полной и окончательной победы технологий над исходным сырьем. В итоге на своем ноутбуке, под завывание кулеров, я замерил 19 минут 37 секунд. Фактически, получается чуть меньше 4 секунд на страницу. Распознанный результат тоже получился вполне на уровне. Ошибок FR делает мало, даже в таких сложных текстах.
Экспорт

В общем, применений программе можно найти массу, начиная с создания электронных копий бумажных документов и заканчивая распознанием текста для дальнейшего его перевода в речь с помощью TTS движка. Можно с уверенностью сказать одно: здорово, что лучшая OCR система наконец-то появилась на OS X в полной версии.

Внимание, конкурс!
Разработчики любезно предоставили нам 3 промо-кода FineReader OCR Pro, которые мы разыграли среди читателей. Генератор случайных чисел определил следующих победителей: Adrian , desp-j и Juzzy , Поздравляем победителей!

Название: FineReader OCR Pro
Издатель/разработчик: ABBYY Production LLC/ABBYY USA Software House Inc
Цена: 3290 руб.
Встроенные покупки: Нет
Совместимость: OS X
Ссылка:
Для OS X

FineReader OCR Pro — дебют лучшей OCR в OS X (+конкурс!). Фото.

Обзоры приложений для iOS и MacОфисные приложения