Безкоштовні аналоги ABBYY FineReader

Програма ABBYY FineReader використовується для розпізнавання і вилучення тексту з графічних файлів, розміщених на ПК або отриманих безпосередньо зі сканера.

Необхідність в таких програмах виникає, коли потрібно витягти текст з файлів, створених в звичних графічних форматах або форматі DjVu і PDF, але не містять спеціального текстового шару.

Також ABBYY FineReader (і його аналоги) будуть корисною при скануванні книг, газет і т.д. Програма дозволяє не тільки отримати знімок зі сканера, але і витягти текст, і зберегти файл в текстовому форматі.

FineReader має відмінний російськомовний інтерфейс і багато корисних додаткових можливостей:

  • перевірка орфографії
  • визначення структури документа
  • робота з таблицями, масштабування

Але на жаль вартість даного софта часто стає перепоною для використання програми і доводиться звертати увагу на його безкоштовні аналоги.

CuneiForm

CuneiForm – абсолютно безкоштовний додаток, що підтримує всі основні функції ABBYY FineReader. Програма сумісна зі сканером і вміє обробляти файли, вже розміщені на комп’ютері. Перелік мов досить значний: крім російської, української, англійської, французької та німецької даний список містить в собі іспанська, італійська і навіть шведський.

Як і в ABBYY FineReader робота починається з розмітки документа і створення блоків, що визначають структуру документа, тобто виявлення областей документа, що містять текст, зображення і порожній простір. Після завершення розпізнавання, програма підкреслить слова, що містять помилки, або ті, які не вдалося визначити, щоб їх можна було підкоригувати в ручному режимі.

Незважаючи на те, що CuneiForm є одним з найбільш близьких аналогів ABBYY FineReader, дане додаток все-таки потрібно визнати поступається платній програмі. В основному недоліки пов’язані з розпізнаванням тексту, особливо погано йде зчитування на згинах документів і при роботі з зображеннями не дуже високої якості.

SimpleOCR

Програма SimpleOCR є відмінним інструментом для розпізнавання тексту, оскільки працює навіть із зображеннями рукописних текстів. Але на жаль SimpleOCR має англомовний інтерфейс і до переліку підтримуваних мов для вилучення тексту не входить російська. Програма відрізняється невеликим розміром, широкими можливостями налаштування і сумісна зі сканером, тому якщо ви працюєте переважно з документами англійською та німецькою мовами для цієї програми заслуговує того, щоб його взяли на замітку.

Онлайн-сервіс free-ocr.com

Для розпізнавання тексту і подальшого його збереження в окремий файл існують не тільки програми, але і онлайн-сервіси. Непоганим варіантом для швидкого вилучення тексту є ресурс www.free-ocr.com. Сервіс підтримує безліч мов, в тому числі російський і український, але має цілий ряд обмежень:

  • Розмір документа не повинен перевищувати 2 Мб.
  • За одну годину можна додати для розпізнавання більше 10 файлів.
  • Неможливо імпортувати документ прямо зі сканера.

Також до недоліків відноситься те, що сервіс не розбиває документ на блоки, тобто якщо у вас знімок газетної статті, надрукованій в дві колонки, ви отримаєте перемішаний текст, що абсолютно неприпустимо.

Що стосується переваг, то по-перше, – це висока якість розпізнавання, мало чим поступається ABBYY FineReader, а по-друге, програма, крім традиційних графічних форматів TIFF, JPG, GIF, підтримує і такі формати як BMP і PDF.

Ссылка на основную публикацию