Викитека:Проект:OCR: различия между версиями

Содержимое удалено Содержимое добавлено
Нет описания правки
Строка 70:
 
* [[oldwikisource:Wikisource:Shared Scripts|Shared Scripts]] — интересный набор скриптов, улучшающий, облегчающий работу со сканами и добавляющий новые возможности. Как минимум часть будет установлена в русскоязычной Викитеке.
 
=== Программы OCR ===
* [[w:Категория:Оптическое распознавание символов]] — статьи в Википедии
 
==== Распознавание ====
;Windows
* [[w:FineReader|FineReader]] — коммерческий и самый качественный инструмент. С 11-12 версии имеет словари распознавания дореволюционной орфографии и ударений в словах.
 
;Linux
* [https://help.ubuntu.com/community/OCR Cправка по программам OCR в Linux]
* [[w:Tesseract|Tesseract]] — развивается компанией Google
* [https://launchpad.net/cuneiform-linux Cuneiform для Linux], проект заброшен
* [http://rus-linux.net/nlib.php?name=/MyLDP/office/OCR/OCR_review.html], [http://freeanalogs.ru/Linux/OCR] — обзоры некоторых программ и онлайн-сервисов
 
; Online-сервисы
* [https://finereaderonline.com/ru-ru FineReader-online] — бесплатный только «пробник» на 10 страниц
* [https://img2txt.com img2txt.com] и [https://www.newocr.com newocr.com] — web-интерфейсы программы Tesseract
 
==== Извлечение текстового слоя в файл ====
Программы, способные извлекать текстовый OCR-слой, если он имеется в сканированном файле. Эту функцию имеют все программы распознавания, но лишь некоторые из программ просмотра.
 
; Windows
* [[w:STDU Viewer|STDU Viewer]]
 
[[Категория:Викитека:Проекты]]