Справка:Оцифровка: различия между версиями

[досмотренная версия][досмотренная версия]
Содержимое удалено Содержимое добавлено
Строка 90:
Бывает, что надо опубликовать только распознанный текст без скана. <small>(Например, это лучший вариант текста, и при этом не хочется переделывать уже загруженные сканы, в которых текстовый слой плохой или отсутствует).</small> Если в файле уже есть распознанный текстовый слой, можно по-быстрому экспортировать его программой ''[http://www.stduviewer.ru STDU Viewer]'', но обычно он заметно хуже<ref>Обычно распознавание предустановленного текстового слоя делается в библиотеках, с целью лишь добавления грубого текстового поиска по файлу. Делается это в массовом автоматическом режиме, бесплатными утилитами неизвестного качества.</ref>, чем делает FineReader, и имеет проблему с утерей абзацев и таблиц.
 
=== Использование FineReader ===
Открыть файл скана в FineReader. <small>(Возможно он потребует [[#Распознавание|распознать текст]], даже если в файле уже есть плохо распознанный текстовый слой.)</small> Далее, в меню ''«Файл» → «Сохранить документ как»'' выбрать вариант:
 
==== OpenOffice.org Writer ====
<small>(предпочтительный вариант)</small> [[w:OpenOffice Writer|OpenOffice]] — это бесплатный аналог MS Office. [http://www.openoffice.org/ru/ Установив его] и [http://extensions.services.openoffice.org/project/wikipublisher плагин-конвертор], надо включить плагин (в меню ''«Сервис» → «Управление расширениями»''). Далее, открываем наш файл в формате .odt, выбираем ''«Файл» → «Экспорт…» → «Тип файла» → «MediaWiki (.txt)»'', сохраняем.
 
==== FictionBook (FB2) ====
Выбрать «Параметры сохранения», проверить опции:
* ''«Форматированный текст»'' — сохраняет тэги курсивного и др. выделения слов, и таблицы.
Строка 116:
В некоторых подверсиях FineReader есть особенность, что он может сохранять fb2 с разбивкой на страницы скана (в файле создаются отдельные тэге <code><nowiki><section></nowiki></code>). Такой файл с разделителями страниц удобно заливать в пространство имён «Страница:», а также высчитывать номера страниц, указывая их в графе «источник» текстовых произведений.
 
==== Текстовый документ ====
В формате txt сохраняются лишь текстовые символы, без оформления, разметки таблиц, картинок. Настройка «Параметров сохранения»:
* ''«Форматированный текст»'' — включить.