Викитека:Проект:Импорт текстов/Lib.ru
Начало проекта — октябрь 2020 г.
Цель проекта
правитьИмпорт текстов произведений, страниц авторов и сопутствующих иллюстраций из http://az.lib.ru (раздела «классики» Библиотеки Мошкова)
Примерный план проекта
править- 1) выкачивание; 2) парсер html, чистка, конвертация в wiki-разметку, викификатор; 3) выкачивание иллюстраций;
- 4) создание шаблонов страниц, категоризация, заливка текстов и картинок в ВТ;
- 5) создание страниц авторов, интеграция со ссылками на тексты.
Дополнительно:
- Сделать бота для импорта новых страниц по мере их появления на исходном сайте.
- Сделать страницу в формате JSON с маппингом (установкой соответствий) имён/путей в url авторов исходного сайта и страниц этих авторов в Викитеке. Это бы помогло связать добавленные страницы произведений с авторами Викитеки. И таким образом обновлять поля АВТОР в шапках произведений и ставить категорию автора.
Новости проекта
править- 01.10.2021 Викитека:Форум#Импорт из http://az.lib.ru (библиотеки Мошкова) — анонс проекта.