Викитека:Проект:Импорт текстов/Lib.ru

Начало проекта — октябрь 2020 г.

Цель проектаПравить

Импорт текстов произведений, страниц авторов и сопутствующих иллюстраций из http://az.lib.ru (раздела «классики» Библиотеки Мошкова)

Примерный план проектаПравить

1) выкачивание; 2) парсер html, чистка, конвертация в wiki-разметку, викификатор; 3) выкачивание иллюстраций;
4) создание шаблонов страниц, категоризация, заливка текстов и картинок в ВТ;
5) создание страниц авторов, интеграция со ссылками на тексты.

Дополнительно:

  • Сделать бота для импорта новых страниц по мере их появления на исходном сайте.
  • Сделать страницу в формате JSON с маппингом (установкой соответствий) имён/путей в url авторов исходного сайта и страниц этих авторов в Викитеке. Это бы помогло связать добавленные страницы произведений с авторами Викитеки. И таким образом обновлять поля АВТОР в шапках произведений и ставить категорию автора.

Новости проектаПравить