Викитека:Работа для бота
Эта предназначена для отслеживания заказов для ботов — специальных программ, способных автоматически создавать и править статьи по заданному алгоритму. Боты могут очень многое (всё, что формально алгоритмизируемо), но основным вкладом в развитие Викитеки всё-таки остаются созданные и исправленные вручную статьи. После выполнения или отклонения запрос переносится в архив.
Если ботовладелец берётся за исполнение заявки, то он ставит в заявке надпись «Запрос рассматривается» и ставит свою подпись и дату. После выполнения меняет надпись на «Запрос выполнен». На отклонённые по разным причинам запросы ставится надпись «Запрос отклонён».
Текущие запросы
правитьСкрипт для башкирской викитеки
правитьИмеется массив произведений на башкирском языке. Хотел бы залить ботом. Дайте образец программы, для заливки викитеки, которая находится в инкубаторе. zsaliho@mail.ru --Саган (обсуждение) 11:00, 26 февраля 2014 (UTC)
Даты рождения/смерти в страницах авторов
правитьСтоило бы преобразовать свободный текст в {{ДатаРождения}} и {{ДатаСмерти}}, где это однозначно: указаны даты по старому и новому стилю для авторов из Российской империи, даты после введения нового стиля, иностранные авторы, т. д. --EugeneZelenko (обсуждение) 13:57, 3 мая 2012 (UTC)
Подбор интервики для страниц-неоднозначностей
правитьСтоило бы попытаться подбирать интервики для страниц-неоднозначностей на основе интервики в Википедии. Хотя бы для одиночных слов. Если не править страницы напрямую, то составить таблицу с кандидатами. Думаю, что можно поработать с английским и польским разделами. --EugeneZelenko (обсуждение) 14:11, 18 апреля 2012 (UTC)
Интервики в текстах в дореформенной орфографии
правитьПоскольку интервики в других проектах указывают на текст в современной орфографии, стандартные роботы обходят тексты в дореформенной орфографии стороной. Соответственно надо иметь робота обновляющего интервики в тексте в дореформенной орфографии по странице в современной. В информации о текстах также иногда дублируются ссылки на страницы в других разделах, которые тоже могут нуждаться в обновлении. --EugeneZelenko 15:14, 26 января 2012 (UTC)
Категории веков, десятилетий, годов
правитьДля нашей эры:
- Из категорий
веков идесятилетий удалить шаблон {{... век}}, если он есть. В каждую категорию века добавить шаблон {{Навигация}}, напр., в Категория:XIX век{{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:XIX век |Викиновости = |Викисклад = Category:19th century }}.
- В каждую категорию десятилетия добавить шаблон {{Навигация}}, напр., в Категория:1810-е годы
- {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:1810-е |Викиновости = |Викисклад = Category:1810s }}.
- В каждой категории десятилетия добавить ключ сортировки, напр., в Категория:1810-е годы родительская категория должна быть [[Категория:XIX век|*01]], в Категория:1890-е годы — [[Категория:XIX век|*09]].
- Добавить или изменить (если он есть) ключ сортировки в категориях года, напр., в Категория:1810 год род. категория должна быть [[Категория:1810-е годы|*00]], в Категория:1811 год — [[Категория:1810-е годы|*01]].
- В каждую категорию года добавить в начало два шаблона — {{Навигация}} и {{... век}}, напр., в Категория:1810 год
- {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:1810 год |Викиновости = |Викисклад = Category:1810 }}{{XIX век}} (без пробела между шаблонами).
Заранее спасибо, Yuri Che 10:44, 22 июля 2011 (UTC)
- Категории веков обработал моим SKbot'ом. Дополнительно расставил iwiki. -- Sergey kudryavtsev 09:06, 27 июля 2011 (UTC)
- Спасибо... Yuri Che 12:37, 27 июля 2011 (UTC)
Выявление проблем с типографикой в названиях
правитьПолезно иметь робота, который бы периодически проходился по списку названий страниц и выявлял проблемы с типографикой ("" вместо «», ... вместо …, - вместо — и т. д.). Может быть заодно бы их и переносил и исправлял ссылки. --EugeneZelenko 04:17, 14 декабря 2010 (UTC)
Робот для исправления ссылок тексты в старой орфографии
правитьДумаю было бы полезно иметь робота, который периодически проходил по страницам в старой орфографии и исправлял ссылки в них на версии в старой орфографии (если таковая имеется). --EugeneZelenko 15:15, 2 февраля 2010 (UTC)
Упорядочивание ссылок на другие значения
правитьСейчас ссылки на другие значения можно указывать в {{Отексте}} и с помощью {{Другие значения}}. Стоило бы договорится о стандарте и соответственно исправить существующие ссылки. --EugeneZelenko 14:10, 27 апреля 2010 (UTC)
- Сделать несложно, но вначале нужно прийти к единому мнению о том, какой способ используем. — Lozman 14:45, 27 апреля 2010 (UTC)
- Использование одного универсального шаблона, по-моему, предпочтительнее, чем использование двух. Соотв., думаю, на страницах текстов надо использовать только {{О тексте}}. Yuri Che 13:50, 21 июля 2011 (UTC)
- Сделано — Заменил все, что поддавалось автоматической замене (около 500 страниц), вроде бы все нормально. Остальные страницы либо оставить как есть, либо править вручную. — Lozman 21:16, 21 июля 2011 (UTC)
- Использование одного универсального шаблона, по-моему, предпочтительнее, чем использование двух. Соотв., думаю, на страницах текстов надо использовать только {{О тексте}}. Yuri Che 13:50, 21 июля 2011 (UTC)
Автоматизация поддержки других значений
правитьНадо периодически проходиться по всем названия и создавать/добавлять в существующие другие значения ссылки на новые тексты. Критерий: одинаковые названия до скобок с автором/переводчиком. Соответственно в сами тексты добавлять ссылку на другие значения. --EugeneZelenko 14:10, 27 апреля 2010 (UTC)
- Запрос рассматривается. Сам об этом давно подумываю. --Infovarius 14:33, 27 апреля 2010 (UTC)
Интервики-бот
правитьПросьба ко владельцам ботов на Python'е запустить стандартного интервики-бота на страницы авторов (у меня такое ощущение, что их интервики-боты их правят редко и что тут накопилось много изменений). В w:Википедия:Рекомендации Юному ботоводу написано что, его можно запустить на категорию:
- python interwiki.py -cat:'Все_авторы'
Ещё было бы неплохо запустить его на страницы авторов в иностранных доменах. -- Sergey kudryavtsev 12:08, 28 апреля 2010 (UTC)
- Прошелся по страницам авторов, результаты можно увидеть здесь (вклад за 15 декабря). — Lozman 23:09, 15 декабря 2010 (UTC)
- Спасибо. А не могли бы вы посмотреть (или поэкспериментировать), почему стандартдартный interwiki.py иногда удаляет правильные интервики (подробно я это описал в Викитека:Форум#Ошибки в стандартном скрипте для интервики-ботов)? -- Sergey kudryavtsev 21:31, 17 декабря 2010 (UTC)
- Я не специалист, но, кажется, понял, в чем тут дело: бот написан под Википедию, в которой наличие двух и более интервики-ссылок на один языковой раздел не допускается (ссылка должна быть либо одна, либо ни одной). Соответственно, удаляет все ссылки, кроме одной. Не уверен, что это можно легко исправить: вряд ли кто-то станет переписывать бота специально под Викитеку. Либо нужно самим адаптировать скрипт под наши нужды, либо хотя бы защитить такие страницы от ботов (вроде бы для этого предназначен шаблон {{nobots}}). — Lozman 22:06, 17 декабря 2010 (UTC)
- А мне кажется, что могут и должны переписать, как это было сделано для Викисловаря (там совсем особые правила обработки интервик). Может, обратится за помощью на oldwikisource, наверняка там есть хорошие специалисты по Python'у? -- Sergey kudryavtsev 22:46, 17 декабря 2010 (UTC)
- По крайней мере вопрос задать стоит. Вы там знаете кого-нибудь? — Lozman 23:43, 17 декабря 2010 (UTC)
- А мне кажется, что могут и должны переписать, как это было сделано для Викисловаря (там совсем особые правила обработки интервик). Может, обратится за помощью на oldwikisource, наверняка там есть хорошие специалисты по Python'у? -- Sergey kudryavtsev 22:46, 17 декабря 2010 (UTC)
- Я не специалист, но, кажется, понял, в чем тут дело: бот написан под Википедию, в которой наличие двух и более интервики-ссылок на один языковой раздел не допускается (ссылка должна быть либо одна, либо ни одной). Соответственно, удаляет все ссылки, кроме одной. Не уверен, что это можно легко исправить: вряд ли кто-то станет переписывать бота специально под Викитеку. Либо нужно самим адаптировать скрипт под наши нужды, либо хотя бы защитить такие страницы от ботов (вроде бы для этого предназначен шаблон {{nobots}}). — Lozman 22:06, 17 декабря 2010 (UTC)
- Спасибо. А не могли бы вы посмотреть (или поэкспериментировать), почему стандартдартный interwiki.py иногда удаляет правильные интервики (подробно я это описал в Викитека:Форум#Ошибки в стандартном скрипте для интервики-ботов)? -- Sergey kudryavtsev 21:31, 17 декабря 2010 (UTC)
Отступы абзацев в прозе
правитьВо многих текстах с прозой отсутствует <div class="indent">…</div> (например, Иван Сергеевич Тургенев). Думаю, что полностью автоматизировать процесс не удастся, но даже если и полуавтоматический вариант будет проблематичен, то стоит хотя бы составить список таких страниц для последующей ручной обработки. --EugeneZelenko 03:24, 29 апреля 2010 (UTC)
- Я думаю, что расстановку div'а не автоматизировать. Единственное что, бот может составить список страниц в категориях прозы, в которых <div class="indent">…</div> не стоит. Категории можно брать по конкретному автору, ибо список по всем авторам будет огромный. -- Sergey kudryavtsev 06:12, 29 апреля 2010 (UTC)
- Дворянское гнездо (Тургенев) Сделано -- Sergey kudryavtsev 21:20, 13 мая 2010 (UTC)
- Первая любовь (Тургенев) Сделано -- Sergey kudryavtsev 12:16, 14 мая 2010 (UTC)
- Новь (Тургенев) Сделано -- Sergey kudryavtsev 14:08, 14 мая 2010 (UTC)
- Накануне (Тургенев) Сделано -- Sergey kudryavtsev 06:55, 17 мая 2010 (UTC)
- Рудин (Тургенев) Сделано -- Sergey kudryavtsev 08:03, 17 мая 2010 (UTC)
- Дым (Тургенев) Сделано -- Sergey kudryavtsev 09:16, 17 мая 2010 (UTC)
Список страниц для викификации
правитьДумаю, что можно использовать следующие критерии:
- Слова/фразы на других алфавитах (прежде всего латинском) вне {{lang}}
- Сокращённые названия языков (фр., англ., и т.д.), особенно в отсутствии сноски (<ref></ref>).
- Фамилии известных авторов (Пушкин, Достоевский и т.д.) без ссылок.
EugeneZelenko 14:13, 5 мая 2010 (UTC)
Ссылки на ЭСБЕ
правитьСтоило бы автоматизировать добавление ссылок на статьи ЭСБЕ со страниц авторов/переводчиков. Хотя бы в виде списка с подобными названиями (страницы автора и статьи ЭСБЕ). --EugeneZelenko 14:28, 26 июня 2010 (UTC)
- Я возьмусь за эту работу. Это интересная проблема. И мне сначала нужно хорошо подумать над стратегией её решения... -- Sergey kudryavtsev 13:33, 15 декабря 2010 (UTC)
Готовы первые результаты — Участник:SKbot/Авторы в ЭСБЕ. Здесь перечислены все страницы, использующие {{Обавторе}}. Они разделены на две части со ссылками на ЭСБЕ и без оных. Для каждой статьи первой группы указана ссылка ЭСБЕ из параметра ЭСБЕ (как видите, есть красненькие). Для статей второй группы пока выведено ЭСБЕ/ + имя статьи (как видите, есть синенькие). Сначала я поправлю эти ошибки, а затем проанализирую обратные ссылки на статьи второй группы с подстраниц ЭСБЕ и буду выводить их во вторую колонку. Так, надеюсь, отловится ещё пара десятков авторов. Далее я попытаюсь имена из трёх компонентов (предполагая Имя Отчество Фамилия) преобразовать в ссылку «ЭСБЕ/Фамилия Имя Отчество» или «ЭСБЕ/Фамилия, Имя Отчество». Надеюсь здесь здесь отловится побольше. -- Sergey kudryavtsev 12:34, 16 декабря 2010 (UTC)
- Спасибо большое!
- Стоило бы ещё для надёжности проверять год рождения/смерти.
- Также надо отфильтровать страницы авторов, которые никак не могли попасть в ЭСБЕ по году рождения. Наверное это последний год издания ЭСБЕ минус 5—15 лет.
- EugeneZelenko 04:18, 17 декабря 2010 (UTC)
- Вытащить год рождения из параметра ДАТАРОЖДЕНИЯ технически сложно — слишком много вариантов оформления. Лучше было бы завести специальное значение «нет» для параметра ЭСБЕ (человек его выставлял бы, сигнализируя боту: «нет, и быть не может»). Но пока овчинка выделки не стоит — ведь это лишь вопрос эффективности. Если по мере усложнения алгоритма информация станет собираться слишком долго, я заведу список обрабатываемых авторов (выкидывая из него современных). -- Sergey kudryavtsev 04:36, 17 декабря 2010 (UTC)
- Может попробовать регулярное выражение на четыре цифры, начиная с 19? Всё-таки в списке слишком много современных авторов, а такой шум не облегчает работу со списком. --EugeneZelenko 15:15, 17 декабря 2010 (UTC)
- К сожалению, мой бот ещё не научился работать с регулярными выражениями. Но, пожалуй, четыре цифры подряд можно выташить и обычными средствами. Попробую. -- Sergey kudryavtsev 21:23, 17 декабря 2010 (UTC)
- Может попробовать регулярное выражение на четыре цифры, начиная с 19? Всё-таки в списке слишком много современных авторов, а такой шум не облегчает работу со списком. --EugeneZelenko 15:15, 17 декабря 2010 (UTC)
- Вытащить год рождения из параметра ДАТАРОЖДЕНИЯ технически сложно — слишком много вариантов оформления. Лучше было бы завести специальное значение «нет» для параметра ЭСБЕ (человек его выставлял бы, сигнализируя боту: «нет, и быть не может»). Но пока овчинка выделки не стоит — ведь это лишь вопрос эффективности. Если по мере усложнения алгоритма информация станет собираться слишком долго, я заведу список обрабатываемых авторов (выкидывая из него современных). -- Sergey kudryavtsev 04:36, 17 декабря 2010 (UTC)
Думаю, что также не помешает проверить наличие ссылок со страниц авторов/ЭСБЕ на Википедию/Викицитатник и обратно. --EugeneZelenko 14:38, 6 января 2011 (UTC)
либо
правитьВ конвертере старой орфографии в новую была (и пока есть) ошибка и -либо заменялась на пробел+либо (когда либо, что либо и т. д.). Стоило бы роботом создать список страниц с подобными ошибками. Или даже исправить в автоматическом/полуавтоматическом режиме. --EugeneZelenko 15:12, 3 июля 2010 (UTC)
Архив
правитьВ связи с переименованием Роберт Бернс → Роберт Бёрнс
правитьСтраничка автора переименована GreenStork'ом. Я проверил по энциклопедии (по бумажной, не Википедии) — действительно Бёрнс. Следовательно надо поменять фамилию в названиях статей и в параметре {{Отексте}}. Кто возьмётся? -- Sergey kudryavtsev 21:18, 13 мая 2010 (UTC)
- Сделано вручную — это оказалось проще. -- Sergey kudryavtsev 10:28, 14 мая 2010 (UTC)