Викитека:Работа для бота

↱
  • ВТ:РДБ

Эта предназначена для отслеживания заказов для ботов — специальных программ, способных автоматически создавать и править статьи по заданному алгоритму. Боты могут очень многое (всё, что формально алгоритмизируемо), но основным вкладом в развитие Викитеки всё-таки остаются созданные и исправленные вручную статьи. После выполнения или отклонения запрос переносится в архив.

Если ботовладелец берётся за исполнение заявки, то он ставит в заявке надпись «Запрос рассматривается» и ставит свою подпись и дату. После выполнения меняет надпись на «Запрос выполнен». На отклонённые по разным причинам запросы ставится надпись «Запрос отклонён».

Текущие запросы

править

Скрипт для башкирской викитеки

править

Имеется массив произведений на башкирском языке. Хотел бы залить ботом. Дайте образец программы, для заливки викитеки, которая находится в инкубаторе. zsaliho@mail.ru --Саган (обсуждение) 11:00, 26 февраля 2014 (UTC)[ответить]

Даты рождения/смерти в страницах авторов

править

Стоило бы преобразовать свободный текст в {{ДатаРождения}} и {{ДатаСмерти}}, где это однозначно: указаны даты по старому и новому стилю для авторов из Российской империи, даты после введения нового стиля, иностранные авторы, т. д. --EugeneZelenko (обсуждение) 13:57, 3 мая 2012 (UTC)[ответить]

Подбор интервики для страниц-неоднозначностей

править

Стоило бы попытаться подбирать интервики для страниц-неоднозначностей на основе интервики в Википедии. Хотя бы для одиночных слов. Если не править страницы напрямую, то составить таблицу с кандидатами. Думаю, что можно поработать с английским и польским разделами. --EugeneZelenko (обсуждение) 14:11, 18 апреля 2012 (UTC)[ответить]

Интервики в текстах в дореформенной орфографии

править

Поскольку интервики в других проектах указывают на текст в современной орфографии, стандартные роботы обходят тексты в дореформенной орфографии стороной. Соответственно надо иметь робота обновляющего интервики в тексте в дореформенной орфографии по странице в современной. В информации о текстах также иногда дублируются ссылки на страницы в других разделах, которые тоже могут нуждаться в обновлении. --EugeneZelenko 15:14, 26 января 2012 (UTC)[ответить]

Категории веков, десятилетий, годов

править

Для нашей эры:

  1. Из категорий веков и десятилетий удалить шаблон {{... век}}, если он есть.
  2. В каждую категорию века добавить шаблон {{Навигация}}, напр., в Категория:XIX век
    {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:XIX век |Викиновости = |Викисклад = Category:19th century }}.
  3. В каждую категорию десятилетия добавить шаблон {{Навигация}}, напр., в Категория:1810-е годы
    {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:1810-е |Викиновости = |Викисклад = Category:1810s }}.
  4. В каждой категории десятилетия добавить ключ сортировки, напр., в Категория:1810-е годы родительская категория должна быть [[Категория:XIX век|*01]], в Категория:1890-е годы — [[Категория:XIX век|*09]].
  5. Добавить или изменить (если он есть) ключ сортировки в категориях года, напр., в Категория:1810 год род. категория должна быть [[Категория:1810-е годы|*00]], в Категория:1811 год — [[Категория:1810-е годы|*01]].
  6. В каждую категорию года добавить в начало два шаблона — {{Навигация}} и {{... век}}, напр., в Категория:1810 год
    {{Навигация |Тема = {{PAGENAME}} |Викицитатник = |Википедия = Категория:1810 год |Викиновости = |Викисклад = Category:1810 }}{{XIX век}} (без пробела между шаблонами).

Заранее спасибо, Yuri Che 10:44, 22 июля 2011 (UTC)[ответить]

Категории веков обработал моим SKbot'ом. Дополнительно расставил iwiki. -- Sergey kudryavtsev 09:06, 27 июля 2011 (UTC)[ответить]
Спасибо... Yuri Che 12:37, 27 июля 2011 (UTC)[ответить]

Выявление проблем с типографикой в названиях

править

Полезно иметь робота, который бы периодически проходился по списку названий страниц и выявлял проблемы с типографикой ("" вместо «», ... вместо …, - вместо — и т. д.). Может быть заодно бы их и переносил и исправлял ссылки. --EugeneZelenko 04:17, 14 декабря 2010 (UTC)[ответить]

Робот для исправления ссылок тексты в старой орфографии

править
Перенесено со страницы Викитека:Форум

Думаю было бы полезно иметь робота, который периодически проходил по страницам в старой орфографии и исправлял ссылки в них на версии в старой орфографии (если таковая имеется). --EugeneZelenko 15:15, 2 февраля 2010 (UTC)[ответить]

Упорядочивание ссылок на другие значения

править

Сейчас ссылки на другие значения можно указывать в {{Отексте}} и с помощью {{Другие значения}}. Стоило бы договорится о стандарте и соответственно исправить существующие ссылки. --EugeneZelenko 14:10, 27 апреля 2010 (UTC)[ответить]

Сделать несложно, но вначале нужно прийти к единому мнению о том, какой способ используем. — Lozman 14:45, 27 апреля 2010 (UTC)[ответить]
Использование одного универсального шаблона, по-моему, предпочтительнее, чем использование двух. Соотв., думаю, на страницах текстов надо использовать только {{О тексте}}. Yuri Che 13:50, 21 июля 2011 (UTC)[ответить]
  Сделано — Заменил все, что поддавалось автоматической замене (около 500 страниц), вроде бы все нормально. Остальные страницы либо оставить как есть, либо править вручную. — Lozman 21:16, 21 июля 2011 (UTC)[ответить]

Автоматизация поддержки других значений

править

Надо периодически проходиться по всем названия и создавать/добавлять в существующие другие значения ссылки на новые тексты. Критерий: одинаковые названия до скобок с автором/переводчиком. Соответственно в сами тексты добавлять ссылку на другие значения. --EugeneZelenko 14:10, 27 апреля 2010 (UTC)[ответить]

Интервики-бот

править

Просьба ко владельцам ботов на Python'е запустить стандартного интервики-бота на страницы авторов (у меня такое ощущение, что их интервики-боты их правят редко и что тут накопилось много изменений). В w:Википедия:Рекомендации Юному ботоводу написано что, его можно запустить на категорию:

python interwiki.py -cat:'Все_авторы'

Ещё было бы неплохо запустить его на страницы авторов в иностранных доменах. -- Sergey kudryavtsev 12:08, 28 апреля 2010 (UTC)[ответить]

Прошелся по страницам авторов, результаты можно увидеть здесь (вклад за 15 декабря). — Lozman 23:09, 15 декабря 2010 (UTC)[ответить]
Спасибо. А не могли бы вы посмотреть (или поэкспериментировать), почему стандартдартный interwiki.py иногда удаляет правильные интервики (подробно я это описал в Викитека:Форум#Ошибки в стандартном скрипте для интервики-ботов)? -- Sergey kudryavtsev 21:31, 17 декабря 2010 (UTC)[ответить]
Я не специалист, но, кажется, понял, в чем тут дело: бот написан под Википедию, в которой наличие двух и более интервики-ссылок на один языковой раздел не допускается (ссылка должна быть либо одна, либо ни одной). Соответственно, удаляет все ссылки, кроме одной. Не уверен, что это можно легко исправить: вряд ли кто-то станет переписывать бота специально под Викитеку. Либо нужно самим адаптировать скрипт под наши нужды, либо хотя бы защитить такие страницы от ботов (вроде бы для этого предназначен шаблон {{nobots}}). — Lozman 22:06, 17 декабря 2010 (UTC)[ответить]
А мне кажется, что могут и должны переписать, как это было сделано для Викисловаря (там совсем особые правила обработки интервик). Может, обратится за помощью на oldwikisource, наверняка там есть хорошие специалисты по Python'у? -- Sergey kudryavtsev 22:46, 17 декабря 2010 (UTC)[ответить]
По крайней мере вопрос задать стоит. Вы там знаете кого-нибудь? — Lozman 23:43, 17 декабря 2010 (UTC)[ответить]

Отступы абзацев в прозе

править

Во многих текстах с прозой отсутствует <div class="indent">…</div> (например, Иван Сергеевич Тургенев). Думаю, что полностью автоматизировать процесс не удастся, но даже если и полуавтоматический вариант будет проблематичен, то стоит хотя бы составить список таких страниц для последующей ручной обработки. --EugeneZelenko 03:24, 29 апреля 2010 (UTC)[ответить]

Я думаю, что расстановку div'а не автоматизировать. Единственное что, бот может составить список страниц в категориях прозы, в которых <div class="indent">…</div> не стоит. Категории можно брать по конкретному автору, ибо список по всем авторам будет огромный. -- Sergey kudryavtsev 06:12, 29 апреля 2010 (UTC)[ответить]

Список страниц для викификации

править

Думаю, что можно использовать следующие критерии:

  • Слова/фразы на других алфавитах (прежде всего латинском) вне {{lang}}
  • Сокращённые названия языков (фр., англ., и т.д.), особенно в отсутствии сноски (<ref></ref>).
  • Фамилии известных авторов (Пушкин, Достоевский и т.д.) без ссылок.

EugeneZelenko 14:13, 5 мая 2010 (UTC)[ответить]

Ссылки на ЭСБЕ

править

Стоило бы автоматизировать добавление ссылок на статьи ЭСБЕ со страниц авторов/переводчиков. Хотя бы в виде списка с подобными названиями (страницы автора и статьи ЭСБЕ). --EugeneZelenko 14:28, 26 июня 2010 (UTC)[ответить]

Я возьмусь за эту работу. Это интересная проблема. И мне сначала нужно хорошо подумать над стратегией её решения... -- Sergey kudryavtsev 13:33, 15 декабря 2010 (UTC)[ответить]

Готовы первые результаты — Участник:SKbot/Авторы в ЭСБЕ. Здесь перечислены все страницы, использующие {{Обавторе}}. Они разделены на две части со ссылками на ЭСБЕ и без оных. Для каждой статьи первой группы указана ссылка ЭСБЕ из параметра ЭСБЕ (как видите, есть красненькие). Для статей второй группы пока выведено ЭСБЕ/ + имя статьи (как видите, есть синенькие). Сначала я поправлю эти ошибки, а затем проанализирую обратные ссылки на статьи второй группы с подстраниц ЭСБЕ и буду выводить их во вторую колонку. Так, надеюсь, отловится ещё пара десятков авторов. Далее я попытаюсь имена из трёх компонентов (предполагая Имя Отчество Фамилия) преобразовать в ссылку «ЭСБЕ/Фамилия Имя Отчество» или «ЭСБЕ/Фамилия, Имя Отчество». Надеюсь здесь здесь отловится побольше. -- Sergey kudryavtsev 12:34, 16 декабря 2010 (UTC)[ответить]

Спасибо большое!
Стоило бы ещё для надёжности проверять год рождения/смерти.
Также надо отфильтровать страницы авторов, которые никак не могли попасть в ЭСБЕ по году рождения. Наверное это последний год издания ЭСБЕ минус 5—15 лет.
EugeneZelenko 04:18, 17 декабря 2010 (UTC)[ответить]
Вытащить год рождения из параметра ДАТАРОЖДЕНИЯ технически сложно — слишком много вариантов оформления. Лучше было бы завести специальное значение «нет» для параметра ЭСБЕ (человек его выставлял бы, сигнализируя боту: «нет, и быть не может»). Но пока овчинка выделки не стоит — ведь это лишь вопрос эффективности. Если по мере усложнения алгоритма информация станет собираться слишком долго, я заведу список обрабатываемых авторов (выкидывая из него современных). -- Sergey kudryavtsev 04:36, 17 декабря 2010 (UTC)[ответить]
Может попробовать регулярное выражение на четыре цифры, начиная с 19? Всё-таки в списке слишком много современных авторов, а такой шум не облегчает работу со списком. --EugeneZelenko 15:15, 17 декабря 2010 (UTC)[ответить]
К сожалению, мой бот ещё не научился работать с регулярными выражениями. Но, пожалуй, четыре цифры подряд можно выташить и обычными средствами. Попробую. -- Sergey kudryavtsev 21:23, 17 декабря 2010 (UTC)[ответить]

Думаю, что также не помешает проверить наличие ссылок со страниц авторов/ЭСБЕ на Википедию/Викицитатник и обратно. --EugeneZelenko 14:38, 6 января 2011 (UTC)[ответить]

В конвертере старой орфографии в новую была (и пока есть) ошибка и -либо заменялась на пробел+либо (когда либо, что либо и т. д.). Стоило бы роботом создать список страниц с подобными ошибками. Или даже исправить в автоматическом/полуавтоматическом режиме. --EugeneZelenko 15:12, 3 июля 2010 (UTC)[ответить]

В связи с переименованием Роберт БернсРоберт Бёрнс

править

Страничка автора переименована GreenStork'ом. Я проверил по энциклопедии (по бумажной, не Википедии) — действительно Бёрнс. Следовательно надо поменять фамилию в названиях статей и в параметре {{Отексте}}. Кто возьмётся? -- Sergey kudryavtsev 21:18, 13 мая 2010 (UTC)[ответить]

  Сделано вручную — это оказалось проще. -- Sergey kudryavtsev 10:28, 14 мая 2010 (UTC)[ответить]