Введение

За долгое время существования проекты Викимедиа накопили множество данных, но эти данные представлены таким образом, что они с большим трудом поддаются машинной обработке. Владельцы ботов знают это не понаслышке. Так вот, Викиданные — это как раз попытка структурировать накопленные данные таким образом, чтобы максимально облегчить работу с ними различным компьютерным программам.

Сто́ит рассматривать Викиданные как базу данных понятий. Там описываются понятия совершенно разного типа, предметы реального мира (люди, реки, горы, планеты, звёзды), абстракции (математические функции, химические элементы), творения человеческого ума (мифологические и литературные персонажи, литературные произведения). Каждое из таких понятий описывается отдельным элементом Викиданных. Создание и изменение элемента может производится вручную на сайте Викиданных, через различные инструменты (таких как Wikidata Game Магнуса Манске и набор WEF Vlsergey), так и программами-ботами, которые могут брать информацию из какого-либо источника и заносить её в соответствующий элемент Викиданных.

Прежде чем узнать как устроены Викиданные, давайте посмотрим примеры того, как их можно использовать. Взгляните на один из инструментов визуализации, созданного Magnus Manske, а именно Tempo spatial display, применённый к битве за Ленинград (просто понажимайте на кнопочку «>» в верхней части экрана). Вот как те же данные выглядят для редактора Викиданных — d:Q19766176, а так это выглядит для компьютерных программ[1]. Вот ещё одна работа того же автора — Reasonator в применении к Нельсону Манделе. Также вы можете попробовать поиграть в одну из Wikidata Games — по сути это редактор Викиданных, сделанный в игровой форме вопрос-ответ, программа спрашивает — вы отвечаете.

Основные понятия

Базовым понятием Викиданных являются элементы (items), свойства (properties) и типы данных (datatypes). Два последних нужны только лишь для того, чтобы было возможно работать с элементами, в этом смысле их можно считать служебными.

Свойства и типы данных

Прежде чем рассмотреть анатомию элемента, надо рассмотреть ряд вспомогательных «кирпичиков», из которых они построены. Первое из таких понятий это тип данных (datatype), которые может хранить Викиданные[2]. Они проектируются и реализуются разработчиками, создавшими этот вики-проект. В настоящее время доступны следующие типы данных[3]:

  • строка (string) — последовательность символов. См список свойств этого типа;
  • моноязычный текст (monolingual text) — последовательность символов, снабжённая ссылкой на язык. См список свойств этого типа;
  • время (time) — время, заданное с указанной точностью (пока поддерживается точность от миллиарда лет до дня, вероятно, в будущем будет доступна точности до часа, минуты или секунды), и календарная модель (пока поддерживается только григорианский и юлианский календарь). См. список свойств этого типа;
  • количество (quantity) — числовое значение с указанной точностью и единицами измерения. См список свойств этого типа;
  • географические координаты (globe coordinate) — широта и долгота, заданные с указанной точностью. Вероятно, в будущем будет доступна возможность указывать координаты не только на Земле, но на других небесных телах. См список свойств этого типа;
  • ссылка на интернет-сайт (URL) — последовательность символов, представляющая собою адрес страницы на интернет-сайте. См список свойств этого типа;
  • ссылка на файл Викисклада (Commons media) — ссылка на один из файлов, хранящихся на Викискладе. См список свойств этого типа;
  • ссылка на элемент Викиданных (item) — ссылка на один из элементов Викиданных. См список свойств этого типа;
  • ссылка на свойство Викиданных (property) — ссылка на одно из свойств Викиданных. См список свойств этого типа.

Носителями типа данных являются свойство (property) и, опосредованно, его значение (value). Свойство представляет собой страницу Викиданных в особом пространстве имён «Property». Идентифицируется свойство строкой вида P<число>, который мы будем называть идентификатором. Каждому свойству при создании приписывается тип данных, которое будут иметь его значения. Например, свойство «дата рождения» имеет идентификатор P569 и тип «время». Свойства создаются участниками Викиданных с особыми правами и только после обсуждения сообществом.

Каждое свойство может иметь метку (label) и описание (description) на одном или нескольких языках. Для каждого из языков можно добавить несколько алиасов (aliases)[4] Например, свойство P40 на русском языке имеет метку «ребёнок» и три алиаса: «сын» «дочь» и «дети». Редактирование метки, описания и алиасов доступно всем участникам Викиданных.

Ещё одним из «кирпичиков» Викиданных является так называемый снэк (snak). Его можно представить себе как конкретное значение конкретного свойства. Снэк — это сочетание идентификатора свойства, соединителя (snak type) и значения соответствующего свойству типа данных. Соединитель — это признак значения: «конкретное значение», «нет значения» и «значение неизвестно», в двух последних случаях собственно значение в снэке отсутствует. Вот примеры снеков:

Свойство Соединитель Значение Что это означает
отец (P22) «значение неизвестно» отец неизвестен
дата смерти (P570) «значение неизвестно» умер, но дата смерти неизвестна
дата смерти (P570) «нет значения» ныне живущий
супруг(а) (P26) «нет значения» не был женат, не была замужем
дата рождения (P569) «конкретное значение» 1932 родился в 1932 году

Элементы

Элементом Викиданных (item) называется сложная структура данных, описывающая некое понятие. Идентифицируется элемент строкой вида Q<число>, который мы будем называть идентификатором. Так, например, элемент про город Санкт-Петербург имеет идентификатор Q656, а про одноимённую гостиницуQ4407648. Идентификатор присваивается элементу в момент его создания и с тех пор никогда не меняется.

Каждый элемент может иметь метку (label) и описание (description) на одном или нескольких языках. Сочетание метки и описание на каждом из языков должно быть уникальным. Это сделано потому что в противном случае два элемента одинаковыми меткой и описанием человеку было бы очень легко спутать и это служило бы постоянным источником ошибок. Как вы знаете, в Викитеке, Википедии и др. вики-проектах название статьи обязано быть уникальным. В Викиданных же названием статьи (в техническом смысле — названием в основном пространстве имён) является его идентификатор, уникальность которого поддерживает сама система. Но на уровне концепции аналогом названия статьи в вики-проектах следует считать именно пару метки и описания. В качестве примера можно привести поэму Пушкина «Медный всадник», которая в Викиданных (Q1198506) имеет метку «Медный всадник» и описание «поэма Александра Сергеевича Пушкина», при этом соответствующая страница Викитеки называется «Медный всадник (Пушкин)».

Помимо метки и описания, элемента может иметь несколько алиасов (aliases). На них не накладывается никаких ограничений уникальности. Они нужны тогда, когда понятие имеет несколько названий. Например, для Санкт-Петербург (Q656) можно задать алиасы: «Петроград», «Ленинград», «СПб», «Питер», «Северная Венеция» и т.п.

Элемент Викиданных может связан со страницей в Викитеке, Википедии, Викицитатнике, Викиновостях, Викигиде, Викиучебнике или на Викискладе посредством ссылок (site links). Есть серьёзное ограничение один элемент может ссылаться только на одну страницу в каждом языковом домене вики-проектов. Это значит, что нет технической возможности связать две страницы русской Викитеки с одним элементом Викиданных. Также нет технической возможности связать элемент с какой-либо частью или конкретным местом[5]. Эти ссылки используются вики-движком для показывания интервик в этих проектах. Например, элемент Александр Сергеевич Пушкин (Q7200) связан со страницами Александр Сергеевич Пушкин, en:Author:Alexander Pushkin, de:Alexander Sergejewitsch Puschkin, это значит что на каждой из них появится ссылка на две другие. До введения Викиданных для связи трёх страниц потребовалось бы шесть интервик, а при работе Викиданных того же эффекта потребовалось всего три связи с общим элементом Викиданных.

При удалении страницы, которая связана с элементом Викиданных, автоматически происходит удаление ссылки из него, а при переименовании — замена ссылки, чтобы она соответствовала новому имени статьи.

Для описание конкретного понятия на языке Викиданных в элемент может иметь одно или несколько утверждений (statements или claims). Каждое утверждение есть главный снэк, ранг, квалификаторы и ссылки на источник. На странице элемента Викиданных утверждения группируются по свойству главного снэка. Порядок следования утверждений не имеет никакого значения и участники Викиданных не имеют возможности его изменить[6].

Рис. 1. Элемент Андрей Тарковский (Q853), свойство супруг(а) (P26)
  Здесь изображено два утверждения, каждое из которых снабжено двумя квалификаторами дата начала (P580) и дата окончания (P582) и одной ссылкой на источник импортировано из проекта Викимедиа (P143). Квалификаторы отображаются непосредственно под значением. Ссылки на источник располагаются под квалификаторами и обычно они свёрнуты для экономии места, но здесь они для демонстрации раскрыты. Значком   слева от значения обозначается ранг утверждения, в данном случае — нормальный.

Чтобы изменить значение или квалификаторы, надо нажать «редактировать» справа от значения. Чтобы изменить ссылку на источник, надо нажать «редактировать» правее и чуть выше её. Чтобы добавить новую ссылку на источник надо нажать «добавить сноску»[7]. ссылки на источник редактируются независимо от редактирования значения с квалификаторами.

Чтобы добавить новое утверждение для того же свойства, надо нажать «добавить» в конце блока. Ну и наконец, если надо добавить утверждение для другого свойства, надо нажать «добавить» после последнего утверждения в самом конце страницы (здесь она не изображена).

а) в режиме просмотра
  Здесь изображены те же два утверждения, первое находится в режиме редактирования, поэтому оно выделено цветом. Ссылка на источник первого утверждения тоже находится в режиме редактирования. Возле значения утверждения, квалификаторов и ссылки на источник появился значок   — он даёт возможность управлять соединителем. Вместо обоих кнопок «редактировать» появились троица «сохранить», «удалить» и «отменить», они позволяют соответственно подтвердить изменения, удалить ссылку на источник или утверждение целиком и отказаться от внесения изменений, выйдя из режима редактирования. Кнопка «квалификатор» позволяет добавить ещё один квалификатор к значению.

Когда в полях ввода надо указать свойство или элемент, вводите их метку, алиас или идентификатор Pxxxx или Qxxxx, и в появившемся списке выберите подходящий элемент. В списке будет показаны метка и описание свойства или элемента, в скобках будет показан алиас, по которому свойство или элемент были найдены. Если описания нет, ваша задача усложняется — найдите нужный вам свойство или элемент формой обычного поиска в отдельном окне или закладке браузера и введите идентификатор (но лучше-таки сделать доброе дело, и завести описание на родном языке).

Способ редактирования зависит от типа свойства (утверждения, квалификатора или ссылки на источник). Свойства супруг(а) (P26) имеет тип «элемент», а дата начала (P580) и дата окончания (P582) — тип «дата».

б) в режиме редактирования значения и ссылки на источник

В главном снэке (main snak) утверждения заключена его суть. Это единственная обязательная составляющая. В некотором смысле утверждение и есть его главный снэк.

Квалификаторы (qualifiers) утверждения указывают дополнительную информацию, связанную со значением. Каждый квалификатор — это снэк. Например, утверждение «Андрей Тарковский женился на Ирме Рауш в апреле 1957 года и развёлся с нею в июне 1970» на языке Викиданных записывается так: Андрей Тарковский (Q853) имеет свойство супруг(а) (P26) = Ирма Яковлевна Рауш (Q1981049) с квалификаторами дата начала (P580) = апрель 1957 и дата окончания (P582) = июнь 1970.

Ссылки на источник (references) указывают на источник информации, откуда почерпнута информация выраженная в утверждении. Она является набором одного или нескольких снэков. Наиболее часто для ссылок на источник используются свойства:

Рангом (rank) утверждения указывается субъективное отношение к нему, то, насколько можно ему доверять. Они введены для того, чтобы помечать не верные или недостаточно точные сведения. По сути это — указание компьютерным программам, какое именно значение надо использовать. Различаются три ранга: предпочтительный  , нормальный   и нерекомендуемый  . Предпочтительным рангом помечаются значение, которое рекомендуется для использования (например, отображения на странице в Викитеки) - обычно это современное значение при нескольких других (тоже верных) исторических значениях, нерекомендуемым — то, которое не надо использовать (неверное, но с источником), а нормальным рангом — то, которое надо использовать только тогда, когда нет предпочтительного значения (обычный ранг для ряда равноправных значений, или для исторических значений). Важно понимать, что решение, какое именно значение использовать, принимает не сами Викиданные, а алгоритм, использующий Викиданные — ему отдаются все значения независимо от ранга. К сожалению создатели шаблонов и модулей Lua, читающих Викиданные, часто игнорируют ранги, упрощая тем самым себе задачу.

 
Здесь изображено два утверждения с разными рангами. Первое с предпочтительным рангом, из Краткой литературной энциклопедии, утверждает, что Ольга Чюмина родилась 26 декабря 1864 (7 января 1865). Второе с нерекомендуемым рангом, из Энциклопедического словаря Брокгауза и Ефрона, утверждает, что она родилась в 1862 году. Правильно написанная программа будет использовать первое значение[9].
Рис. 2. Элемент Ольга Николаевна Чюмина (Q4518516), свойство дата рождения (P569)

Типы свойств

В Викиданных есть несколько терминов, описывающих использование свойств, удобных для описания правил их использования:

Полезные советы

Про редактор дат в Викиданных, отсутствие механизма изменения порядка свойств в элементе и утверждений в свойстве. Где искать правила применения свойств?

Как правильно использовать вики-данные

Элементы любого типа

В Викиданных есть пара универсальных свойств, обязательных к использованию во всех элементах без исключения. Каждый элемент должен иметь значение либо это частный случай понятия (P31), либо подкласс от (P279)[11]. Оба свойства имеют тип данных «элемент».

Конкретные (не являющиеся группой или какой-то разновидностью объектов) понятия должны иметь значением свойства это частный случай понятия (P31) некоторое общее понятие, например:

Элемент Значение свойства это частный случай понятия (P31)
Земля (Q2) внутренняя планета (Q3504248)
Роберт Шуман (Q7351) человек (Q5)
Джомолунгма (Q513) гора (Q8502)
Ich weiß nicht, was soll es bedeuten... (Q14540816) стихотворение (Q5185279)

Обратите внимание, что для Земля (Q2) можно было бы указать планета Солнечной системы (Q13205267), планета (Q634) (планета) или даже просто астрономический объект (Q6999), и это было бы правильно — всё зависит от того, с какой точностью мы хотим описать понятие на языке Викиданных. Напротив, для Роберт Шуман (Q7351) не стоит указывать композитор (Q36834), потому что признак профессии суть изменяемый и не всегда очевидный[12].

Неконкретные (групповые или видовые) понятия[13] должны иметь значение свойства подкласс от (P279), в котором также указывается некоторое общее понятие, например:

Элемент Значение свойства подкласс от (P279)
стихотворение (Q5185279) литературное произведение (Q7725634)
гора (Q8502) форма рельефа (Q271669)
композитор (Q36834) музыкант (Q639669) и автор (Q482980)
натуральное число (Q21199) целое число (Q12503)

Такие понятия образуют целую иерархию понятий, которую удобно просматривать в виде дерева, начиная с какого-либо начального элемента. Так, например, иерархию литературных произведений (Q7725634) можно визуализировать при помощи инструмента Tree (ограничено тремя уровнями). Начальный элемент и число уровней можно менять в адресе, в параметрах «q» и «depth» соответственно, параметр «rp» указывает идентификатор свойства, а «lang» — язык отображения меток.

Свойство подкласс от (P279) используется в описании свойств для того, чтобы указать у каких элементов оно должно быть, а у каких нет, или для того чтобы указать какие элементы можно указывать в качестве значения свойства типа элемент. Элементы, нарушающие правила использования свойств, через некоторое время будут отражены в специальном отчёте.

Но в большинстве случаев приходиться работать с элементами, обозначающие конкретные понятия, поэтому если вы сомневаетесь, какое из эти свойств использовать — применяйте это частный случай понятия (P31).

Категории

Элементы категорий должны иметь два свойства: это частный случай понятия (P31), равное категория в проекте Викимедиа (Q4167836) и основная тема категории (P301), в которой указывается то понятие, которое соответствует этой категории. Примеры заполнения основная тема категории (P301):

Категория Викитеки Элемент Свойство основная тема категории (P301)
Значение Квалификаторы
Категория:Александр Александрович Блок Категория:Александр Блок (Q9427013) Александр Александрович Блок (Q164765)
Категория:Немецкие авторы Категория:Писатели Германии (Q6827127) писатель (Q36180) государство (P17) = Германия (Q183)
Категория:Произведения Михаила Лермонтова (Q6286897) произведение (Q386724) автор (P50) = Михаил Юрьевич Лермонтов (Q46599)

Обратите внимание на использование квалификаторов во втором и третьем примере, здесь общее понятие ограничивается квалификатором: не все писатели, а писатели из Германии, не все произведения, а произведения, чьим автором является Лермонтов. В этом смысле описание в Викиданных даже точнее русского языка: под словом «немецкий» можно понимать как «родом из Германии», так и «пишущий на немецком языке». Точная формулировка основная тема категории (P301) помогает ясно понять смысл категории, даже в случае, когда не знаешь языка.

Ещё один нюанс — если для значения основная тема категории (P301) вам не потребовалось прибегать к квалификаторам, т.е. оно само по себе обозначает тему категории, как в примере с категорией Александра Блока, то в элементе темы надо добавить основная категория по теме (P910) со значением категории. Такие пары свойств Викиданных называются обратными или взаимозависимыми. На странице обсуждения таких свойств должно быть написано, какое именно свойство является обратным (например, см. d:Property talk:P301: «Взаимозависимое свойство…»).

Страницы неоднозначности

Элементы страниц неоднозначностей должны иметь свойство это частный случай понятия (P31) со значением страница значений в проекте Викимедиа (Q4167410). Общепринято, что метка такого элемента должна совпадать с тем словом или фразой, которое представляет собой неоднозначность, а описание на русском языке должно быть «страница значений». Учитывая требование уникальности пары метки и описания, это помогает сопоставлять элементы для страниц неоднозначностей одного языка. На других языках, также имеются стандартные описания, но о них вам заботиться не надо, т.к. в Викиданных есть боты, добавляющие эти стандартные описания, исходя из значения это частный случай понятия (P31).

С элементами страниц неоднозначностей есть одна проблема лингвистического характера. Дело в том, что слова и фразы разных языков не имеют взаимооднозначного соответствия. Легко сопоставить русское «брат» с немецким «Bruder» и английским «brother», но попробуйте-ка найти русский аналог немецкому «Geschwister», означающему «брат или сестра». Даже в области имён и фамилий это представляет сложность: попробуйте-ка ответить, испанскому «Don Juan» соответствует русское «дон Хуан» или «дон Жуан»? Такие вопросы в Викиданных решают исходя из надобности интервики-ссылок. Если вы не уверены, является ли два элемента страниц неоднозначностей разных языков одним и тем же, свяжите их друг с другом посредством свойства предположительно одно и то же с (P460) (это пример симметричного свойства, т.е. обратного самому себе и это тоже отмечается на его странице обсуждения).

Люди

Полный список свойств, которые могут использоваться в элементах о людях можно увидеть на странице Wikidata:List of properties/Person/ru.

В русской Викитеке есть достаточно много страниц авторов, большая часть из которых представляет собой конкретных людей.

Элементы таких страниц должны иметь свойство это частный случай понятия (P31) со значением человек (Q5) и пол или гендер (P21) со значением мужской пол (Q6581097) или женский пол (Q6581072). Для русской Викитеки наиболее важны следующие свойства:

Свойство Викиданных Как используется
Метка и
идентификатор
Тип данных Возможные квалификаторы
дата рождения (P569) время не ранее (P1319)
не позднее (P1326)
обстоятельства источника (P1480)
в качестве значения параметра ДАТАРОЖДЕНИЯ шаблона {{Обавторе}}, если он не задан
дата смерти (P570) время в качестве значения параметра ДАТАСМЕРТИ шаблона {{Обавторе}}, если он не задан
место рождения (P19) элемент административно-территориальная единица (P131)
государство (P17)
в качестве значения параметра МЕСТОРОЖДЕНИЯ шаблона {{Обавторе}}, если он не задан
место смерти (P20) элемент в качестве значения параметра МЕСТОСМЕРТИ шаблона {{Обавторе}}, если он не задан
изображение (P18) ссылка на файл Викисклада в качестве значения параметра ИЗОБРАЖЕНИЕ шаблона {{Обавторе}}, если он не задан
категория на Викискладе (P373) строка в качестве значения параметра ВИКИСКЛАД шаблона {{Обавторе}}, если он не задан
родной язык (P103) элемент в шаблоне {{Обавторе}} для извлечения ссылок на Википедию и Викицитатник, если статей на русском языке нет. Подобным же образом используется в {{Навигация}} в русской Википедии.
описывается в источниках (P1343) элемент утверждается в (P248)
URL-ссылка на источник (P854)
том (P478)
страницы (P304)
автор (P50)
раздел, стих или параграф (P958)
в шаблонах {{ЭСБЕ}}, {{МЭСБЕ}}, {{РБС}} и т. п. Позволяет делать взаимные ссылки между статьями энциклопедий об этом человеке. Также используется для получения ссылок на эти статьи при помощи шаблона {{Внешние ссылки}} в русской Википедии. Подробное описание см. в разделе «Энциклопедические статьи».
основная категория по теме (P910) элемент в шаблонах {{ЭСБЕ}}, {{МЭСБЕ}}, {{РБС}} и т. п. для разрешения ссылок на вики-проекты, если их нет в элементе о человеке. Подробное описание см. в разделе «Категории»

Если дата рождения или смерти известна не точно, следующие примеры помогут вам правильно указать это.

Элемент Свойство Значение Квалификаторы Что это значит
Василий Иванович Бутурлин (Q4100335) дата смерти (P570) «значение неизвестно» не ранее (P1319) = 1652 не ранее 1652 г.
Людмила Николаевна Вилькина (Q17908532) дата смерти (P570) «значение неизвестно» не позднее (P1326) = 30 июля 1920 не позднее 30 июля 1920 г.
Савва Иванович Чевакинский (Q2567012) дата смерти (P570) «значение неизвестно» не ранее (P1319) = 1772
не позднее (P1326) = 1780
между 1772 и 1780 гг.
Пифагор (Q10261) дата рождения (P569) 570 BCE обстоятельства источника (P1480) = около (Q5727902) около 570 г. до н. э.
Иоанн Златоуст (Q43706) дата рождения (P569) 349 не ранее (P1319) = 344
не позднее (P1326) = 354
обстоятельства источника (P1480) = около (Q5727902)
около 349 г., но не ранее 344 и не позднее 354

Место рождения и смерти следует снабжать квалификаторами административно-территориальная единица (P131) и государство (P17), чтобы шаблоны могли правильно отобразить географическое местоположение [14]. Единицы административного деления и государства надо всегда указывать на дату рождения или смерти. Для вложенных друг в друга единиц надо в административно-территориальная единица (P131) они указываться в порядке от наименее крупного до наиболее крупное (этот порядок используется при визуализации места рождения и смерти). Квалификаторы следует добавлять даже в самых очевидных случаях, потому что названия даже крупных городов для некоторых иностранцев могут быть неизвестны, не говоря уж об их истории.

Элемент Свойство Значение Квалификаторы Что это значит
Сергей Александрович Есенин (Q31628) место рождения (P19) Константиново (Q4231436) административно-территориальная единица (P131) = Рязанский уезд (Q4402667)
административно-территориальная единица (P131) = Рязанская губерния (Q1540291)
государство (P17) = Российская империя (Q34266)
родился в Константиново Рязанского уезда Рязанской губернии Российской империи
место смерти (P20) Санкт-Петербург (Q656) государство (P17) = Российская империя (Q34266) родился в Санкт-Петербурге Российской империи
Савва Иванович Чевакинский (Q2567012) место рождения (P19) Новоторжский уезд (Q4325959) административно-территориальная единица (P131) = Тверская область (Q2292)
государство (P17) = Российская империя (Q34266)
родился в Новоторжском уезде Тверской области Российской империи

Группы соавторов, выдуманные личности, литературные маски, псевдонимы

В Викитеке иногда встречаются страницы авторов описывающих не конкретного человека, а группу людей, вымышленную личность или коллективный псевдоним[15]. Их отличительной особенностью является значение это частный случай понятия (P31), например:

Страница в Викитеке Элемент Значение свойства это частный случай понятия (P31)
Братья Гримм братья Гримм (Q2793) братский дуэт (Q14073567)
Оссиан Оссиан (Q15837802) вымышленный человек (Q15632617)
Козьма Прутков Козьма Прутков (Q1784989) гетероним (Q1136342)
вымышленный человек (Q15632617)
коллективный псевдоним (Q16017119)
Ильф и Петров Ильф и Петров (Q262816) коллективный псевдоним (Q16017119)
дуэт (Q10648343)
fr:Auteur:Erckmann-Chatrian Erckmann-Chatrian (Q1348668) дуэт (Q10648343)
коллективный псевдоним (Q16017119)
en:Author:Herbert Strang Herbert Strang (Q15976336) коллективный псевдоним (Q16017119)
Анн и Серж Голон (Q4066510) коллективный псевдоним (Q16017119)
супружеская пара (Q3046146)

Реальные люди, стоящие за псевдонимами, а также состав группы соавторов, указываются значением свойства состоит из (P527). Это свойство имеет обратное — является частью (P361), при помощи которого элементы людей ссылаются на псевдоним или группу соавторов. Так, например, в Анн и Серж Голон (Q4066510) свойство состоит из (P527) имеет значения Анн Голон (Q263213) и Серж Голон (Q2338056), а в двух последних является частью (P361) имеет значение Анн и Серж Голон (Q4066510).

Некоторые из вымышленных личностей могут иметь собственную биографию, и, соответственно, описаны при помощи тех же свойств, что и реально существующие люди (см. раздел «Люди»). Так например, мы можем указать для Оссиан (Q15837802) свойства пол или гендер (P21) = мужской пол (Q6581097), родной язык (P103) = шотландский гэльский язык (Q9314), изображение (P18) = OssianAbildgaard.jpg, а для Козьма Прутков (Q1784989)пол или гендер (P21) = мужской пол (Q6581097), родной язык (P103) = русский язык (Q7737), изображение (P18) = Kozma Prutkov by L M Zhemchuzhnikov.jpg, и даже дата рождения (P569) = 11 апреля 1803, дата смерти (P570) = 13 января 1863.

Энциклопедические статьи

Правила оформления проекта d:Wikidata:WikiProject Books для энциклопедических статей.

Элементы статьей должны содержать пары свойств и значений: это частный случай понятия (P31) = энциклопедическая статья (Q13433827), является частью (P361) = Толковый словарь В. Даля (Q1970746) (пример), опубликовано в (P1433) = Толковый словарь В. Даля (Q1970746) (пример), название (P1476) = ru:"Название статьи". В P1433 можно ссылаться на конкретное издание. Надо ввести название элемента (Label) и описание: ru:"энциклопедическая статья" и en:"encyclopedic article".

Для связи элемента с более общим элементом (например, элементом статьи Википедии) необходимо указать свойство основная тема (P921) с идентификатором общего элемента, а в общем элементе — свойство описывается в источниках (P1343) с идентификатором элемента статьи.

Оригинальные произведения

Правила оформления проекта d:Wikidata:WikiProject Books для оригинальных произведений.

Издания и переводы

Правила оформления проекта d:Wikidata:WikiProject Books#Edition_item_properties для переводов и изданий.

В элементах изданий и переводов устанавливается свойство это частный случай понятия (P31) со значением версия или издание (Q3331189). В свойстве является изданием или переводом (P629) задаётся ссылка на элемент оригинального произведения. А в том элементе задаётся обратная ссылка на этот элемент, указываемая в свойстве издание или перевод (P747).

Другие элементы заполняются как обычно для изданий. Опционально можно добавить свойства «переводчик» и другие специализированные. Примеры: Эвтифрон (Q28137292) и Евтифрон (Q648889).

Интервики

Существует структурная проблема с указанием интервик на переводы произведений. Дело в том, что элемент Викиданных может быть связан только с одной страницей языкового раздела Викитеки. Для произведений это должна быть связь по одному соответствующему изданию. Поэтому невозможно сделать интервики между переводами произведений через Викиданные.[16]

Интервики-ссылки на переводы произведений размещают в тексте страницы. Как делалось прежде, до появления Викиданных.

Также существует команда {{noexternallanglinks}}, подавляющая интервики-ссылки из Викиданных.[17]

Интеграция Викитеки и Викиданных

В Викиданных существует соглашение d:Wikidata:WikiProject Books/ru о формате элементов и библиографических ссылок. По нему элементы оформляются ботами, работают различные скрипты/шаблоны Википедии и Викитеки.

Связывание с Википедией

  • Связывание статей Викитеки и Википедии («перелинковка») подразумевает открытие в браузере тематически связанной статьи Википедии. Это позволяет использовать соответствующие многофункциональные гаджеты «WEF» самой Википедии (см. раздел ниже). Этот гаджет также можно подключить в Викитеке и в Викиданных. Для линковки удобен «WEF:Ссылки», в котором имеется поиск по слову в статьях Викитеки, и добавление множества других словарей.
    • Имеется ошибка гаджета: Если элемент статьи ВТ уже существует (каковые созданы для большинства энциклопедий), то в нём не создаётся свойство основная тема (P921) и другие. Из-за этого в шапке статьи ВТ не появится ссылка на статью ВП, и ссылки на статьи других энциклопедий в Викитеке той же тематики. (Обратное свойство описывается в источниках (P1343) в элементе статьи ВП создаётся нормально.)
  • Скрипт QuickStatements (см. ниже) — обрабатывает заданные списки значений. Позволяет сделать взаимную ссылку, когда элемент для статьи уже создан, и делать сразу множество правок в разных элементах.
  • Автоматически можно сделать следующее: взять списки статей ВТ и ВП, сделать выборку идентичных названий, +дополнительный поиск с перестановкой слов в многословных названиях. Если тема статей одна — связать через ВД. Сложности: В списке могут быть омонимы, надо будет вручную проверять семантику каждой статьи. Причем по традициям статьи называются без уточнений, т. е. омонимия завышена. Списки огромные — в ВП 1.5 млн статей, поэтому необходимо профилирование такого скрипта[18].
    У Магнуса на tools.wmflabs.org есть похожий инструмент Map2WP для энциклопедии DNB (выводит список не перелинкованных элементов со схожим названием). Можно попросить его сделать похожий для ЭСБЕ. В него добавить ссылки на элементы и кнопку для линковки.

Инструменты

Боты

Гаджеты «WEF»

Имеется семейство многофункциональных удобных гаджетов «WEF», редактирующих основные свойства элементов в правильном формате. Включаются в настройках «Викиданные» и запускаются из левого бокового меню.

Также, эти гаджеты можно подключить для всех проектов, включая Викитеку и Викиданные.

Инструкция гаджета.

«WEF:Ссылки»

Для линковки с Викитекой удобен «WEF:Ссылки». Имеет: поиск по слову в статьях Викитеки, добавление множества других словарей, поиск на внешних сайтах энциклопедий.

Обратите внимание, что этот гаджет, подключённый в Викитеке, из статей энциклопедий работать не будет. Поскольку из статей Викитеки редактируются только элементы этих статей, а гаджжет служит для редактирования элемента темы, связующего статьи и содержащего их список. Проще воспользоваться этим гаджетом из Википедии.

Гаджеты заполнения библиографической информации

Для заполнения элементов информацией удобны гаджеты: «WEF:FRBR работа», «WEF:Книга» и «WEF:FRBR издание», «WEF:Персона».

  • «WEF:FRBR работа» (work) — для произведений.
  • «WEF:FRBR издание» и «WEF:Книга» примерно одинаковы. Второй имеет свойство для указания, что это том, и пару русских библиотечных свойств.
Код WEF-фреймворка

WEF-фреймворка. ядро, код на github.com.

Скрипты с html-формой

  • QuickStatements. В инструменте разделитель параметров — табуляция (это вариация формата CSV). Ввести табуляцию в браузере затруднительно, лучше использовать оффлайн-редактор текста (например Notepad++) или таблиц (Excel и т.п.). Одна строка на одно свойство. Можно сразу создавать элементы с именами и свойствами.
    • Вспомогательные онлайн-скрипты, для создания списков. 1) Перейдя по ссылке, укажите в скрипте нужные значения и нажмите внизу кнопку «Run it», 2) Скопируйте вывод в QuickStatements и запустите его.
  • PetScan. — Служит для создания списка статей по различным критериям, в том числе по категориям и свойствам Викиданных. Имеет возможность создания элементов с одинаковыми наборами свойств. В окне справа можно будет ввести пары ключ:значение по одной на строку, например: P31:Q17329259. Документация, совет автора как сделать заливку этим инструментом.

Документация

Обзорные страницы и форумы
Шаблоны и свойства элементов
Программирование
Создание ботов

Примечания

  1. Конечно, это только лишь одно из представлений, а именно в формате JSON. Обычно такой формат используют в программах на JavaScript
  2. Это очень похоже на примитивные типы (primitive types) в языках программирования или на типы колонок в таблицах реляционной базы данных.
  3. Список доступных типов данных можно посмотреть на специальной странице Викиданных Special:ListDatatypes.
  4. К сожалению это термин не имеет устоявшегося русскоязычного аналога, поэтому мы будем использовать кальку с английского.
  5. Отсутствие этих двух возможностей широко обсуждалось участниками Викиданных, мнения, как водиться, разделились. Пока мы имеем то, что имеем, и эти ограничения не сняты.
  6. Некоторое время назад такая возможность была, но она не работала должным образом, потому её и отключили.
  7. К сожалению, тут подкачали переводчики интерфейса — для обозначения одного и того же термина используется как слово «ссылка», так и «сноска».
  8. Это свойство, как правило, добавляют боты, импортирующие информацию из Википедии. Так как Википедия считает себя вторичным источником, такие ссылки надлежит заменять на подтверждающий первичный источник.
  9. Шаблон {{Обавторе}} так и поступает.
  10. Обратным свойством для дети (P40) являлось бы «родитель», но такого свойства в Викиданных нет.
  11. Люди, знакомые с объектно-ориентированным программированием могут считать, что это частный случай понятия (P31) — это отношение «быть экземпляром класса», а подкласс от (P279) — это отношение наследования классов, причём наследования множественного.
  12. Труднее объяснить почему в это частный случай понятия (P31) не стоит указывать мужчина (Q8441) или женщина (Q467) — вероятно, дело в успехах современной медицины? Просто запомните, что для людей принято использовать человек (Q5) и указывать пол в свойстве пол или гендер (P21).
  13. В классической логике такие понятия называются классами или категориями.
  14. К сожалению, в настоящее время при визуализации свойств место рождения (P19) и место смерти (P20) (а также других свойств, указывающих местоположение) в качестве названия используется метка соответствующего элемента, в которой, как правило, находиться современное название, но названия населённых пунктов время от времени меняются. Классическим примером является является Санкт-Петербург (Q656), трижды менявший своё имя. Идентичность понятий «Санкт-Петербург», «Петроград» и «Ленинград» не вызывает сомнения, поэтому создавать отдельные элементы для названий города неправильно, а другого приемлемого решения этой задачи не найдено.
  15. Псевдонимы отдельных авторов, как правило, в отдельный элемент не выделяются и указываются в элементе самого автора при помощи свойства псевдоним (P742) типа строка. Это свойство допускает несколько значений. Псевдоним должен быть указан именно в том виде, в котором использовался в оригинальных публикациях.
  16. Обсуждения: [1], [2], [3]. С 2014 года так и нет решений.
  17. В этой команде можно запретить определённые языки, например: {{noexternallanglinks:es|fr|it}}.
  18. Попробовать использовать запрос к БД на tools.wmflabs.org, предварительную отфильтровку, и т. д.