Обсуждение:Свод законов Российской империи/Архив

Эта страница содержит завершившееся обсуждение. Не изменяйте её. Новое обсуждение можно создать на другой странице.

(Обсуждения наверное лучше вести здесь, а на странице проекта -- непосредственно предложения и готовые решения) Hinote (обсуждение) 17:16, 10 декабря 2014 (UTC)Ответить

Источники текстов править

  • Надо определиться, какой источник текстов использовать -- с текстового слоя сканов непосредственно или же с тех страниц на pravo.gov.ru.

Если бы там были готовые страницы по документам в html с оформлением -- то было бы понятно. А так там -- plain-текст по страницам, в принципе ничем от страниц сканов и не отличается. Хотя -- там есть хоть какое оформление (разбивка по абзацам), так что могу скачать тексты страниц с этого ресурса, обработать скриптами (удалить колонтитулы, разбивку на абзацы привести к вики-формату (два перевода строк), м.б. еще что-то (давайте обсуждать, хотя надо будет, наверное, показать результат и будет видно -- что еще дообработать)) -- и залить на место страниц индексов. Всё должно быть быстрее, чем со сканов... Надо сделать индексы, хотя бы для начала индекс для первого тома... Hinote (обсуждение) 17:16, 10 декабря 2014 (UTC)Ответить

Да умеет бот заливать страницы со скана: https://www.mediawiki.org/wiki/Manual:Pywikibot/djvutext.py (надо djvu для этого себе скачать, локально у себя разместить и натравить на него бота). Но страницы с ресурса использовать лучше -- их уже вычитывали перед помещением на этот ресурс (но не особенно качественно, ошибок там полно), плюс какое-никакое, но оформление уже там есть (хотя-бы разбивка на абзацы)... Hinote (обсуждение) 18:37, 10 декабря 2014 (UTC)Ответить
Сделал индекс первого тома. См. Викитека:Проект:СЗРИ#Начало. Разбивку по законам произвел прямо в индексе. Один закон — одна подстраница тома СЗ. Hausratte (обсуждение) 18:47, 10 декабря 2014 (UTC)Ответить
Страницы с ресурса однозначно предпочтительнее, там значительная часть подготовительной работы уже сделана. Вот только с таблицами жесть, но их в любом случае вручную доделывать придется. Хотя, возможно, таблицы в сканах размечены лучше? — Lozman (talk) 18:53, 10 декабря 2014 (UTC)Ответить
В скане по-разному. Вот пример одной… Hausratte (обсуждение) 18:58, 10 декабря 2014 (UTC)Ответить
Вот и я об этом. В сканах таблицы развернуты в линейный текст по ячейкам, для восстановления табличной структуры просто добавь воды разметку. А на pravo.gov.ru нарисованы псевдотаблицы с псевдографикой, структура поломана, исправлять вручную долго и муторно. Видимо, придется совмещать оба подхода: сканы для таблиц, сайт — для обычного текста. — Lozman (talk) 20:00, 10 декабря 2014 (UTC)Ответить
Почти сделал страницы для первого тома (скачано с ресурса, обрабатываю скриптами для приведения синтаксиса к вики-разметке). Вопрос, в каком порядке залить на страницы индекса: 1) можно сначала залить текст из djvu, потом поверх -- эти страницы, результат моей работы. В истории будут оба варианта (т.е. для оформления таблиц можно будет из истории взять вариант djvu); 2) В обратном порядке (наверное худший вариант из этих 3-х); 3) Только залить результаты моей работы, а кто будет делать таблицы -- будет брать тексты страниц не из истории, а из своего локального djvu-файла. Hinote (обсуждение) 10:17, 11 декабря 2014 (UTC)Ответить
Давайте первый вариант, если не сложно. Он, похоже, оптимальный. Hausratte (обсуждение) 12:47, 11 декабря 2014 (UTC)Ответить
Hausratte, Получите, распишитесь -- первый том. Чтобы было вам что делать на новогодние праздники... ;-)) На страницах тома -- первая правка ботом -- текст из djvu, вторая правка ботом -- тест из веб-ресурса, преобразованный в вики-разметку. Руки бы поотрывал тем, кто так оформил эти страницы на том ресурсе, и больше бы не подпускал к оформлению текстов... Hinote (обсуждение) 03:48, 24 декабря 2014 (UTC)Ответить
Для убыстрения работы с шаблоном ВАР на страницах (и вставки Перенос, Перенос2) можете попробовать использовать мой тулбар-хелпер... Hinote (обсуждение) 04:01, 24 декабря 2014 (UTC)Ответить
@Hinote: Огромное спасибо за вашу помощь! А страницы остальных готовых индексов не сделаете? Правда, там уже пошли пропущенные и лишние сканы… В примечаниях к индексам я старался указывать пропущенные и страницы, разбитые на два скана, + пустые страницы в самом индексе указаны прочерками. Hausratte (обсуждение) 17:30, 24 декабря 2014 (UTC)Ответить
Да, остальное тоже сделаю, последующие тома быстрее (там самое неприятное, что левый край текста "скачет" влево-вправо на одной странице, иногда (часто) внутри одного абзаца, разное кол-во пробелов слева -- это только руками вычищать, не автоматизировать... Руки бы им сами знаете что...) Да, в размещенном мной тексте -- есть часто встречающиеся погрешности -- почему то фита часто вместо ятя, особенно в словах, записанных заглавными буквами (заголовки). Будете оформлять -- обращайте внимание. Ну и остального хватает -- щ вместо ш и наоборот, -iе вместо -iя и наоборот, ъ вместо ь и наоборот и проч... Вообще, по практике ВТ, текст такого качества на вычитанный то с натяжкой потянет, не то что на проверенный... Hinote (обсуждение) 20:15, 24 декабря 2014 (UTC)Ответить

Оформление править

Сделал пример оформления оглавления тома, прошу оценить: оглавление тома I. Страницы из индекса. Красные ссылки — отсутствующие страницы соответствующих законов, куда нужно залить текст.
Я вижу пока так: страница Свод законов Российской империи, на ней список томов. При клике на том (или на ссылку «оглавление» рядом с томом) выпадает оглавление тома с ссылками на законы.
Однако поскольку я пока не разобрался с системой редакций, то оставляю на усмотрение Hinote и Lozmana. Покамест буду создавать индексы и распознавать оглавления томов. Hausratte (обсуждение) 22:21, 10 декабря 2014 (UTC)Ответить

Мне не нравятся названия страниц вида 1, 2, 3, 4, 5..., такая сквозная нумерация... Надо в них как-то названия законов отразить, наверное, и (возможно, не уверен) иерархию в томе (часть такая-то, раздел такой-то и т.п.) Hinote (обсуждение) 10:19, 11 декабря 2014 (UTC)Ответить
Переделал ссылки по типу наших ссылок на статьи в энциклопедиях (СЗРИ/ДО/Название закона/Раздел или приложение). Hausratte (обсуждение) 23:29, 15 декабря 2014 (UTC)Ответить

Самое главное править

Самое главное в том, что давайте уж делать сразу 2 варианта -- ДО и СО (ВТ). Ибо если на каком-то этапе уйти от этого и просто продеятифицировать -- то вернуть к 2-м вариантам будет намного сложнее... Hausratte -- это, собственно, к вам обращение, зная вашу нелюбовь к 2-м вариантам текста. )) Пожалуйста... Hinote (обсуждение) 14:52, 11 декабря 2014 (UTC)Ответить

Вернуться на страницу «Свод законов Российской империи/Архив».