31.01.2024
Вице-мэр Ракова: Более 20 млн раз пользователи обратились к порталу по генеалогии «Поиск по архивам» за год
Столичные жители свыше двадцати миллионов раз воспользовались порталом «Поиск по архивам», его запустили в городе год назад. Туда загрузили более 5,4 млн страниц исторических материалов из Главархива Москвы и иные материалы.
Как проинформировала заммэра по вопросам социального развития Анастасия Ракова, благодаря сервису людям теперь легче находить историю своих семей. Помимо этого, он помогает ученым и журналистам, а на страницах, которые содержат устаревшие символы и рукописи, тренируется искусственный интеллект.
Поиск по архивам — это запущенный в начале минувшего года сервис Яндекса, он помогает быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.
По словам Анастасии Раковой, на протяжении нескольких последних лет запросы, которые связаны с поиском предков и исследованием прошлого семьи, оказываются одними из наиболее популярных в Главархиве Москвы. Это весьма заметно в Год семьи. Есть стремление помочь горожанам в столь значимом деле, ищут способы сделать доступ к документам легче. Так, несколько лет назад был открыт онлайн-сервис «Моя семья» и размещены в нем оцифрованные метрические книги — документы, где есть сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты. За год работы сервиса к порталу обратились свыше 20 млн раз, что свидетельствует о его востребованности и нужности. Сама нейросеть проанализировала более 10 млн страниц исторических документов.
Благодаря сервису «Поиск по архивам» историки, социологи, демографы, журналисты и рядовые горожане способны находить информацию об исторических событиях и личностях. Как проинформировали в Соцкомплексе столицы, работать с архивными документами теперь так же просто, как с привычным поиском Яндекса.
Теперь в «Поиске по архивам» существуют документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и прочих областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это свыше 10 млн страниц, или 492 миллионов строк. В «Поиске по архивам» хранятся расшифрованные архивные дела (к примеру, метрические книги и ревизские сказки), где есть информация о людях, родившихся в России до 1917 г. Также в сервисе собрали 3,6 млн оцифрованных страниц периодических изданий, таких как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости. Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (к примеру, пропавшие из алфавита буквы), принимает во внимание особенности почерка и за несколько секунд переделывает трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на больших полосах, набранный мелким шрифтом на низкоплотной бумаге.
Версия для печати