Вице-мэр Ракова: Более 20 млн раз пользователи обратились к порталу по генеалогии «Поиск по архивам» за год
31.01.2024 > Новости столицы
Столичные жители свыше двадцати миллионов раз воспользовались порталом «Поиск по архивам», его запустили в городе год назад. Туда загрузили более 5,4 млн страниц исторических материалов из Главархива Москвы и иные материалы.
Как проинформировала заммэра по вопросам социального развития Анастасия Ракова, благодаря сервису людям теперь легче находить историю своих семей. Помимо этого, он помогает ученым и журналистам, а на страницах, которые содержат устаревшие символы и рукописи, тренируется искусственный интеллект.
Поиск по архивам — это запущенный в начале минувшего года сервис Яндекса, он помогает быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.
По словам Анастасии Раковой, на протяжении нескольких последних лет запросы, которые связаны с поиском предков и исследованием прошлого семьи, оказываются одними из наиболее популярных в Главархиве Москвы. Это весьма заметно в Год семьи. Есть стремление помочь горожанам в столь значимом деле, ищут способы сделать доступ к документам легче. Так, несколько лет назад был открыт онлайн-сервис «Моя семья» и размещены в нем оцифрованные метрические книги — документы, где есть сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты. За год работы сервиса к порталу обратились свыше 20 млн раз, что свидетельствует о его востребованности и нужности. Сама нейросеть проанализировала более 10 млн страниц исторических документов.
Благодаря сервису «Поиск по архивам» историки, социологи, демографы, журналисты и рядовые горожане способны находить информацию об исторических событиях и личностях. Как проинформировали в Соцкомплексе столицы, работать с архивными документами теперь так же просто, как с привычным поиском Яндекса.
Теперь в «Поиске по архивам» существуют документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и прочих областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это свыше 10 млн страниц, или 492 миллионов строк. В «Поиске по архивам» хранятся расшифрованные архивные дела (к примеру, метрические книги и ревизские сказки), где есть информация о людях, родившихся в России до 1917 г. Также в сервисе собрали 3,6 млн оцифрованных страниц периодических изданий, таких как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости. Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (к примеру, пропавшие из алфавита буквы), принимает во внимание особенности почерка и за несколько секунд переделывает трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на больших полосах, набранный мелким шрифтом на низкоплотной бумаге.
Как проинформировала заммэра по вопросам социального развития Анастасия Ракова, благодаря сервису людям теперь легче находить историю своих семей. Помимо этого, он помогает ученым и журналистам, а на страницах, которые содержат устаревшие символы и рукописи, тренируется искусственный интеллект.
Поиск по архивам — это запущенный в начале минувшего года сервис Яндекса, он помогает быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.
По словам Анастасии Раковой, на протяжении нескольких последних лет запросы, которые связаны с поиском предков и исследованием прошлого семьи, оказываются одними из наиболее популярных в Главархиве Москвы. Это весьма заметно в Год семьи. Есть стремление помочь горожанам в столь значимом деле, ищут способы сделать доступ к документам легче. Так, несколько лет назад был открыт онлайн-сервис «Моя семья» и размещены в нем оцифрованные метрические книги — документы, где есть сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты. За год работы сервиса к порталу обратились свыше 20 млн раз, что свидетельствует о его востребованности и нужности. Сама нейросеть проанализировала более 10 млн страниц исторических документов.
Благодаря сервису «Поиск по архивам» историки, социологи, демографы, журналисты и рядовые горожане способны находить информацию об исторических событиях и личностях. Как проинформировали в Соцкомплексе столицы, работать с архивными документами теперь так же просто, как с привычным поиском Яндекса.
Теперь в «Поиске по архивам» существуют документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и прочих областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это свыше 10 млн страниц, или 492 миллионов строк. В «Поиске по архивам» хранятся расшифрованные архивные дела (к примеру, метрические книги и ревизские сказки), где есть информация о людях, родившихся в России до 1917 г. Также в сервисе собрали 3,6 млн оцифрованных страниц периодических изданий, таких как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости. Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (к примеру, пропавшие из алфавита буквы), принимает во внимание особенности почерка и за несколько секунд переделывает трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на больших полосах, набранный мелким шрифтом на низкоплотной бумаге.