Анастасия Ракова поделилась итогами работы сервиса «Поиск по архивам», который помогает изучать историю семьи по рукописным текстам
Более 20 миллионов раз воспользовались порталом «Поиск по архивам» в Москве, сообщила заммэра столицы по вопросам социального развития Анастасия Ракова.
В запущенный год назад сервис загрузили более 5,4 млн страниц исторических материалов из Главархива Москвы и других источников. С помощью сервиса пользователи могут быстро находить информацию о своих предках. Также он помогает помогает историкам, социологам, демографам, журналистам и простым москвичам находить информацию об исторических событиях и личностях.
«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы. Это особенно заметно в Год семьи, — рассказала Ракова. — Мы стремимся помочь жителям в столь важном деле и ищем способы сделать доступ к документам проще. Так, несколько лет назад мы открыли онлайн-сервис «Моя семья» и разместили в нем оцифрованные метрические книги — документы, содержащие сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты».
Как уточнила вице-мэр, за год работы сервиса к порталу обратились более 20 млн раз, нейросеть проанализировала свыше 10 млн страниц исторических документов.
В Соцкомплексе столицы отметили, что работать с архивными документами теперь так же легко, как с привычным поиском Яндекса. Сейчас в «Поиске по архивам» есть документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и других областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII – начала XX веков. Также здесь собраны 3,6 млн оцифрованных страниц периодических изданий.
Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.