Новости

Анастасия Ракова поделилась итогами работы сервиса «Поиск по архивам», который помогает изучать историю семьи по рукописным текстам

mos.ru
Анастасия Ракова поделилась итогами работы сервиса «Поиск по архивам», который помогает изучать историю семьи по рукописным текстам

Более 20 миллионов раз воспользовались порталом «Поиск по архивам» в Москве, сообщила заммэра столицы по вопросам социального развития Анастасия Ракова.

В запущенный год назад сервис загрузили более 5,4 млн страниц исторических материалов из Главархива Москвы и других источников. С помощью сервиса пользователи могут быстро находить информацию о своих предках. Также он помогает помогает историкам, социологам, демографам, журналистам и простым москвичам находить информацию об исторических событиях и личностях.

«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы. Это особенно заметно в Год семьи, — рассказала Ракова. — Мы стремимся помочь жителям в столь важном деле и ищем способы сделать доступ к документам проще. Так, несколько лет назад мы открыли онлайн-сервис «Моя семья» и разместили в нем оцифрованные метрические книги — документы, содержащие сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты».

Как уточнила вице-мэр, за год работы сервиса к порталу обратились более 20 млн раз, нейросеть проанализировала свыше 10 млн страниц исторических документов.

В Соцкомплексе столицы отметили, что работать с архивными документами теперь так же легко, как с привычным поиском Яндекса. Сейчас в «Поиске по архивам» есть документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и других областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII – начала XX веков. Также здесь собраны 3,6 млн оцифрованных страниц периодических изданий.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.

Последние новости