«Яндекс» запустил сервис расшифровки архивных документов нейросетью

«Яндекс» запустил сервис «Поиск по архивам», в котором собраны более 2,5 млн страниц исторических рукописных документов с текстовой расшифровкой. Об этом сообщает пресс-служба компании.

Рукописные дореволюционные документы расшифровывает нейросеть. Отмечается, что специалисты обучали ее на массиве данных из сотен тысяч рукописных строк реальных текстов XVIII-XIX вв. из Главархива Москвы, а также десятков миллионов сгенерированных примеров. Перед этим они сами разметили и расшифровали исторические материалы .

С помощью технологии пользователи могут найти в базе сервиса нужный документ с упоминанием фамилии, населенного пункта и др. Поиск текстов доступен по каталогу или через строку поиска, также есть фильтры по годам, архивам, фондам и описям. Расшифрованный нейросетью документ отображается справа от оригинала, при наведении курсора на нужный фрагмент, он сразу подсветится на цифровой копии текста, пояснили в пресс-службе.

Помимо документов Главархива Москвы, в базе также можно найти тексты из архивов Оренбургской и Новгородской областей. Разработчики обещают, что в будущем в сервисе станет еще больше доступных документов.

В ноябре 2022 г. «Яндекс» также обучил нейросеть находить места по сложным запросам в «Яндекс.Картах». При обработке запроса она анализирует не только описание и ключевые слова, но и другие параметры — фотографии, отзывы и меню.