Новости — 25 января 2023, 14:24

«Яндекс» запустил «Поиск по архивам» — сервис, который позволяет расшифровывать архивные документы

Помогает в поиске архив, в базе которого сейчас находится более 2,5 млн старинных документов, собранных из московских, оренбургских и новгородских хранилищ. Но количество фондов и источников будет постоянно увеличиваться, а значит, электронный каталог будет регулярно пополняться. Поэтому, если сервис не помог решить задачку прямо сейчас, вероятно, через пару месяцев он уже справится с задачей. Проверить это можно на официальной странице «Поиска по архивам».

Инструмент только-только запустился. Для старта разработчики отобрали наиболее востребованные материалы вроде метрических книг с записями рождений, смертей и браков, исповедные ведомости, в которых есть списки прихожан церквей, а также ревизские сказки с результатами переписей населения. Для более точного поиска можно настроить фильтры: выбрать тип документов, фонды, временной промежуток и даже название дела.


Помимо поиска по текстам архивных документов, инструмент позволяет изучить каталог и расшифровать рукописи. Нейросеть понимает даже самые витиеватые почерки и может справиться со сложной дореволюционной орфографией. Сервис работает на базе технологии оптического распознавания текста «Яндекса». Искусственный интеллект узнает утратившие актуальность символы, учитывая при этом особенности почерка, и за несколько секунд превращает старинные и непонятные записи во внятный печатный текст. Кроме того, нейросети помогают эксперты. Они регулярно обучают алгоритмы распознавать рукописные тексты и следят за качеством расшифровки.

На сайте даны четкие рекомендации, как лучше обращаться с сервисом для более плодотворного сотрудничества. А еще там висят примеры интересных документов, которые можно легко найти по поисковому запросу. Среди них — запись о рождении Федора Достоевского, дочери Марины Цветаевой Ариадны, а еще информация о замужестве дочери Льва Толстого.

Для полного погружения в материал можно изучить еще и исследование, которое «Яндекс» провел в ноябре 2021-го. Тогда местные исследователи решили сравнить, как изменилась лексика русского языка за последние 100 лет. Они сопоставили между собой записи из личных дневников, которые были сделаны с 1900 по 1940 год, со статьями и комментариями в современных блогах. В результате получилось три подборки: в первой собраны уходящие и ушедшие из употребления слова, во второй — недавно приобретенные, а в третьей — те, что изменили свое основное значение.

Фото: кадр из фильма «Девятые врата»
Новости — 16:50, 19 сентября
Кинофестиваль «Маяк» объявил конкурсную программу
Новости — 14:45, 19 сентября
«Стальное сердце», «Майор Гром» и TIOT. Рассказываем, как прошел второй «Фандом Фест»
Новости — 12:25, 19 сентября
Цирк, балет и музыка: «Яндекс» и Imperial Orchestra покажут мистическое шоу по мотивам «Щелкунчика»
Новости — 19:13, 18 сентября
«Эмили в Париже» продлили на 5-й сезон
Кино — 19:04, 18 сентября
Как вынести креатив из мастерских в пространство города? Рассказывает руководитель Агентства креативных индустрий Гюльнара Агамова