Помогает в поиске архив, в базе которого сейчас находится более 2,5 млн старинных документов, собранных из московских, оренбургских и новгородских хранилищ. Но количество фондов и источников будет постоянно увеличиваться, а значит, электронный каталог будет регулярно пополняться. Поэтому, если сервис не помог решить задачку прямо сейчас, вероятно, через пару месяцев он уже справится с задачей. Проверить это можно на официальной странице «Поиска по архивам».
Инструмент только-только запустился. Для старта разработчики отобрали наиболее востребованные материалы вроде метрических книг с записями рождений, смертей и браков, исповедные ведомости, в которых есть списки прихожан церквей, а также ревизские сказки с результатами переписей населения. Для более точного поиска можно настроить фильтры: выбрать тип документов, фонды, временной промежуток и даже название дела.
Помимо поиска по текстам архивных документов, инструмент позволяет изучить каталог и расшифровать рукописи. Нейросеть понимает даже самые витиеватые почерки и может справиться со сложной дореволюционной орфографией. Сервис работает на базе технологии оптического распознавания текста «Яндекса». Искусственный интеллект узнает утратившие актуальность символы, учитывая при этом особенности почерка, и за несколько секунд превращает старинные и непонятные записи во внятный печатный текст. Кроме того, нейросети помогают эксперты. Они регулярно обучают алгоритмы распознавать рукописные тексты и следят за качеством расшифровки.
На сайте даны четкие рекомендации, как лучше обращаться с сервисом для более плодотворного сотрудничества. А еще там висят примеры интересных документов, которые можно легко найти по поисковому запросу. Среди них — запись о рождении Федора Достоевского, дочери Марины Цветаевой Ариадны, а еще информация о замужестве дочери Льва Толстого.
Для полного погружения в материал можно изучить еще и исследование, которое «Яндекс» провел в ноябре 2021-го. Тогда местные исследователи решили сравнить, как изменилась лексика русского языка за последние 100 лет. Они сопоставили между собой записи из личных дневников, которые были сделаны с 1900 по 1940 год, со статьями и комментариями в современных блогах. В результате получилось три подборки: в первой собраны уходящие и ушедшие из употребления слова, во второй — недавно приобретенные, а в третьей — те, что изменили свое основное значение.