Новости — 25 января 2023, 14:24

«Яндекс» запустил «Поиск по архивам» — сервис, который позволяет расшифровывать архивные документы

Помогает в поиске архив, в базе которого сейчас находится более 2,5 млн старинных документов, собранных из московских, оренбургских и новгородских хранилищ. Но количество фондов и источников будет постоянно увеличиваться, а значит, электронный каталог будет регулярно пополняться. Поэтому, если сервис не помог решить задачку прямо сейчас, вероятно, через пару месяцев он уже справится с задачей. Проверить это можно на официальной странице «Поиска по архивам».

Инструмент только-только запустился. Для старта разработчики отобрали наиболее востребованные материалы вроде метрических книг с записями рождений, смертей и браков, исповедные ведомости, в которых есть списки прихожан церквей, а также ревизские сказки с результатами переписей населения. Для более точного поиска можно настроить фильтры: выбрать тип документов, фонды, временной промежуток и даже название дела.


Помимо поиска по текстам архивных документов, инструмент позволяет изучить каталог и расшифровать рукописи. Нейросеть понимает даже самые витиеватые почерки и может справиться со сложной дореволюционной орфографией. Сервис работает на базе технологии оптического распознавания текста «Яндекса». Искусственный интеллект узнает утратившие актуальность символы, учитывая при этом особенности почерка, и за несколько секунд превращает старинные и непонятные записи во внятный печатный текст. Кроме того, нейросети помогают эксперты. Они регулярно обучают алгоритмы распознавать рукописные тексты и следят за качеством расшифровки.

На сайте даны четкие рекомендации, как лучше обращаться с сервисом для более плодотворного сотрудничества. А еще там висят примеры интересных документов, которые можно легко найти по поисковому запросу. Среди них — запись о рождении Федора Достоевского, дочери Марины Цветаевой Ариадны, а еще информация о замужестве дочери Льва Толстого.

Для полного погружения в материал можно изучить еще и исследование, которое «Яндекс» провел в ноябре 2021-го. Тогда местные исследователи решили сравнить, как изменилась лексика русского языка за последние 100 лет. Они сопоставили между собой записи из личных дневников, которые были сделаны с 1900 по 1940 год, со статьями и комментариями в современных блогах. В результате получилось три подборки: в первой собраны уходящие и ушедшие из употребления слова, во второй — недавно приобретенные, а в третьей — те, что изменили свое основное значение.

Фото: кадр из фильма «Девятые врата»
Новости — 13:05, 14 июня
По ту сторону контента. SRSLY-анкеты блогеров Антона Gudim, Piterville, Елены Юлкиной и Bilashmama
Новости — 19:40, 11 июня
Библейские отсылки и веб-хейт. Блогеры и критики — о третьем сезоне «Эйфории»
Новости — 17:40, 11 июня
Ченнинг Татум может вернуться в новом фильме по «Мачо и ботану»
Новости — 16:20, 11 июня
Майлз Теллер исполнит главную роль в триллере Copperhead
Новости — 15:05, 11 июня
Джереми Стронг сыграет Марка Цукерберга в «Социальной расплате»