Новости — 25 января 2023, 14:24

«Яндекс» запустил «Поиск по архивам» — сервис, который позволяет расшифровывать архивные документы

Помогает в поиске архив, в базе которого сейчас находится более 2,5 млн старинных документов, собранных из московских, оренбургских и новгородских хранилищ. Но количество фондов и источников будет постоянно увеличиваться, а значит, электронный каталог будет регулярно пополняться. Поэтому, если сервис не помог решить задачку прямо сейчас, вероятно, через пару месяцев он уже справится с задачей. Проверить это можно на официальной странице «Поиска по архивам».

Инструмент только-только запустился. Для старта разработчики отобрали наиболее востребованные материалы вроде метрических книг с записями рождений, смертей и браков, исповедные ведомости, в которых есть списки прихожан церквей, а также ревизские сказки с результатами переписей населения. Для более точного поиска можно настроить фильтры: выбрать тип документов, фонды, временной промежуток и даже название дела.


Помимо поиска по текстам архивных документов, инструмент позволяет изучить каталог и расшифровать рукописи. Нейросеть понимает даже самые витиеватые почерки и может справиться со сложной дореволюционной орфографией. Сервис работает на базе технологии оптического распознавания текста «Яндекса». Искусственный интеллект узнает утратившие актуальность символы, учитывая при этом особенности почерка, и за несколько секунд превращает старинные и непонятные записи во внятный печатный текст. Кроме того, нейросети помогают эксперты. Они регулярно обучают алгоритмы распознавать рукописные тексты и следят за качеством расшифровки.

На сайте даны четкие рекомендации, как лучше обращаться с сервисом для более плодотворного сотрудничества. А еще там висят примеры интересных документов, которые можно легко найти по поисковому запросу. Среди них — запись о рождении Федора Достоевского, дочери Марины Цветаевой Ариадны, а еще информация о замужестве дочери Льва Толстого.

Для полного погружения в материал можно изучить еще и исследование, которое «Яндекс» провел в ноябре 2021-го. Тогда местные исследователи решили сравнить, как изменилась лексика русского языка за последние 100 лет. Они сопоставили между собой записи из личных дневников, которые были сделаны с 1900 по 1940 год, со статьями и комментариями в современных блогах. В результате получилось три подборки: в первой собраны уходящие и ушедшие из употребления слова, во второй — недавно приобретенные, а в третьей — те, что изменили свое основное значение.

Фото: кадр из фильма «Девятые врата»
Кино — 14:35, 14 марта
Что там на «Оскаре»: «Голубая луна», «Я бы тебя пнула, если бы могла», «Грешники», «Секретный агент», «Хамнет»
Интервью — 18:50, 13 марта
«Все колдуны, маги и рептилоиды». Фандомное интервью с телеведущим Ромой Каграмановым
Новости — 18:10, 13 марта
Кооперативный режим и механика мимикрии: вышел трейлер хоррор-игры Directive 8020
Новости — 16:00, 13 марта
Netflix снимет сериал о жизни Фриды Кало
Новости — 15:26, 13 марта
BTS показали обложку альбома Arirang