Новости — 25 января 2023, 14:24

«Яндекс» запустил «Поиск по архивам» — сервис, который позволяет расшифровывать архивные документы

Помогает в поиске архив, в базе которого сейчас находится более 2,5 млн старинных документов, собранных из московских, оренбургских и новгородских хранилищ. Но количество фондов и источников будет постоянно увеличиваться, а значит, электронный каталог будет регулярно пополняться. Поэтому, если сервис не помог решить задачку прямо сейчас, вероятно, через пару месяцев он уже справится с задачей. Проверить это можно на официальной странице «Поиска по архивам».

Инструмент только-только запустился. Для старта разработчики отобрали наиболее востребованные материалы вроде метрических книг с записями рождений, смертей и браков, исповедные ведомости, в которых есть списки прихожан церквей, а также ревизские сказки с результатами переписей населения. Для более точного поиска можно настроить фильтры: выбрать тип документов, фонды, временной промежуток и даже название дела.


Помимо поиска по текстам архивных документов, инструмент позволяет изучить каталог и расшифровать рукописи. Нейросеть понимает даже самые витиеватые почерки и может справиться со сложной дореволюционной орфографией. Сервис работает на базе технологии оптического распознавания текста «Яндекса». Искусственный интеллект узнает утратившие актуальность символы, учитывая при этом особенности почерка, и за несколько секунд превращает старинные и непонятные записи во внятный печатный текст. Кроме того, нейросети помогают эксперты. Они регулярно обучают алгоритмы распознавать рукописные тексты и следят за качеством расшифровки.

На сайте даны четкие рекомендации, как лучше обращаться с сервисом для более плодотворного сотрудничества. А еще там висят примеры интересных документов, которые можно легко найти по поисковому запросу. Среди них — запись о рождении Федора Достоевского, дочери Марины Цветаевой Ариадны, а еще информация о замужестве дочери Льва Толстого.

Для полного погружения в материал можно изучить еще и исследование, которое «Яндекс» провел в ноябре 2021-го. Тогда местные исследователи решили сравнить, как изменилась лексика русского языка за последние 100 лет. Они сопоставили между собой записи из личных дневников, которые были сделаны с 1900 по 1940 год, со статьями и комментариями в современных блогах. В результате получилось три подборки: в первой собраны уходящие и ушедшие из употребления слова, во второй — недавно приобретенные, а в третьей — те, что изменили свое основное значение.

Фото: кадр из фильма «Девятые врата»
Новости — 19:50, 21 ноября
«Яндекс Карты» научились строить маршруты с теплыми остановками
Новости — 19:43, 21 ноября
Лука Гуаданьино снимет фильм «Сержант Рок» с Дэниелом Крэйгом
Новости — 17:00, 21 ноября
«Манифестировать» стало словом года по версии Кембриджского словаря
Новости — 14:50, 21 ноября
Netflix объявил дату премьеры сериала «Нулевой день» с Робертом Де Ниро
Новости — 12:38, 21 ноября
Джерард Батлер и Мейсон Теймз в трейлере ремейка «Как приручить дракона»