Уже сложно представить общение в социальных сетях и мессенджерах без голосовых сообщений — самого простого инструмента, позволяющего быстро и живо передать информацию собеседнику. ВКонтакте давно заметили, что войсы становятся все более популярными, поэтому постоянно работают над усовершенствованием этой технологии. В последнем обновлении разработчики социальной сети сделали сразу два апгрейда: во-первых, теперь можно записывать голосовые сообщения длительностью до 60 минут, а во-вторых, соцсеть будет автоматически расшифровывать аудио длительностью две минуты.
ВКонтакте называют голосовые сообщения самой популярной функцией в социальной сети, превосходящей даже фотографии и файлы. При этом более 90% войсов, которые отправляют пользователи, длятся не дольше двух минут, то есть с обновлением в текст можно будет перевести абсолютное большинство отправляемых голосовых сообщений. Впервые функция распознавания появилась в социальной сети в начале лета. С того момента, как отмечают разработчики ВКонтакте, число пользователей, которые записывают аудиосообщения, увеличилось на 10%. На сегодняшний день 33 млн человек в месяц пользуется голосовыми сообщениями ВКонтакте. При этом каждый пользователь просматривает примерно по 8 расшифровок аудио в сутки.
Как алгоритмам удается превращать длинные голосовые в текст за секунды? Команда ВКонтакте объясняет, что для этого они используют технологию Voice Activity Detection. Алгоритм разбивает сообщение на несколько небольших частей и поочередно расшифровывает каждую из них. Потом все это формируется в одно целое, так и получается то, что пользователи видят на экране. Процесс распознавания происходит автоматически, команда разработчиков специально «тренирует» алгоритмы с помощью аудио, которые записывают участники программы VK Testers. «Наше решение состоит из нескольких нейросетей, выдерживает высокую нагрузку, понимает русскоязычный сленг и показывает хорошие результаты даже при сложных условиях записи — например, посторонних шумах или скомканной речи», — говорит старший разработчик Сергей Ларионенко.
Недавно ВКонтакте также вышло обновление «Клипов», сервиса для просмотра коротких вертикальных видео. Теперь тем, кто скролит ленту «Клипов» больше двух часов подряд, социальная сеть будет показывать оповещение, намекающее, что пора бы заканчивать. Согласно статистике ВКонтакте, пользователи в среднем смотрят по 20 видеороликов за раз, но некоторые могут просматривать их тысячами без перерыва. Новая функция должна помочь увлекающимся натурам не терять связь с реальным миром.