Телеканал «ТВ Центр» перевел из аудио в текст более 70 тысяч часов видеоконтента в облаке Яндекса24.11.2022 15:16

Федеральный телеканал «ТВ Центр» перевёл из аудио в текстовый формат крупнейший медиаархив на облачной платформе Yandex Cloud. Это 50 ТБ или более 70 тысяч часов телепередач, сериалов и документальных фильмов, сообщили Хабру в пресс-службе облачной платформы. За счёт транскрибирования телеканал настроил быстрый поиск по архивам и стал эффективнее использовать медиаконтент.

Ранее видеоархивы обрабатывали сотрудники телеканала. Они вручную размечали контент специальными поисковыми тегами, поэтому полнота и качество разметки были очень низкими. Для обработки 77 тысяч часов видео им понадобилось бы не менее 13 лет непрерывного просмотра. В облаке «ТВ Центр» не только упростил поиск по архивам для сотрудников, но и сократил количество инцидентов, связанных с неправомерным использованием контента.

Для транскрибирования контента телеканал использует облачный сервис синтеза и распознавания речи Yandex SpeechKit. Технология позволяет генерировать теги для поиска контента по событиям, локациям, именам. За один месяц удалось транскрибировать весь архив и настроить автоматическую обработку нового контента. В будущем «ТВ Центр» планирует настроить поиск контента по времени года, погоде и составу съёмочной группы.

В конце октября этого года разработчик диалоговых систем «АТС» и медицинская компания «Доктор Рядом» запустили голосовой «Анамнез-бот», созданный на базе Yandex SpeechKit. Благодаря боту перед приёмом у врача пациенты смогут голосом внести сведения о личном анамнезе в электронную медицинскую карту. Как указали в Yandex Cloud, решение позволяет врачам на 30% быстрее проводить опрос пациента и заполнять документы во время приёма. Новый голосовой бот уже доступен в более чем 500 российских клиниках.