Обновление открытого аудиокодека Lyra 1.312.11.2022 17:02

Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0.

В отличие от предложенного в октябре выпуска Lyra 1.2, переведённого на новую архитектуру нейронной сети, в версии 1.3 проведена оптимизация модели машинного обучения без кардинальных архитектурных изменений. В новой версии для хранения весов и арифметических операций вместо 32-разрядных чисел с плавающей запятой задействованы 8-разрядные целые числа, что привело к сокращению размера модели на 43% и ускорению работы с моделью на 20% при тестировании на смартфоне Pixel 6 Pro. Качество при этом удалось сохранить на том же уровне. Значительное изменение номера версии обусловлено нарушением обратной совместимости на уровне формата кодируемых данных.

Источник: http://www.opennet.ru/opennews/art.shtml? num=58100