Компания Google открыла недостающие исходные тексты для аудиокодека Lyra
Компания Google опубликовала обновление аудиокодека Lyra 0.0.2, оптимизированного для достижения максимального качества передачи речи при использовании очень медленных каналов связи. Кодек был открыт в начале апреля, но поставлялся в привязке к проприетарной математической библиотеке. В версии 0.0.2 данный недостаток устранён и для указанной библиотеки создана открытая замена — sparse_matmul, которая как и сам кодек распространяется под лицензией Apache 2.0. Из других улучшений можно отметить возможность использования сборочной системы Bazel с комплиятором GCC и использование данной связки по умолчанию в Linux вместо Bazel+Clang.
Напомним, что по качеству передаваемых голосовых данных на низких скоростях Lyra существенно превосходит традиционные кодеки, в которых используются методы цифровой обработки сигналов. Для достижения высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации, помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Задействованная для генерации звука модель обучена с использованием нескольких тысячах часов с записями голосов на более чем 70 языках. Производительности предложенной реализации достаточно для кодирования и декодирования речи в режиме реального времени на смартфонах среднего ценового диапазона, с задержкой передачи сигнала на уровне 90 миллисекунд.
Источник: http://www.opennet.ru/opennews/art.shtml? num=55424
© OpenNet