От часов до наушников: Яндекс создал сверхкомпактную нейросеть для носимых ИИ-устройств

Специалисты Яндекса разработали нейросетевую модель для голосового управления, размер которой составляет примерно 200 КБ. Об этом сообщил руководитель направления голосовой активации Дмитрий Солодуха.

Иллюстрация: Яндекс

В Яндексе подчеркнули, что это меньше объёма одной фотографии на смартфоне. Новая технология предназначена для носимых гаджетов, таких как наушники и умные часы, которые имеют строгие ограничения по ёмкости аккумулятора и вычислительной мощности. В отличие от смартфонов, система должна постоянно анализировать звук локально, не разряжая устройство и не создавая задержек.

Для оптимизации энергопотребления инженеры применили двухэтапный подход. Сначала сверхлёгкая модель определяет наличие речи в аудиопотоке. Основная нейросеть, отвечающая за распознавание команды, активируется только после этого. Ключевую роль в снижении нагрузки сыграла оптимизация самой модели, число параметров которой было сокращено примерно в 10 раз за счёт новой архитектуры.

Ещё одним из решений проблемы стало использование чипов с NPU — специализированным нейропроцессором для ускорения вычислений нейросетей с меньшим энергопотреблением по сравнению с CPU.

Напомним, Яндекс готовит к выпуску собственную линейку носимых ИИ-устройств, первыми из которых должны стать наушники «Яндекс Дропс» с «Алисой AI» и функцией «Моя память».

©  iXBT