Наш публичный детектор голоса стал лучше

d9eeea04bb73fb9fdd0d0c03807e8eca.png

Мы очень подробно рассказывали про наш детектор голоса на Хабре тут и тут. Не вижу смысла повторяться, просто очень кратко опишу, что стало лучше:

  • В некоторых сценариях он стал до 2–3 раз быстрее. ONNX вообще отрабаытывает за ~200ns на 1 чанк. Скорость теперь измеряется уже наносекундах =);

  • Сильно выросло качество (в этот раз мы проилюстрировали это на публичных датасетах) и насколько мы знаем среди сопоставимых публичных решений (отсутствие какой-либо формы DRM, стриминг, скорость, очень малый чанк 30ms) аналогов нет;

  • Теперь ONNX модель также поддерживает аудио и в 8 kHz;

Вот как-то так, изменения огромные, но сказать больше особо и нечего.

© Habrahabr.ru