Google запускает распознавание речи в режиме офлайн

Всем известно, что Google предоставляет сервисы распознавания речи, но для этого требуется интернет-подключение для связи с искусственным интеллектом, однако скоро всё может поменяться.

Компания Google анонсировала систему офлайн распознавания речи, пока только для смартфонов Pixel. Благодаря отсутствию необходимости передавать данные, распознавание должно проходить быстрее и точнее. В своём блоге фирма сообщила, что она хочет создать новую систему распознавания, «достаточно компактную для размещения в телефоне», и работоспособную при отсутствии сети.

Клавиатура Gboard Клавиатура Gboard

Традиционная схема распознавания речи представляет собой разделение слов на маленькие части под названием фонемы. Затем система распознавания анализирует порядок, палитру и контекст фонем, чтобы собрать предложение. Всё это приводит к задержкам в распознавании, поскольку зачастую ПО ожидает полного произношения предложения.

Однако в блоге Google сообщила, что её новый офлайн AI использует модель «вывода символов одного за другим, по речи, с пробелами в нужных местах». Иными словами, клавиатура Gboard будет распознавать отдельные буквы при произношении слов, а не фонемы.

Сравнение распозавания речи на сервере и в офлайн режиме Сравнение распозавания речи на сервере и в офлайн режиме

Пока обновление Gboard работает лишь на смартфонах Pixel и поддерживает «Американский английский» язык. В будущем же количество поддерживаемых языков должно увеличиться.

Полный текст статьи читайте на nvWorld.ru