Представлено носимое устройство, которое преобразует беззвучную речь в голос
Исследователи из Университета науки и технологий Пхохана (POSTECH, исследовательский университет в Южной Корее) разработали носимую технологию, способную преобразовывать беззвучную речь в слышимый голос.
Технология основана на том, что речь — это не только звук. Даже при беззвучной артикуляции мышцы и кожа в области шеи совершают микродвижения, формируя характерные паттерны, соответствующие произносимым словам. Чтобы фиксировать эти движения, команда создала мультиосевой сенсор деформации.
Сенсор выполнен из гибкого силикона с датчиками и способен улавливать мельчайшие изменения поверхности кожи. Устройство предназначено для повседневного использования и автоматически калибруется при изменении положения на шее, что позволяет сохранять точность без ручной настройки.
Собранные данные обрабатываются системой на базе искусственного интеллекта, которая интерпретирует паттерны деформации и восстанавливает предполагаемые слова или предложения. После этого система синтезирует голос на основе профиля пользователя, стремясь максимально точно воспроизвести индивидуальные особенности речи, даже если звук изначально не издавался.
Иллюстрация: Nano BananaТрадиционные методы восстановления речи, такие как электромиография (EMG) и электроэнцефалография (EEG), требуют громоздкого оборудования и плохо подходят для длительного использования. В разработке POSTECH эти ограничения устранены: система компактна, а в испытаниях показала высокую точность даже в условиях шума, где обычные микрофоны работают нестабильно.
Разработчики рассматривают широкий спектр применений технологии. В первую очередь — помощь людям, потерявшим голос из-за повреждения голосовых связок или операций на гортани: система позволяет им снова «говорить» своим голосом. Также возможны сценарии беззвучного общения — например, в библиотеках, на совещаниях или в шумной рабочей среде.
Исследование также указывает на потенциал более естественного взаимодействия человека и искусственного интеллекта, где команды могут передаваться без голосового ввода. В дальнейшем команда планирует повысить точность системы и расширить языковую поддержку.
Будущие версии устройства могут быть интегрированы в потребительские гаджеты, что, по мнению авторов, способно изменить способы коммуникации в повседневной и профессиональной среде.
«Слияние искусственного интеллекта и носимых технологий, как в этом проекте, сигнализирует о переходе к более интуитивным и ненавязчивым формам взаимодействия, где даже невысказанные слова могут быть услышаны», — отмечают авторы исследования.
© iXBT
