В России появилась система распознавания эмоций человека по видео и речи

MASAI скриншот
Интерфейс программы MASAI.Источник: new.ras.ru

Ученые Санкт-Петербургского Федерального исследовательского центра РАН разработали интеллектуальную программу MASAI. Она состоит из комплекса нейронных сетей, способных анализировать человеческие эмоции и настроение за счет анализа визуальных, аудиальных и текстовых данных. Новая технология открывает перспективы для создания цифровых ассистентов нового поколения, функционирующих на основе принципов эмоционального ИИ, говорится на сайте Росиийской академии наук.

MASAI построена на комплексе нейросетей, прошедших обучение на множестве открытых исследовательских баз данных, включающих мультимодальные записи (аудиовизуальная информация) представителей разных возрастов, полов и национальностей. Для формирования русскоязычной части базы привлекались студенты театральных учебных заведений, воспроизводившие широкий спектр человеческих эмоций.

Программа способна определять семь основных человеческих эмоций: радость, грусть, страх, отвращение, удивление, злость и спокойствие. Еще она может проводить сентимент-анализ информации — определять отношение человека (отрицательное, положительное или нейтральное) к какому-либо событию.

эмоции иллюстрация
Точность распознавания эмоций превосходит существующие аналоги и достигает 80%.Источник: Unsplash

Отечественное решение позволяет загружать и обрабатывать любые аудиовизуальные файлы через удобный интерфейс. Система автоматически проводит анализ поступившей информации и выдает результат распознавания эмоционального состояния и общего настроения. Заявленный показатель точности работы — 75−80%. По данным источника, результат превосходит ранее созданные аналоги.

«Система MASAI может быть встроена в различные виды цифровых помощников, которые сейчас используются во многих сферах жизни человека. Например, в телефонных службах скорой помощи или психологической поддержке, где эмоциональный искусственный интеллект позволит эффективнее реагировать на потребности человека», — объясняет руководитель Лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Алексей Карпов.

В настоящее время программа способна распознавать эмоции как по предварительно сохраненным аудиовизуальным файлам, так и в режиме реального времени. Она анализирует мимику лица и голосовые характеристики говорящего.

Ранее мы писали про первый в мире компьютерный вирус на базе ИИ.

Поделиться

©  HI-TECH@Mail.Ru