«Алиса AI» поможет незрячим ориентироваться в пространстве с помощью камеры смартфона
Изображение сгенерировано нейросетью Midjourney
Изображение сгенерировано нейросетью Midjourney Мобильное приложение «Алиса AI» получило обновление, которое сделает его более полезным для людей с нарушениями зрения. Команда Яндекс адаптировала Live-режим, позволяющий в реальном времени получать информацию об окружающем мире через камеру смартфона.
Новая функция призвана помочь незрячим и слабовидящим пользователям в повседневной жизни. Наведя камеру на объект, человек может голосом задать вопрос и получить ответ от нейросети. Например, можно узнать, с какой стороны находится вход в магазин, что написано на дисплее бытовой техники или какие продукты лежат в холодильнике и что из них можно приготовить.
В основе технологии лежит мультимодальная нейросеть Alice AI VLM, способная распознавать объекты и описывать их. Диалог с «Алиса AI» происходит в голосовом формате, а история запросов сохраняется в чате. По словам менеджера по цифровой доступности Яндекса Анатолия Попко, эта технология является инструментом для самостоятельной ориентации в пространстве и решения бытовых задач без посторонней помощи.
Включить Live-режим можно в меню приложения или голосовой командой. Функция доступна бесплатно на устройствах Android и iOS. При этом активировать режим голосом пока могут только пользователи Android, но в Яндексе обещают добавить эту возможность и для iOS-устройств в ближайшее время. Обновление было представлено на фестивале Young Con в Москве.
© iXBT
