Apple научила Vision Pro контролировать инвалидные коляски

В преддверии Всемирного дня осведомлённости о доступности (Global Accessibility Awareness Day, GAAD), который отмечается 21 мая, Apple анонсировала масштабное обновление операционных систем с упором на специальные возможности.

Главным технологическим прорывом года стала интеграция умных алгоритмов в гарнитуру смешанной реальности и мобильные устройства. По заявлению генерального директора компании Тима Кука, внедрение платформы искусственного интеллекта Apple Intelligence позволило вывести инклюзивные функции на принципиально новый уровень, сохранив при этом базовые стандарты конфиденциальности пользовательских данных.

Ключевым нововведением стала система управления моторизованными инвалидными колясками с помощью пространственного компьютера Apple Vision Pro. Используя встроенную систему высокоточного отслеживания взгляда, функция предлагает отзывчивый метод ввода для совместимых альтернативных систем привода. Технология стабильно работает в различных условиях освещения и не требует частой повторной калибровки. Система совместима с приводными комплексами и поддерживает подключение как по беспроводному протоколу Bluetooth, так и через проводные аксессуары.

Основатель профильной организации по борьбе с боковым амиотрофическим склерозом GeoALS Пэт Долан (Pat Dolan), живущий с этим диагнозом уже 10 лет, назвал возможность самостоятельно управлять креслом на вес золота.

Источник: Apple

Серьёзные изменения затронули и классические функции доступности для незрячих и слабовидящих пользователей. Встроенный экранный доступ VoiceOver теперь задействует нейросети для генерации детальных текстовых описаний абсолютно любых изображений в системе. Это касается как фотографий без сопроводительного текста, так и отсканированных документов, счетов или личных записей. В режиме распознавания в реальном времени пользователь смартфона может просто зажать кнопку действия (Action button) на корпусе «Айфона», навести камеру на объект и задать уточняющие вопросы голосом, получая подробные развёрнутые ответы.

Аналогичным образом искусственный интеллект интегрирован в приложение «Лупа» (Magnifier), помогающее людям с низким зрением. Через кнопку действия они могут управлять интерфейсом с помощью простых разговорных фраз вроде «приблизь изображение» или «включи фонарик». Голосовое управление (Voice Control) также перешло на естественный язык: теперь пользователям не нужно заучивать точные названия кнопок или порядковые номера элементов на экране. Чтобы пролистать интерфейс, например, в картах или файловом менеджере, достаточно сказать: «нажми на путеводитель по лучшим ресторанам» или «открой фиолетовую папку».

Для работы со сложными текстами, такими как научные статьи с несколькими колонками, таблицами и графиками, обновлён инструмент «Доступное чтение» (Accessibility Reader). Нейросеть способна мгновенно составить краткую выжимку и аннотацию сложного материала, чтобы читатель мог ознакомиться с сутью работы перед изучением. Кроме того, инструмент получил функцию встроенного перевода на родной язык пользователя с полным сохранением исходного форматирования, оригинальных шрифтов и цветовой палитры документа.

Наконец, инженеры обновили систему генерации субтитров. В отличие от стандартных алгоритмов видеохостингов, новая функция создаёт автоматические текстовые расшифровки для личных видеороликов, роликов от друзей или медиафайлов из семейного архива. Весь процесс распознавания речи и наложения текста происходит локально на самом устройстве ради безопасности конфиденциальных данных. Функция автоматического создания индивидуальных субтитров будет по умолчанию встроена в новые версии операционных систем для смартфонов, планшетов, компьютеров, телевизионных приставок и гарнитур компании.

©  iXBT