Meta* AI приблизила чтение мыслей без нейроинтерфейса к уровню мозговых имплантов
Исследователи из Meta представили новую версию системы Brain2Qwerty — одного из самых амбициозных проектов в области неинвазивных нейроинтерфейсов. Разработка позволяет преобразовывать активность человеческого мозга в текст без хирургического вмешательства, используя только внешнее сканирование магнитной активности мозга и современные модели искусственного интеллекта. Система приблизилась к уровню точности, который ранее считался достижимым исключительно для инвазивных интерфейсов с электродами, имплантированными непосредственно в кору головного мозга.
Главный научный результат работы заключается не только в рекордной точности распознавания, но и в демонстрации принципиально нового подхода к развитию нейроинтерфейсов. Если раньше считалось, что производительность систем «мозг — компьютер» ограничена физическими характеристиками датчиков, то исследователи показали обратное: ключевым фактором становится масштаб данных и способность ИИ извлекать смысл из чрезвычайно шумных сигналов.
Проект Brain2Qwerty v2 разрабатывался международной междисциплинарной группой специалистов по нейроинтерфейсам, вычислительной нейробиологии и машинному обучению под руководством команды Meta AI Brain & AI. Среди ведущих авторов работы — специалисты по вычислительной нейронауке и нейросетевым архитектурам, включая одного из руководителей исследований Meta на стыке когнитивных наук и искусственного интеллекта.
Для обучения Brain2Qwerty v2 исследователи собрали крупнейший на сегодняшний день набор данных неинвазивного декодирования речи. Девять добровольцев провели по 10 часов внутри установки магнитоэнцефалографии (МЭГ), набирая на клавиатуре заранее подготовленные предложения. В результате был сформирован корпус из 22 тысяч предложений, синхронизированных с высокоточной регистрацией мозговой активности.
Источник: MetaВ отличие от большинства предыдущих работ, использовавших сложные ручные конвейеры обработки нейросигналов, новая система построена как полностью сквозная архитектура глубокого обучения. Она получает на вход сырые данные МЭГ и самостоятельно выделяет закономерности, связывающие активность мозга с формированием текста. При этом модель работает сразу на нескольких уровнях представления информации — от отдельных символов до слов и целых предложений.
Одним из ключевых технологических новшеств стало использование больших языковых моделей, дообученных на нейрофизиологических данных. Вместо прямого сопоставления шумных сигналов мозга с буквами или словами система сначала преобразует нейронную активность в высокоуровневые семантические представления — своеобразное «пространство смыслов», уже сформированное внутри языковой модели. Благодаря этому Brain2Qwerty способна восстанавливать не только отдельные слова, но и общую смысловую структуру высказывания, даже если часть нейронного сигнала потеряна или искажена.
Дополнительную роль в разработке сыграли автономные ИИ-агенты. Они использовались не для декодирования мыслей напрямую, а для автоматизированного поиска оптимальных архитектурных решений и параметров обучения. По сути, исследователи позволили искусственному интеллекту выступить в роли инженера-разработчика, который многократно модифицировал и улучшал программный конвейер, после чего специалисты вручную отбирали наиболее эффективные конфигурации.
Полученные результаты оказались значительно лучше предыдущих достижений неинвазивных нейроинтерфейсов. Средняя точность распознавания составила около 61% слов, тогда как прежние методы обеспечивали лишь около 8%. Для наиболее успешного участника эксперимента система достигла 78% точности: более половины всех предложений были декодированы с одной ошибкой или менее.
Однако наиболее важным открытием авторы считают другое. Анализ результатов показал существование выраженной лог-линейной зависимости между объёмом обучающих данных и качеством декодирования. Иными словами, производительность Brain2Qwerty растёт по тем же законам масштабирования, которые ранее были обнаружены у больших языковых моделей. Это означает, что существующий разрыв между неинвазивными системами и хирургическими имплантатами может оказаться не фундаментальным физическим ограничением, а инженерной задачей накопления достаточного количества данных.
Фактически исследователи предлагают новую парадигму развития нейроинтерфейсов. Вместо создания всё более сложных и опасных имплантируемых устройств они предлагают использовать относительно безопасные внешние методы регистрации мозговой активности, компенсируя их физические ограничения возможностями искусственного интеллекта и масштабированием обучающих выборок.
Работа является частью долгосрочной программы Meta по созданию фундаментальных моделей мозга. Помимо Brain2Qwerty, компания развивает проекты Tribev2 для моделирования сенсорного восприятия, NeuralSet для масштабной обработки нейрофизиологических данных и NeuralBench для стандартизированной оценки нейросетевых моделей мозга. Одновременно Meta объявила о выделении $5 миллионов на развитие открытых нейробиологических датасетов в рамках инициативы Digital Brain Project.
Практическая цель проекта остаётся неизменной: создание безопасных и доступных нейроинтерфейсов, способных вернуть возможность общения людям, потерявшим речь или двигательную активность вследствие травм мозга, инсультов или нейродегенеративных заболеваний. Но значение работы выходит далеко за рамки медицины. Brain2Qwerty впервые показала, что путь к «чтению мыслей» может лежать не через более глубокое проникновение в мозг человека, а через более глубокое понимание его сигналов искусственным интеллектом.
© iXBT
