IBM и MIT хотят научить искусственный интеллект видеть и слышать, как человек07.10.2016 09:22

IBM начала долгосрочное сотрудничество с Массачусетским технологическим институтом (Massachusetts Institute of Technology, MIT), подразделением Department of Brain & Cognitive Sciences. В рамках нового проекта создана лаборатория, которая будет заниматься разработкой когнитивных компьютерных систем, способных понимать и анализировать данные из внешних источников, подобно человеку. В первую очередь, речь идет об аудио и визуальной информации. Полученные данные компьютер должен уметь использовать для построения картины мира, который его окружает.

По мнению специалистов, когнитивные «умные» системы могут быть использованы в таких отраслях, как здравоохранение, образование, развлечения. Проще говоря, объединенная команда IBM-MIT будет обучать машины понимать то, что они видят и слышат. Например, для человека не представляет особой сложности описать все, что он увидел в коротком ролике. Машины пока не могут справиться с этой задачей, поскольку им требуется надежная система распознавания изображений и образов.
Представители BM3C, среди прочих задач, займутся разработкой таких систем. Кроме понимания увиденного, машины постараются обучить делать выводы и прогнозы, исходя из полученных данных. Человек может строить предположения о том, что произойдет в ролике или фильме дальше. Компьютеры на это не способны.

Над реализацией задач проекта работает объединенная команда специалистов, включая нейрологов, специалистов по машинному обучению, программистов и представителей других профессий. Кроме видео, машины будут обучать понимать и аудиосигналы, о чем говорилось выше. Понимание лишь визуальной информации не позволяет получить полное представление о происходящем вокруг (или на экране). Поэтому компьютеры должны уметь анализировать и аудиопотоки, обрабатывая такие данные при помощи специальных алгоритмов.

«В мире, где люди и машины работают вместе долгое время, прорыв в сфере компьютерного зрения потенциально может привести к значимым результатам в сфере здравоохранения», — заявил Гуру Банавар, представитель IBM Research. «Сочетая вместе достижения науки о мозге и компьютерной науки, мы можем решить ряд сложных проблем».

Главой BM3C стал профессор Джеймс Ди Карло, глава подразделения Department of Brain & Cognitive Sciences (BCS) в MIT. В рамках проекта будут активно использоваться и возможности когнитивной платформы IBM Watson.

«Мы довольно много понимаем уже в том, каким должен быть ИИ, но все текущие наработки имеют один недостаток — компьютеры и мы интерпретируем информацию о внешнем мире по-разному», — заявил Ди Карло.

«Наши ученые с нетерпением принялись за работу совместно с учеными и инженерами из IBM. Наша цель — создать новое поколение когнитивных систем. Мы считаем, что компьютерное зрение и слух — это важные составляющие таких систем», — говорит Ди Карло. Способность быстро делать выводы из увиденного и услышанного с возможностью прогнозировать будущие события у компьютерных систем может быть очень полезной. К примеру, «умные» роботы смогут профессионально ухаживать за людьми или же работать на производстве.

Компьютерные системы будут взаимодействовать с сотрудниками BM3C в процессе «общения», с обменом информации различных типов. Когнитивные системы, которые ученые надеются разработать, должны будут понимать человека в той либо иной степени. Ключевой элемент успеха в разработке таких систем — объединение машинного обучения, машинного зрения, логики, специальных алгоритмов по работе с внешними данными.

Сейчас наша компания работает более чем с 250 университетами по всему миру. В различных проектах IBM принимают участие 3000 исследователей и 13 лабораторий, расположенных на шести континентах.