IBM: «Элементарно, Watson!»

21 января компания IBM в российской лаборатории систем и технологий IBM провела презентацию, посвященную новым возможностям суперкомпьютерных технологий IBM. Суперкомпьютер IBM Watson, разработанный исследователями IBM, способен отвечать на вопросы, изложенные на естественном языке. Это доказывает первый тур интеллектуальной игры Jeopardy! (российский аналог «Своя игра»), в котором Watson обыграл абсолютных чемпионов Кена Дженнингса и Бреда Руттера.

IBM

Иэн Симпсон

Во время пресс-конференции Иэн Симпсон, директор Российской лаборатории систем и технологий, представил историю создания IBM Watson. Ирина Федулова, инженер-программист Российской лаборатории систем и технологий, рассказала об основных тенденциях развития суперкомпьютерных технологий IBM. С комментарием об игре Jeopardy! и участии в ней искусственного интеллекта выступил журналист, политический консультант Анатолий Вассерман, завоевавший титул «Лучший игрок десятилетия» на «Юбилейных играх» «Своей игры» в 2004 г. Андрей Филатов, директор департамента аппаратного обеспечения, IBM в России и СНГ, рассказал об использовании технологий POWER7 при создании суперкомпьютера Watson.

Г-н Симпсон начал с того, что IBM ежегодно инвестирует в исследования и разработки приблизительно 6 млрд. долларов и привлекает к работе ведущих исследователей с мировым именем. Watson служит ярким примером новаторства, реализуемого благодаря этим инвестициям компании и ее неизменной нацеленности на инновации.

Watson - это аналитическая вычислительная система, которая специализируется на анализе естественного человеческого языка и очень быстро выдает точные ответы на сложные вопросы. Watson демонстрирует настоящий прорыв в понимании компьютером естественного языка - реального языка, на котором общаются и обмениваются информацией люди, а не машинного языка, специально разработанного или закодированного для компьютеров.

IBM

Watson является полностью самодостаточной автономной системой - в том смысле, что она не подключена к Интернету. Используемая Watson технология понимает задаваемый вопрос, анализирует миллионы блоков информации, хранимой во внутренней памяти, и выдает максимально точный ответ, руководствуясь найденными фактическими данными.

Watson обрабатывает информацию, эквивалентную приблизительно 200 миллионам страниц контента, написанных на естественном человеческом языке, чтобы находить правильные ответы на сложные вопросы телевикторины Jeopardy!.

Jeopardy! - это шоу-викторина, охватывающая широкий спектр тем, таких как история, литература, политика, наука, искусство и сфера развлечений. Участие в игре Jeopardy! - чрезвычайно сложная задача для компьютера, поскольку машинный интеллект изначально не понимает естественный человеческий язык. Более того, Jeopardy! - это настоящий вызов для компьютерной системы из-за быстроты, с которой соперники должны давать правильные ответы на вопросы, а также из-за того, что для поиска точного ответа нужно анализировать содержащиеся в вопросах трудноуловимые ассоциации, скрытые значения, иронию, загадки и другие лингвистические и интонационные нюансы. В Jeopardy! игроки должны принимать решения, основываясь на своей уверенности, что им точно известен правильный ответ. Иными словами, здесь нужно делать то, в чем традиционно силен человек, а не компьютер.

IBM

Этой осенью система Watson провела более 50 спарринг-игр против прежних участников турнира «Tournament of Champ Jeopardy» на заключительном этапе подготовки к своему телевизионному дебюту. Кроме того, система Watson успешно прошла тот же тест для претендентов, который проходят люди при первичном отборе на участие в шоу «Jeopardy». Это обеспечило продюсерам «Jeopardy» уверенность в том, что предстоящее состязание будет интересным и конкурентоспособным.

Г-н Симпсон подчеркнул, что помимо участия в викторине «Jeopardy» лежащая в основе системы Watson технология может быть адаптирована для преодоления реальных проблем и достижения прогресса в различных областях. Эта компьютерная система способна просеять огромное количество данных и дать точные ответы, сопровождаемые оценкой их достоверности. К примеру, эта технология может быть с успехом применена для повышения точности диагностирования пациентов в здравоохранении, для совершенствования онлайновых систем поддержки, функционирующих по принципу самообслуживания, для предоставления туристам и гражданам конкретной информации по населенным пунктам, для повышения качества поддержки клиентов по телефону, а также во многих других областях.

Система Watson основана на процессорах Power 7 и для рассказа о них г-н Симпсон передал слово Андрею Филатову.

IBM

Андрей Филатов

Г-н Филатов сказал, что изюминкой нового процессора Power 7 является технология DRAM - размещения памяти на кристалле процессора. С ее помощью латентность в работе процессора уменьшена в 6 раз. Системы на базе процессоров POWER7 могут предложить лучший в отрасли показатель рентабельности инвестиций (ROI) благодаря существенному улучшению соотношения «цена/производительность» и совершенствованию технологий энергосбережения и виртуализации для консолидации серверов. Новые системы способны обеспечить в четыре раза большую производительность и в четыре раза большие возможности виртуализации при той же цене - и, при этом, они будут от трех до четырех раз более энергетически эффективны. По словам г-на Филатова, в России уже внедрены десятки решений на базе этих новых процессоров и в этих превосходстве убеждаются все новые и новые пользователи.

Ирина Федулова более подробно рассказала о проекте Watson. Но сначала она напомнила, что еще в 1952 году компьютер IBM играл с человеком в шашки, а потом даже стал самостоятельно совершенствоваться в мастерстве этой игры и в конце концов обыгрывал всех, кто пытался с ним соперничать. В 1956 году его даже показали по телевизору.

IBM

Ирина Федулова

В 1997 году компьютер IBM Deep Blue обыграл Гарри Каспарова в шахматы. Теперь настала очередь проекта Watson.

IBM создала Watson как часть своих усилий по содействию компаниям в извлечении ценных для бизнеса знаний из имеющихся массивов данных. Система Watson может анализировать смысловое значение и контекст естественного человеческого языка, и быстро обрабатывать информацию для поиска точных ответов на вопросы, заданные на этом естественном языке. Эти возможности таят в себе громадный потенциал, способный коренным образом изменить то, как компьютеры помогают людям решать их задачи как в бизнесе, так и в общественной и частной жизни.

Watson - это гигантский скачок вперед в способности компьютеров более адекватно реагировать на наши информационные потребности и более точно отвечать на наши вопросы. Watson доставляет информацию быстро, эффективно и в понятном для нас виде, извлекая нужные знания из огромного объема данных на естественном языке, с которыми люди сталкиваются ежедневно. Технология Watson может найти применение в самых разных областях, таких, например, как: быстрая и точная медицинская диагностика; экспресс-исследование потенциального взаимодействия лекарственных препаратов; помощь юристам в быстром поиске прецедентов среди множества ранее рассмотренных судебных дел; оперативный анализ возможных вариантов или альтернативных сценариев; помощь компаниям в интеллектуальной подготовке персонала отделов продаж.

Г-жа Федулова отметила, что Watson - это результат работы 25-ти ученых IBM Research в течение последних четырех лет. Назван компьютер был в честь основателя корпорации IBM Томаса Уотсона (Thomas J. Watson). Система Watson, оснащенная десятью аппаратными стойками серверов IBM POWER 750 под управлением ОС Linux, 15 Тбайт оперативной памяти и 2880 процессорными ядрами, способна выполнять 80 триллионов операций с плавающей запятой в секунду (80 терафлопс).

IBM

Watson - это продукт взрыва инноваций, появившихся вместе и в нужное время. В последние годы было сделано много значимых научных открытий в таких областях как технология обработки естественного языка (Natural Language Processing) и технология обучения вычислительных машин (Statistical Machine Learning). Эти открытия чрезвычайно важны в реализации возможностей компьютерных систем для распознавания и понимания естественного языка.

Кроме того, вычислительные системы лишь совсем недавно научились одновременно выполнять тысячи процессов на одном кластере быстрых машин, с доступом к огромным массивам памяти. Способность высокопроизводительной параллельной обработки данных, обеспечиваемая системами на базе процессоров IBM POWER7, критически важна для понимания Watson смыслового значения вопросов и быстрого - всего за три секунды - нахождения правильных ответов.

И, наконец, в последние годы мы является свидетелями взрывного роста цифровых знаний, представленных в форме текста на естественном языке (включая энциклопедии, словари, справочники, книги, киносценарии, новостные сообщения и многое другое). Это бум цифровой информации помогает снабдить Watson громадным объемом потенциальных знаний.

Ученым IBM Research удалось собрать все эти возможности воедино, и они создали уникальную систему Watson.

Watson - это революционное достижение в научной дисциплине под названием Question Answering (вопросно-ответная система). Программное обеспечение Watson функционирует на сервере IBM POWER7, который оптимизирован для обработки огромного числа задач, которые система Watson должна выполнять за короткое время с целью анализа сложных языковых конструкций и формирования правильных реакций на подсказки «Jeopardy». Эта система включает множество специализированных проприетарных технологий для удовлетворения требований по обработке огромного количества параллельных задач и данных при анализе информации в режиме реального времени.

Итак, Watson примет участие в телевикторине «Jeopardy», где будет состязаться с двумя самыми успешными и самыми знаменитыми из ее участников - Кеном Дженнингсом (Ken Jennings) и Брэдом Руттером (Brad Rutter). Первое в истории состязание человека с машиной на шоу «Jeopardy» будет выходить в эфир 14, 15 и 16 февраля 2011 г. - за эти три дня будет сыграно два матча.

Соревноваться с системой Watson будут два из самых знаменитых игроков, когда-либо участвовавших в викторине «Jeopardy» К. Дженнингс побил рекорд «Jeopardy» по максимальному количеству сыгранных друг за другом игр - на протяжении сезонов 2004-2005 г.г. он выиграл 74 игры подряд, что обеспечило ему выигрыш более $2,5 млн. Б. Руттер выиграл максимальное совокупное количество игр для одного участника «Jeopardy», что принесло ему 3255102 долл. Эта сумма - результат первого появления Руттера в «Jeopardy», состоявшееся 2000 г.), плюс три победы в турнирах «Jeopardy»: «Tournament of Champions» (2001 г.), «Million Dollar Masters Tournament» (2002 г.) и «Ultimate Tournament of Champions» (2005 г.).

«Большой приз» состязания составит 1 млн. долл., а призы за второе и третье места - 300 тыс. долл. и 200 тыс. долл., соответственно. Руттер и Дженнингс пожертвуют по 50% своего выигрыша на благотворительные цели, а корпорация IBM полностью пожертвует своей выигрыш на благотворительные цели.

Телевикторина «Jeopardy», дебютировавшая в 1984 г., 28 раз становилась лауреатом премии «Эмми» и вошла в Книгу рекордов Гиннесса как игровое телевизионное шоу, завоевавшее наибольшее число наград. По совокупности своих достижений «Jeopardy» занимает первое место в категории телевикторин - ежедневно ее смотрят почти 9 миллионов зрителей. Телевикторина «Jeopardy» производится компанией Sony Pictures Television, которая входит в состав корпорации Sony Pictures Entertainment Company. Дистрибуция внутри страны осуществляется компанией CBS Television Distribution, а международная дистрибуция - компанией CBS Television International. Обе вышеуказанных компании являются подразделениями корпорации CBS Corp.

Г-жа Федулова подчеркнула, что Watson - это лишь одно из достижений исследователей IBM. К 2012 году должен заработать суперкомпьютер «Секвойа» с производительностью 20 петафлопов, который возглавит список самых мощных суперкомпьютеров планеты. Он будет потреблять 6 мегаватт электроэнергии, что гораздо эффективнее современного энергопотребления. Далее г-жа Федулова отметила, что через 11-12 лет мощность суперкомпьютера с 500 места списка ТОР500 становится доступной обычному ноутбуку. То есть к 2025 году Watson будет находиться в ноутбуке каждого из нас.

IBM

Анатолий Вассерман

Анатолий Вассерман отметил, что Watson будет очень хорошо работать в медицине в рамках дифференциальной диагностики, то есть выявления правильного диагноза с похожими внешними признаками. Компьютер сможет задать дополнительные вопросы и установить правильный диагноз. Он сделает это даже лучше человека.

IBM

Г-н Вассерман подчеркнул, что подбор вопросов в Jeopardi! отличается от стиля вопросов в российской «Своей игре» и известном шоу «Что, где, когда». Российские вопросы не рассчитаны на знание, они ставятся таким образом, что даже не зная ответа, вы можете найти его путем рассуждений. Он привел несколько примеров подобных вопросов. С такими вопросами Watson вряд ли справится. На вопрос, «Сколько раз в своих произведениях Артур Конан-Дойль употребил выражение «Элементарно, Ватсон». Невозможно проштудировать все произведения и все пересчитать. А если подумать, то ответ - «ни одного раза». Эту фразу потом придумали режиссеры фильма.

IBM

Юрий Матвеев

В заключение мероприятия Иэн Симпсон объявил о вручении гранта победителям премии K. Alex Muller IBM Ph.D. Fellowship Award. Впервые за три года аспиранты российских университетов получили премию, поощряющую развитие молодых ученых и их инновационных исследований. Победителями, получившими чеки на сумму $5000, стали Юрий Матвеев, аспирант Научно-Исследовательского Ядерного Университета "Московского Инженерно-Физического Института", и Вячеслав Семеренко, аспирант Московского Физико-Технологического Института. Их работы в области фундаментальной физики признаны лучшим вкладом молодых ученых в развитие инноваций в этом году.

IBM

Вячеслав Семеренко

Грант для аспирантов по программе K. Alex Muller IBM Ph.D. Fellowship Award ежегодно вручается лучшим аспирантам, ставшим номинантами IBM Ph.D. Fellowship Award. Вручение премии призвано способствовать развитию молодых ученых и поддерживать научные исследования по всему миру. Последний раз российские студенты получали грант Alex Mueller Award в 2008 г.

Г-н Симпсон специально подчеркнул, что корпорация IBM таким образом отдает дань уважения доктору Карлу Алексу Мюллеру, лауреату Нобелевской премии по физике за открытия в области высокотемпературных сверхпроводников. Эта награда является высокой оценкой таланта и заслуг аспирантов, а также качества обучения в университете. Чек на денежную сумму $5000, эквивалентную размеру гранта, аспиранты могут использовать по собственному усмотрению, включая, в числе прочего, стипендию, оплату проезда на конференцию, расходы, связанные с диссертацией, и пр.

Ранее редакция THG.ru сообщала, что корпорация AMD заняла первое место в рейтинге суперкомпьютеров Top500, представленном на Международной конференции по суперкомпьютерам в Гамбурге. Гигантский суперкомпьютер Cray XT5 Jaguar, система производительностью 1,75 петафлопс, построенная на базе шестиядерных процессоров AMD Opteron, содержит почти четверть миллиона процессорных ядер.

©  Tom's Hardware