Андрей Семин (Intel): «Knights Corner - производительность вырастет в разы»

На суперкомпьютерной конференции (International Supercomputing Conference, ISC 2011) в Гамбурге, Германия, технический директор Intel по НРС в регионе ЕМЕА Андрей Семин дал эксклюзивное интервью нашему специальному корреспонденту Александру Семенову

Intel

THG.ru: Какие наиболее интересные события вы хотели бы отметить на этой конференции?

Андрей Семин: Наверное вы помните, как на прошлой конференции здесь же в Гамбурге Кирк Скауген анонсировал нашу новую микроархитектуру MIC. Тогда же он сказал, что Intel предоставляет эту микроархитектуру в распоряжение ведущих производителей ПО и аппаратного обеспечения для совместной разработки решений на ее основе. На этой конференции мы рассказали о том, что было сделано за год.

Большая часть прошедшего года была потрачена на разработку ПО, в частности, на реализацию модели программирования, которая позволяет переносить написанные ранее комплексы программ на новую микроархитектуру. В отличие от ситуации с графическими процессорами, здесь не требуется переписывать все приложения или значительные его части используя новые языки программирования. Можно продолжать программировать на С, С++ или Фортране, как это делалось в течение последних десятилетий для работы на Xeon, Power, SPARC и векторных процессорах в секторе высокопроизводительных вычислений. Все эти программы будут работать на сопроцессоре MIC практически без изменений. Те же приемы, которые позволяют добиться оптимальной производительности на процессорах Intel (масштабирование приложений на ядра и потоки, оптимальное расположение данных программы в иерархии памяти и кэша, векторизация) используются для достижения максимальной эффективности в Intel MIC. Новая архитектура избавляет компании-разработчики и ИТ-отделы от необходимости переобучения всех своих разработчиков новым моделям и языкам программирования и переписывания кода.

Г-н Скауген рассказал о результатах нашего сотрудничества с несколькими ведущими клиентами Intel, среди которых KISTI, LRZ (это вычислительный центр имени Лейбница в Мюнхене), Julich, CERN и другие. Эти центры были выбраны, потому что на их компьютерах считаются самые разные приложения и в каждом из них работает более тысячи пользователей. Переписывать каждое из такого количества приложений просто нереально. А с помощью предлагаемой Intel методики перенос приложения на архитектуру Intel MIC (перекомпиляция с возможно небольшими добавками директив компилятора) происходит буквально за полчаса. Над созданием такого компилятора и библиотек к нему и работал Intel с партнерами в течение года. Процесс был достаточно трудоемким, но он уже показал первые успешные результаты.

Сейчас мы инициируем вторую стадия этого проекта - организация доступа к Intel MIC гораздо большего количества пользователей для апробации нового программного обеспечения на максимально широком количестве приложений. Такая совместная работа разработчиков Intel в тесном контакте с пользователями очень эффективна, поскольку происходит обмен информацией и корректировка функционала ПО в режиме реального времени. Количество ранних пользователей сопроцессоров MIC достигнет 50 этим летом, и будет расширена до 100 до конца 2011 года.

Хочу специально подчеркнуть, что доступ к нашим новым ускорителям Intel MIC все участники работ получают совершенно бесплатно. Некоторые наши конкуренты в аналогичных случаях продают доступ к своим новым продуктам. Intel считает, что пока продукт не выведен на рынок со всем необходимым для него программным обеспечением и экосистемой поддержки, его нельзя продавать.

Ситуация развивается благодаря совместному интересу, как со стороны Intel - в максимальном учете всех пожеланий пользователей, выявлении ошибок и т.п., так и со стороны большого количества пользователей - в получении предварительного доступа к самым новым платформам Intel, подготовке к работе с ними. В итоге пользователи получат не только новый высокопроизводительный и недорогой продукт, но и возможность использовать на нем уже имеющуюся инфраструктуру приложений без необходимости переписывания кода. Это очень важно, поскольку переписывание кода с одного языка на другой дело не творческое и потому утомительное. Решая эту проблему, Intel экономит массе людей много часов жизни, которые они могут использовать для достижения более важных целей, чем трансляция текстов программ с одного языка программирования на другой.

THG.ru: Сколько ядер в этом новом продукте Intel MIC, на котором идет отладка ПО?

Андрей Семин: На данном этапе для бета-тестирования используется сопроцессор Knights Ferry с 32 ядрами. Каждое из этих ядер - это стандартное ядро с архитектурой x86, оно имеет четыре потока гипертрейдинга, поэтому приложение может использовать до 128 потоков. Все ядра расположены на одном процессоре и имеют общий когерентный кэш размером 8МБ интегрированный на тот же кристалл сопроцессора. У PCI Express карты Knights Ferry сейчас установлено до 2 Гбайт оперативной памяти типа GDDR5.

Первый коммерчески доступный продукт с микроархтитектурой MIC имеет кодовое название Knights Corner. Он будет выпускаться по технологии 22 нанометра в недалеком будущем, будет иметь более 50 ядер. Одна из очень важных частей того бета-тестирования, которое идет сейчас, состоит в том, чтобы убедиться, что приложения эффективно распараллеливаются и используют векторные инструкции MIC. О точных сроках выпуска говорить пока рано, но мы планируем выпустить его в следующем году: мы готовим выпуск Knights Corner на основе 22-нанометрового процесса с транзисторами 3-gate, что позволит достичь нового уровня про производительности и энергоэффективности.

THG.ru: Принимали ли участие в разработке новых компиляторов российские разработчики?

Андрей Семин: Да. В России более 1300 разработчиков Intel. Существенная часть из них принимает участие в разработке нового программного обеспечения для MIC, поскольку компиляторы, библиотеки и отладчики производительности для платформ Intel традиционно разрабатываются в России. Те результаты, которые показывает Knights Corner на стенде Intel на этой выставке, основаны на использовании библиотек, оптимизированных именно в России. Естественно, разработка любых продуктов в Intel ведется распределенно, и разработчики находятся в разных странах, но россияне внесли очень существенный вклад. Стоит вспомнить, что буквально неделю назад на праздновании 20-летия корпорации Intel в России директор Intel по разработкам ПО Уильям Сэвидж, подчеркнул, что самая большая группа его разработчиков трудится именно в России.

THG.ru: Можно ли оценить, какова будет производительность Knights Corner в терафлопах?

Андрей Семин: Пока очень трудно сказать, есть целый ряд параметров, которые будут уточнены в процессе разработки и производства. К ним в частности относится, частота работы и точное количество ядер, выход годных процессоров по 22-нанометровому процессу, и т.д. Это многопараметрическая оптимизационная задача и пока никаких точных цифр мы не называем. Ее оптимальное решение позволит нам сделать продукт производительным, энергоэффективным и доступным по цене. Единственное, в чем мы уверены, что продукт будет конкурентоспособен на рынке. Уже сегодня на нашем стенде мы демонстрируем сервер высотой 4U с восемью карточками прототипами Knights Ferry достигающими в совместной работе производительности в 7.4 ТФЛОПС на реальном приложении, что превышает 900 ГФЛОПС в перерасчете на каждый из этих сопроцессоров.

THG.ru: Сейчас для достижения производительности 40 терафлопс нужно собрать стойку высотой два метра. Какое место будет занимать кластер на основе Knights Corner, когда она будет выпущен?

Андрей Семин: Плотность вычислений будет зависеть как от решения, которое выберет ОЕМ, в частности для системы охлаждения: упомянутые 40 ТФЛОПС в стойке с процессорами Intel Xeon достигаются за счет использования передовой системы жидкостного охлаждения. Но также плотность будет зависеть от конечного заказчика, который должен будет определить сколько сопроцессоров устанавливать для каждого центрального процессора Xeon. В любом случае с выходом Knights Corner производительность сегодняшнего сервера или стойки того же размера вырастет в несколько раз. Можно сказать и по-другому: энергопотребление на один терафлопс производительности снизится так же в разы.

THG.ru: Значит с помощью Knights Corner проблема распараллеливания вычислений будет решена?

Андрей Семин: Сейчас мы в первую очередь работаем с приложениями, которые хорошо распараллеливаются и на Xeon. И проблема распараллеливания на большое количество потоков в высокопроизводительных вычислениях стоит отдельно от создания ускорителя вычислений. Решать задачи по эффективному распараллеливанию большего количества приложений надо продолжать так как это позволит увеличить скорость работы как на MIC так и на Xeon. Мы демонстрируем наше решение на этой выставке, прежде всего, потому, что в НРС много приложений, которые хорошо распараллеливаются и успешно работают на тысячах ядер.

THG.ru: Почему вы называете Intel MIC сопроцессором, а не процессором?

Андрей Семин: Дело в том, что для его работы требуется процессор класса Xeon, и сопроцессор MIC устанавливается в слот PCI Express стандартного сервера. С помощью узла Xeon происходит загрузка программы и данных приложения. При этом разные части приложения могут параллельно работать как на Xeon так и на MIC: таким образом, MIC не создается чтобы заменять Xeon: его задача выполнять работу в дополнение к Xeon, выполняя хорошо распараллеленные части приложения. При этом те части приложения и алгоритмы, которые не масштабируются на большие количества ядер будут работать лучше на Xeon с его более высокой частотой ядра.

THG.ru: Спасибо большое за очень интересное интервью.

Редакция THG.ru не раз рассказывала о впечатляющей производительности платформы Sandy Bridge для настольных систем. Но значит ли это, что новейшая архитектура Intel также сможет доминировать и на рынке однопроцессорных серверов и рабочих станций? Чтобы ответить на этот вопрос, мы заставили самый быстрый Xeon из новой серии пройти через наш стандартный набор бенчмарков. Подробнее о возможностях новинки рассказывается в статье «Intel Xeon E3-1275: Sandy Bridge вступает на рынок серверов».

©  Tom's Hardware