«РСК СКИФ»: к вершинам суперкомпьютинга

16 декабря состоялась традиционная встреча представителей СМИ с сотрудниками компании «РСК СКИФ», ведущего в России и СНГ разработчика и интегратора суперкомпьютерных решений нового поколения на базе архитектур корпорации Intel и жидкостного охлаждения. В ней приняли участие директор по технологиям НРС в регионе ЕМЕА корпорации Intel Андрей Сёмин, директор по развитию корпоративных проектов Intel в странах СНГ Николай Местер, технический директор компании «РСК СКИФ» Олег Дружинин, директор «РСК СКИФ» по корпоративным коммуникациям Олег Горбачев и исполнительный директор «РСК СКИФ» Алексей Шмелев.

РСК СКИФ

Андрей Семин, Олег Дружинин и Алексей Шмелев

Андрей Семин начал свое выступление с того, что в 2009 году объем рынка НРС сократился на 20% (по мнению экспертов компании Gartner) и восстановится он до своего докризисного уровня в ближайшие несколько лет, тенденции восстановления заметны уже в 2010 году. При этом количество проектов практически не изменилось, удлинились сроки их реализации. Есть области относительного благополучия - это государственные проекты, суперкомпьютеры, системы хранения.

НРС, по мнению г-на Семина, это лидерство. Традиционные информационные технологии нацелены на оптимизацию процесса, а НРС нацелены на создание принципиально новых возможностей. Очень важно понимать, что суперкомпьютеры без приложений - это просто самый дорогой обогреватель окружающей среды.

Г-н Семин отметил, что суперкомпьютеры востребованы в самых передовых отраслях современной науки. К примеру, они работают на Большом адроном коллайдере, где ежесекундно надо воспринимать и обрабатывать в режиме online терабайты данных, поступающих с экспериментальных установок ускорителя. Не менее востребованы они и в тех компаниях, которые занимаются рендеренингом видеоизображений, то есть восстановлением реальной видеокартинки. И все же не надо забывать, что подавляющая часть финансирования НРС происходит из государственных источников.

Андрей Семин специально подчеркнул. что крайне важно не только построить самый производительный суперкомпьютер, но и то, когда с его помощью станут доступны новые возможности. Очень важными параметрами для любого суперкомпьютера являются не только производительность, но и производительность на вложенный доллар, производительность на ватт и производительность на квадратный метр. Важно это потому, что счета за электричество для некоторых европейских суперкомпьютеров превышают десятки миллионов долларов в год, а эта сумма уже сравнима со стоимостью самого суперкомпьютера. Если подумать о том, что уже идет разговор не о петафлопных, а об экзафлопных компьютерах, то рядом с ними придется строить собственную атомную или тепловую электростанцию. Масштабы энергопотребления для таких суперкомпьютеров простираются до 500 мегаватт. И примерно столько же надо будет потратить на охлаждение всех систем. Любая инновация в области охлаждения суперкомпьютеров может приносить экономию в миллионы долларов в год.

Именно поэтому все компании, занимающиеся производством суперкомпьютеров уделяют, очень большое внимание проблемам охлаждения вычислительных узлов. При эффективном водяном охлаждении можно сэкономить до 50 миллионов евро в год. Водяное охлаждение своих суперкомпьютеров применяют многие компании - IBM, Fujitsu, Iceotope и «РСК СКИФ».

РСК СКИФ

Андрей Семин

Наиболее интересное решение - это охлаждение горячей водой, которое придумано и разрабатывается в компании «РСК СКИФ». Температура воды, входящей в компьютер, составляет 45-50 градусов Цельсия. Там она забирает тепло и выходит нагретая до 60 градусов. Ее охлаждение до рабочего состояния происходит просто через контакт с атмосферой без затраты энергии.

Г-н Семин выделил ключевые технологические области в НРС. Это оптимизация решений ЦОД для НРС, рабочие станции, файловые системы и системы хранения данных, ускорители и их место в НРС-решениях, межсоединение компонент НРС-систем (Infiniband), парадигмы разработки приложений, масштабирование всех компонент решения и облачные вычисления (SaaS).

Далее г-н Семин привел результаты исследования очень серьезной организации PRACE, связанные с производительностью и продуктивностью суперкомпьютеров. До сих пор самым простым способом получения наивысшей производительности остается программирование на MKL, языки UPC и CAF еще должны доказать свою готовность к работе, а X10 и Chapel пока недостаточно развиты для использования в массовом производстве.

Процессор Cell и материнские платы ClearSpeed очень производительны, но программирование для них трудоемко. Язык CUDA обеспечивает наилучшую производительность на графических ускорителях Nvidia, но программировать на нем достаточно сложно. Платформа RapidMind очень проста в программировании, но снижает производительность раза в три.

Г-н Семин подчеркнул, что НРС - это сложный комплекс взаимосвязанных технологий - от сверхчистых комнат до сверхточных алгоритмов.

По его словам НРС продолжает успешно развиваться в России. К сожалению, контекст НРС продолжает оставаться узконаправленным - на место в Тор500. Необходима консолидация общественного фокуса на качество и продуктивность российских НРС-решений. Пока в России нарастает количество установленных терафлопов и остается только ждать - произойдет ли переход количества в качество.

Подводя итоги своего сообщения, г-н Семин сказал, что важно не только насколько «быстр» суперкомпьютер, но и когда с его помощью станут доступны новые возможности для его пользователей, а также напомнил свою фразу о сложном комплексе взаимосвязанных технологий.

РСК СКИФ

Николай Местер

В процессе оживленной дискуссии после доклада г-н Местер обратил особое внимание на то, что отрасль суперкомпьютеров должна поддерживаться и развиваться с участием государства, поскольку НРС играют колоссальное значение не только для решения научных и экономических задач, но и для обеспечения обороноспособности страны. Таким образом НРС должны войти в ряд основных стратегических приоритетов любого государства, в том числе и России.

Далее об основных результатах работы компании РСК «СКИФ» рассказали Олег Горбачевым и Егор Дружинин. Для компании 2010 год был насыщенным и результативным.

В марте был завершен 1-й этап по созданию суперкомпьютера «СКИФ-Аврора ЮУрГУ» для Южно-Уральского государственного университета (Челябинск) c пиковой производительностью 24 TFLOPS. Он занял 8 место среди 50 мощнейших суперкомпьютеров СНГ согласно 12-ой редакции рейтинга Top50 (30 марта 2010 г.). Максимальная производительность на тесте Linpack - 21,86 TFLOPS.

В июне был реализован «под ключ» комплексный интеграционный проект инсталляции энергоэффективного суперкомпьютера «СКИФ-Аврора ЮУрГУ» - система запущена в тестовую эксплуатацию.

Вот технические характеристики этого суперкомпьютера. 256 двухпроцессорных узлов на базе Intel Xeon Х5570 (4 ядра с частотой 2,93 ГГц), жидкостное охлаждение на уровне системных плат. Суммарная емкость ОЗУ - 3 Тбайт. Память вычислительных узлов - 60 Тбайт, накопители Intel SSD. Потребляемая мощность решения всего 120 кВт (вычислительной стойки - 96 кВт). Высокоэффективный показатель использования электроэнергии Power Usage Effectiveness (PUE) для ЦОДа на уровне 1,2.

Общая площадь инсталляции меньше в 2,5-3 раза (всего 30 кв.м.) против обычных систем за счет применения жидкостного охлаждения. Отсутствие шума и вибрации. Г-н Горбачев подчеркнул, что сегодня компактность системы становится все более актуальной, поскольку площади ЦОД стоят несколько десятков тысяч долларов в год за квадратный метр. С уменьшением количества стоек и площади размещения установки снижается и количество соединительных кабелей, существенно упрощает стоимость обслуживания и повышает надежность.

В октябре 2010 г. заключен новый контракт на модернизацию и расширение суперкомпьютера «СКИФ-Аврора ЮУрГУ». Производительность суперкомпьютера вырастет более чем в 4 раза до 104 TFLOPS, система жидкостного охлаждения станет универсальной - сможет работать как на охлажденной, так и на горячей воде (в зависимости от погодных условий), что позволит экономить еще больше электроэнергии. Такой инновационный подход позволит создать не только самый энергоэффективный суперкомпьютер в России и странах СНГ, но и один из самых передовых по этому показателю в мировом масштабе. Как подчеркнул г-н Дружинин, в системе охлаждения используется не обычная вода, а жидкость типа антифриза, которая охлаждает автомобильные моторы. Она содержит присадки против коррозии. По словам г-на Дружинина, система охлаждения на горячей воде может использоваться на территории России практически круглый год и холодной зимой и даже самым жарким летом.

РСК СКИФ

Егор Дружинин

Проведена модернизация ранее установленной стойки суперкомпьютера - производительность увеличена до 40,7 TFLOPS путем замены 4-х ядерных на 6-ядерные процессоры Intel Xeon X5680 с частотой 3,33 ГГц (с сохранением всей текущей инфраструктуры). Дальнейшее масштабное расширение суперкомпьютера - вычислительный комплекс будет состоять из 2,5 стоек на базе 6-ядерных процессоров Intel Xeon X5680, суммарная производительность вырастет до 104 TFLOPS.

Среди наиболее ярких достижений 2010 года Алексей Шмелев отметил подписание контракта с Росгидрометом - будет осуществлена поставка и инсталляция пилотной системы для дальнейшего расширения мощностей вычислительного центра Росгидромета в рамках тендера Мирового Банка.

Подписан контракт с МФТИ на построение пилотной высокопроизводительной системы в рамках проекта, реализуемого по 220-му постановлению Правительства РФ и предполагающего создание в МФТИ лаборатории по разработке проблемно-ориентированных архитектур и ПО для задач в области биоинформатики.

Масштаб решений в обоих случаях будет соизмерим с суперкомпьютерным комплексом в ЮУрГУ, проекты могут состоять из нескольких этапов расширения.

В рамках развития партнерских отношений компания заключила соглашения с компаниями Super Micro, HP.

В планах на 2011 год - масштабное расширение проекта «СКИФ-Аврора ЮУрГУ» в Челябинске, реализация и представление проектов в Росгидромете и МФТИ. В разработке находится новый дизайн архитектуры суперкомпьютерного решения компании РСК с текущим кодовым названием Tawny. Разработка выполняется полностью в R&D подразделении компании. Реализация нового дизайна позволит сделать революционный шаг, сравнимый по уровню инновационности с принципом использования жидкостного охлаждения в системе «СКИФ-Аврора». Архитектура ориентирована на новый процессор Intel с кодовым названием Sandy Bridge. Планируется провести все этапы R&D и сделать упор на преимущественное производство всех ключевых элементов нового дизайна в России. Разработки и решения компании (по целому ряду показателей являющиеся наиболее передовыми не только в СНГ, но и на мировом уровне) планируется представить на европейской выставке International Supercomputer Conference (ISC'11).

В процессе обсуждения возник вопрос о том, какие задачи решаются на уже установленных суперкомпьютерах в России и в частности на суперкомпьютере ЮУрГу. Г-н Местер напомнил о конкурсе У.М.Н.И.К. Основная цель программы У.М.Н.И.К. Фонда содействия развитию малых форм предприятий в научно-технической сфере состоит в поиске молодых ученых, которые стремятся реализовать себя в инновационных проектах, и поощрение массового участия молодежи в научно-технических проектах путем их организационной и финансовой поддержки. Одной из победителей конкурса стала Ершова Арина Владимировна, (Южно-уральский государственный университет (ЮУрГУ), Челябинск) Тема работы - «Суперкомпьютерное моделирование итерационных методов и алгоритмов сильной отделимости для выпуклых многогранников». По мнению г-на Местера это не случайно, поскольку суперкомпьютер в университете дает возможность для решения самых разных задач и развития студентов. Именно это, по его словам, и есть ростки новой инновационной экономики, о которой так много говорится сейчас на разных уровнях. Очень важно и то, что сама структура ЮУрГУ адаптирована к экономическим нуждам региона, поэтому и на суперкомпьютере ЮУрГУ решаются действительно актуальные задачи.

Не менее важный вопрос - подготовка программистов для работы на суперкомпьютерах, этим активно занимается суперкомпьютерный консорциум университетов.

РСК СКИФ

После завершения обсуждения Андрей Семин дал короткое интервью нашему специальному корреспонденту.

THG.ru: Компания «Т-платформы», с которой у Intel самые хорошие партнерские отношения утверждает, что она контролирует более 80% российского рынка суперкомпьютеров. Почему вы поддерживаете компанию РСК «СКИФ», доля которой на этом рынке достаточно мала?

Андрей Семин: Потому, что это молодая и очень интересная компания. Нам очень импонирует ее инновационный подход к суперкомпьютерным решениям. Не могу предсказать, насколько яркими будут ее успехи в бизнесе, поскольку это зависит от целого ряда причин. Intel (и я, как его полномочный представитель в этом регионе) старается работать со всеми компаниями которые занимаются суперкомпьютерами, поскольку очень важно развивать этот рынок и расширять интерес к нему. Нас даже не удивляет и не огорчает тот факт, что начав работать с нами, компания «Т-платформы» начинает сотрудничать и с другими производителями процессоров. Если это на пользу рынку, то это хорошо.

Если говорить о тех компаниях, которые выводят на рынок НРС новые технологические решения, то компании «Т-платформы» и РСК «СКИФ» сравнимы друг с другом, несмотря на существенное различие тех долей, которые они занимают на рынке продаж. Эти две компании по уровню своей инновационной активности существенно оторвались от других.

THG.ru: Тот прорыв, который китайцы сделали в Тор500, это случайность или тенденция?

Андрей Семин: Это приказ партии (улыбается). У меня такое ощущение, что там сейчас будет происходить тот самый переход количества в качество, на который я надеюсь и в России. Я вижу, как китайское правительство инвестирует серьезные средства в локальные разработки. Хочу специально подчеркнуть, что в китайском суперкомпьютере, который вышел на первое место в Тор500, используется интерконнект собственной разработки. Это колоссальное достижение. Пока они использовали процессоры Intel, но я уверен, что это вопрос времени, и через несколько лет они начнут использовать свои собственные процессоры, свои собственные программы и алгоритмы. Это та часть айсберга, которая не видна, но она есть. Нет сомнений в том, что Китай через несколько лет станет одной из ведущих суперкомпьютерных держав.

Движение к этому идет по целому ряду направлений: они готовят специалистов за рубежом, какие-то технологии копируются, какие-то лицензируются, государство поддерживает все эти инициативы финансово. Интересно, что в начале 90-х годов по этому же пути шла Япония. Тогда им удалось сделать колоссальный задел на этом направлении, и до сих пор на они достаточно благополучно живут на импульсе двадцатилетней давности. Хорошо бы, чтобы и в России был сделан именно такой широкомасштабный прорыв, а не простое цитирование того, какое место занимает тот или иной суперкомпьютер в Тор500.

Ранее редакция THG.ru сообщала, что корпорация AMD заняла первое место в рейтинге суперкомпьютеров Top500, представленном на Международной конференции по суперкомпьютерам в Гамбурге. Гигантский суперкомпьютер Cray XT5 Jaguar, система производительностью 1,75 петафлопс, построенная на базе шестиядерных процессоров AMD Opteron, содержит почти четверть миллиона процессорных ядер.

©  Tom's Hardware