[Из песочницы] Распределённые вычисления: краткое введение в проекты BOINC
Здесь многие слышали о программе распределённых вычислений BOINC, возможно, многие даже принимают в нём участие. Эта статья рассчитана в первую очередь на тех, кто не слышал об этом проекте, но, может быть, заинтересуется им. Здесь я приведу краткие описания самых популярных проектов.
BOINC — программный комплекс для быстрой организации распределённых вычислений. Состоит из серверной и клиентской частей. Первоначально разрабатывался для крупнейшего проекта добровольных вычислений — SETI@home, но впоследствии разработчики из Калифорнийского университета в Беркли сделали платформу доступной для сторонних проектов. На сегодняшний день BOINC является универсальной платформой для проектов в области математики, молекулярной биологии, медицины, астрофизики и климатологии. BOINC даёт исследователям возможность задействовать огромные вычислительные мощности персональных компьютеров со всего мира¹.
Суть заключается в том, что эта программа позволяет различным исследовательским, учебным заведениям или просто энтузиастам науки найти помощь у людей, которые готовы поделиться с ними процессорным временем. Задача, требующая значительной вычислительной мощности, разбивается на более простые части и рассылается различным людям, если решение является верным для своей части — сервер проекта начисляет определённое количество баллов участнику.
Многие участники организуются в команды и устраивают соревнования между собой в различных проектах.
Кратко изобразить этот процесс можно так:
В данный момент в сети BOINC насчитывается около 300 тысяч активных участников, что в сумме даёт более 9 миллионов компьютеров и производительность более 8 петафлопс (на момент написания статьи).
Список проектов
Здесь можно посмотреть статистику по всем активным проектам.
SETI@home
SETI (Поиск Внеземного Разума (Search for Extraterrestrial Intelligence)) — область науки, чьей целью ставится нахождение разумной внеземной жизни. Один из методов, известный как «радио SETI», заключается в использовании радиотелескопов для приёма узкополосных сигналов из космоса. Сигналы, не характерные для естественных явлений, будут служить доказательством использования внеземных технологий.
Раньше проекты ПВР использовали специальные суперкомпьютеры, расположенные у телескопа для анализа поступающей информации. В 1995 году, Дэвид Геди предложил использовать большое количество домашних компьютеров, подключённых к сети Интернет как виртуальный суперкомпьютер для анализа радиосигналов. Для изучения этой идеи он организовал проект SETI@home. Проект SETI@home был запущенн в мае 1999 года.
Rosetta@home
Проект Rosetta@home направлен на вычисление трёхерной структуры белков. Подобные исследования могут привести к созданию лекарств от таких заболеваний как ВИЧ, малярия, рак и болезнь Альцгеймера.
Более подробную информацию по целям и методам этого проекта можно найти здесь.
WorldCommunityGrid
Этот проект был запущен корпорацией IBM с целью производить расчёт в различных областях науки: расшифровка генома человека, разработка лекарства от вируса эбола, картирование химических маркеров различных типов рака, а также исследования в области возобновляемых источников энергии.
Список завершённых проектов
Einstein@Home
Einstein@Home направлен на определение местонахождения пульсаров, используя данные Лазерно-интерферометрической гравитационно-волновой обсерватории (LIGO), радиотелескопа Аресибо, космического гамма-телескопа Ферми (GLAST).
Сигнал, доказавший существование гравитационных волн был слишком коротким для обработки проектом, однако теперь производится подготовка данных для нового поиска продолжительных гравитационных волн по всему небу.
Climate Prediction
Проект просчитывает различные симуляции климатических моделей, что позволяет спрогнозировать, как изменится погода на Земле в будущем.
Malaria Control
Проект использует ресурсы компьютеров для стохастического моделирования эпидемиологии и естественной истории малярии вызываемой Plasmodium falciparum.
MilkyWay@Home
Проект направлен на создание высокоточных трёхмерных моделей Потока Стрельца, что даёт информацию о том, как сформировался Млечный Путь и как образуются приливные рукава во время столкновения галактик.
LHC@Home
Проект SixTrack симулирует 60 частиц, проходящих по кольцу БАК, симулируется от 100000 до миллиона циклов, что соответствует менее 10 секундам реального времени в ускорителе. Этого достаточно, чтобы проверить будет ли пучок сохранять траекторию на протяжении гораздо большего времени или существует риск потери стабильности пучка, что может привести к серьёзным проблемам в реальности, например, к остановки ускорителя или к выходу из строя некоторых детекторов.
PrimeGrid
Проект направлен на поиск простых чисел специального вида. Полный список подпроектов можно найти на официальном сайте.
Asteroids@home
Проект ставит целью увеличить объём информации о физических характеристиках астероидов. Программа обрабатывает данные фотометрических наблюдений разными приборами за разное время. Эта информация преобразуется методом инверсии кривой блеска, что позволяет создать 3D-модель формы астероида вместе с определением периода и направлением вращения вокруг своей оси.
Поскольку данные фотометрических наблюдений обычно растянуты во времени, период вращения не «виден» напрямую. Большой объём параметров должен быть проверен для определения оптимального решения. В подобных случаях инверсия кривой блеска занимает слишком много времени и распределённые вычисления — единственный выход эффективно разобраться с фотометрией сотен и тысяч астероидов. Кроме того, для обнаружения ошибок в методе и реконструировать подлинные физические параметры астероидов, необходимо обработать большой объём данных о «синтетических» объектах.
Изучение формы и других параметров астероидов позволит больше узнать об их реальных размерах, представляют ли они реальную угрозу, а в дальнейшем поможет определить подходящие цели для исследовательских миссий.
База 3D-моделей астероидов
Cosmology@Home
Проект направлен на поиски модели лучшим образом описывающую нашу Вселенную, и найти какая группа моделей подтверждает текущие данные, полученные теоретическими космологическими исследованиями и практическими физическими наблюдениями.
Yoyo@home
Проект состоит из пяти подпроектов, каждый из которых является проектом по поиску решения различных теоретических вопросов: от поиска нечётных странных чисел до проекта по моделированию работы мюонного коллайдера.
POEM@Home
Проект направлен на моделирование сворачивания белков, что в дальнейшем поможет точнее определять функцию белков по их структуре. Такие знания могут помочь в медицинских исследованиях.
theSkyNet POGS
Это астрономический исследовательский проект обработки данных с различных телескопов мира в разных диапазонах электромагнитного спектра. Проект объединяет GALEX, Pan-STARRS1 и WISE, чтобы создать многочастотный (ультрафиолетовый-оптический-инфракрасный спектры) атлас ближних к нам окрестностей Вселенной. Проект определяет физические параметры (звездная масса галактик, поглощение излучения пылью, масса пылевой компоненты, скорость образования звезд) для каждого пиксела, используя технику поиска оптимума для распределения спектральной энергии.
GPUGRID
Молекулярные симуляции, выполняемые проектом — одни из самых частых при работе учёных, но они также одни из самых ресурсоёмких, поэтому для их просчёта обычно используется суперкомпьютер. Как и в других биологических проектах BOINC, GPUGRID использует ресурсы компьютера для симуляции белков для лучшего понимания их структуры и разработки лекарств от различных болезней.
Полезные ссылки:
Версии BOINC для разных ОС
GitHub
BOINC Wiki
Русскоязычный сайт