[Перевод] Машинное обучение всё чаще используется в физике частиц04.09.2018 23:47

Эксперименты на Большом адронном коллайдере каждую секунду выдают порядка миллиона гигабайт данных. Даже после уменьшения и сжатия, данные, полученные на БАК всего за час, по объёму оказываются сравнимыми с данными, полученными Facebook за целый год.

К счастью, специалистам по физике частиц не приходится разбираться с этими данными вручную. Они работают совместно с разновидностью искусственного интеллекта, обучающегося вести самостоятельный анализ данных при помощи технологии машинного обучения.

«По сравнению с традиционными компьютерными алгоритмами, которые мы разрабатываем для проведения определенного вида анализа, мы делаем алгоритм машинного обучения так, чтобы он сам решал, какими анализами заниматься, что в результате экономит нам несчётное количество человеко-часов разработки и анализа», — говорит физик Александр Радович из Колледжа Уильяма и Мэри, работающий в нейтринном эксперименте Nova.
Радович и группа исследователей очертили круг текущего применения и будущих перспектив МО в физике частиц в сводке, опубликованной в Nature в августе 2018.

Просеивая большие данные

Чтобы обработать огромные объёмы данных, получаемых в современных экспериментах, — как те, что идут на БАК, — исследователи применяют «триггеры» — специальное оборудование, работающее совместно с ПО, в реальном времени решающее, какие данные оставить для анализа, а от каких избавиться.

На детекторе LHCb в эксперименте, который может пролить свет на то, почему во Вселенной материи гораздо больше, чем антиматерии, алгоритмы МО принимают по меньшей мере 70% подобных решений, говорит учёный Майк Уильямс из Массачусетского технологического института, работающий на LHCb, один из авторов упомянутой сводки. «МО играет роль почти во всех аспектах работы с данными в эксперименте, начиная от триггеров, и заканчивая анализом оставшихся данных», — говорит он.

Машинное обучение демонстрирует значительные успехи в области анализа. На огромных детекторах ATLAS и CMS на БАК, благодаря которым была открыта частица Хиггса, стоят миллионы сенсоров, сигналы которых необходимо свести вместе для получения осмысленных результатов.

«Эти сигналы составляют сложное пространство данных», — говорит Майкл Каган из Национальной ускорительной лаборатории SLAC Энергетического департамента США, работающий на детекторе ATLAS, и принимавший участие в создании сводки. «Нам нужно понять взаимосвязь между ними, чтобы сделать выводы — например, что определённый след частицы в детекторе оставил электрон, фотон или что-то ещё».

МО выгодно и для экспериментов с нейтрино. NOva, который обслуживает Фермилаб, изучает, как нейтрино переходят из одного вида в другой при путешествии сквозь Землю. Эти нейтринные осцилляции потенциально способны раскрыть существование новых типов нейтрино, которые, согласно некоторым теориям, могут оказаться частицами тёмной материи. Детекторы NOva выискивают заряженные частицы, появляющиеся, когда нейтрино сталкиваются с материалом в детекторе, а алгоритмы МО определяют их.

От машинного обучения к глубинному обучению

Недавнее продвижение в области МО часто называют глубинным обучением, и оно обещает ещё больше расширить область применения МО в физике частиц. Под ГО обычно имеют в виду использование нейросетей: компьютерных алгоритмов с архитектурой, вдохновлённой плотной густой нейронов человеческого мозга.

Эти нейросети самостоятельно обучаются определённым задачам анализа при помощи тренировки, когда они обрабатывают пробные данные, например, из симуляций, и получают обратную связь о качестве своей работы.

До недавнего времени успехи нейросетей были ограничены, поскольку их было очень сложно тренировать, говорит соавтор работы Казухиро Терао, исследователь со SLAC, работающий в нейтринном эксперименте MicroBooNE, изучающем нейтринные осцилляции в рамках краткосрочной программы Фермилаб. Эксперимент станет частью будущего Глубокого подземного нейтринного эксперимента. «Эти трудности ограничивали наши возможности работой с простейшими нейросетями глубиной в пару слоёв, — говорит он. — Благодаря продвижению алгоритмов и вычислительного оборудования, теперь нам гораздо больше известно о том, как создавать и тренировать более способные нейросети с сотнями или тысячами слоёв».

Многие прорывы в ГО обуславливаются коммерческими разработками технологических гигантов и тем взрывом данных, что они создали за последние два десятилетия. «К примеру, NOva использует нейросеть, сделанную по подобию архитектуры GoogleNet, — говорит Радович. — Это улучшило эксперимент до такой степени, которую можно было бы достичь, только увеличив сбор данных на 30%».

Плодотворная почва для инноваций

Алгоритмы МО день ото дня становятся всё более сложными и тонко настроенными, открывая беспрецедентные возможности для решения задач из области физики частиц. Многие из новых задач, для которых их можно применять, связаны с компьютерным зрением, как говорит Каган. «Это похоже на распознавание лиц, но только в физике частиц свойства изображений более абстрактны и сложны, чем уши или носы».

Данные некоторых экспериментов, например, NOvA и MicroBooNE, довольно легко можно превратить в настоящие изображения, и ИИ сразу же можно использовать для определения их особенностей. С другой стороны, изображения по результатам экспериментов на БАК сначала необходимо реконструировать на основе запутанного набора данных, полученных с миллионов сенсоров.

«Но даже если данные и не выглядят, как изображения, мы всё равно можем применять методы из компьютерного зрения, если правильно обработаем данные», — говорит Радович.

Одна из областей, в которых такой подход может оказаться очень полезным — это анализ джетов частиц, возникающих в большом количестве на БАК. Джеты — это узкие струи из частиц, следы которых чрезвычайно сложно отделить друг от друга. Технология компьютерного зрения может помочь разбираться в этих джетах.

Ещё одно новое применение ГО — симуляция данных по физики частиц, предсказывающих, допустим, что случится в столкновениях частиц на БАК, которую можно сравнить с реальными данными. Такого рода симуляции обычно работают медленно и требуют невероятно больших вычислительных мощностей. ИИ же мог бы проводить такие симуляции гораздо быстрее, что в итоге могло бы стать полезным дополнением традиционных методов исследований.

«Всего лишь несколько лет назад никому не могло прийти в голову, что глубинные нейросети можно натренировать на то, чтобы им «виделись» данные на основе случайного шума, — говорит Каган. — Хотя эта работа находится ещё на очень ранней стадии, она уже выглядит достаточно многообещающей, и, вероятно, поможет решать проблемы с данными в будущем».

Польза здорового скептицизма

Несмотря на очевидные прорывы, энтузиасты МО часто сталкиваются со скептицизмом со стороны их коллег, в частности, поскольку алгоритмы МО по большей части работают по типу «чёрных ящиков», не давая практически никакой информации по поводу того, как именно они пришли к определённому заключению.

«Скептицизм очень здоровый, — говорит Уильям. — Если мы используем МО для триггеров, отбрасывающих какие-то данные, как, например, на LHCb, то нам нужно чрезвычайно аккуратно подходить к этому вопросу и очень высоко задирать планку».

Следовательно, чтобы укрепить позиции МО в физике частиц, необходимо постоянно пытаться улучшать понимание того, как работают алгоритмы, и по возможности делать перекрестное сравнение с реальными данными.

«Нам постоянно надо пытаться понять, что делает компьютерный алгоритм, и оценивать его результаты, — говорит Терао. — Это справедливо для любого алгоритма, не только МО. Поэтому, скептицизм не должен тормозить прогресс».

Быстрое продвижение уже позволяет некоторым исследователям мечтать о том, что может стать возможным в недалёком будущем. «Сегодня мы по большей части используем МО для поиска особенностей в наших данных, способных помочь нам ответить на некоторые вопросы, — говорит Терао. — А лет через десять алгоритмы МО, возможно, сумеют самостоятельно ставить собственные вопросы и понимать, что обнаружили новую физику».