Физики обогнали искусственный интеллект при расчете фазовых переходов
Все-таки ИИ еще есть чему поучиться у человека
Нейронные сети — это алгоритмы, которые могут отыскать приближенное решение задачи путем обучения на доступных данных. Однако обычно неясно, как именно они этого добиваются. Два молодых физика из Базеля вывели математические формулы, позволяющие вычислить оптимальное решение без обучения сети.
Уже несколько лет физики используют нейронные сети для обнаружения фазовых переходов. Фазовые переходы знакомы нам из повседневного опыта, например, когда вода превращается в лед. Но они происходят и в более сложной форме, например, когда при переходе из одного фазового состояния в другое материал теряет намагниченность, или проводник переходит в сверхпроводящее состояние. Это фазовые переходы — второго рода. Рассчитать и предсказать такие переходы крайне непросто.
Джулиан Арнольд и Франк Шефер, два доктора философии из Базельского университета вывели математические формулы, с помощью которых такие фазовые переходы могут быть обнаружены.
Тренировки не нужны
Нейронная сеть обучается, систематически изменяя параметры во многих тренировочных раундах, чтобы ее прогнозы, все точнее соответствовали тренировочным данным. Такими обучающими данными могут быть картинки или результаты измерений физической системы с фазовыми переходами, о которых хотелось бы что-то узнать.
«Нейронные сети уже достаточно хорошо научились обнаруживать фазовые переходы, — говорит Арнольд, —, но как именно они это делают, обычно остается совершенно неясным». Чтобы изменить эту ситуацию и пролить свет на «черный ящик» нейронной сети, Арнольд и Шефер рассмотрели частный случай сетей с бесконечным числом параметров, которые, в принципе, также «проходят» бесконечное количество тренировочных раундов.
Вообще предсказания таких нейросетей всегда стремятся к некоторому оптимальному решению. Арнольд и Шефер взяли это за отправную точку для вывода математических формул, которые позволяют напрямую вычислить это оптимальное решение фактически без обучения сети. «Это значительно сокращает время вычислений, — объясняет Арнольд. — Время, необходимое для расчета нашего решения, равно времени одного тренировочного раунда небольшой сети».
Взгляд в сеть
Помимо экономии времени метод, разработанный базельскими физиками, имеет и то преимущество, что полученные уравнения дают некоторое представление о функционировании самих нейронных сетей.
На данный момент Арнольд и Шефер проверили свой метод на компьютерных моделях. Теперь они планируют применить его к реальным измерениям. В будущем это поможет находить неизвестные фазовые переходы, например, в квантовых симуляторах или в новых материалах.