IBM научилась тренировать нейросети со скоростью света: как это работает
IBM сделала шаг вперед в развитии технологий для центров обработки данных. Компания разработала метод использования света для передачи данных внутри вычислительных систем. Это открытие способно ускорить обучение генеративных моделей ИИ в пять раз и одновременно сократить энергопотребление по сравнению с традиционными технологиями.
Основная проблема современных вычислений — это ограничение, связанное с использованием медных проводников. Электроны, движущиеся по проводам, часто становятся узким местом, из-за чего процессоры вынуждены простаивать, ожидая данных. Это приводит к росту энергозатрат и замедлению вычислений.
IBM решила эту проблему, создав новую систему Co-Packaged Optics (CPO). Ее основа — оптические соединения, которые используют свет вместо электричества для передачи данных. Компания разработала и протестировала первый успешный прототип Polymer Optical Waveguide (PWG). Эта технология обеспечивает передачу данных с терабитной скоростью и минимизирует задержки.
Почему это важно
Оптические соединения уже давно используются для передачи данных на большие расстояния через оптоволокно. Однако IBM стала первой, кто перенес эту концепцию внутрь компьютеров. Преимущество PWG в том, что она соединяет компоненты системы, такие как процессоры и серверы, со скоростью света и устраняет ограничения медных кабелей.
Благодаря новой технологии, обучение крупной языковой модели, которое раньше занимало три месяца, теперь можно выполнить всего за три недели. Это стало возможным благодаря 80-кратному увеличению пропускной способности между компонентами.
Энергоэффективность и масштабируемость
Еще один важный аспект технологии IBM — ее экологическая устойчивость. Использование CPO снижает энергопотребление настолько, что позволяет сэкономить электричество, достаточное для питания 5000 домов в течение года при обучении одной модели ИИ.
Кроме того, новая технология увеличивает гибкость архитектуры дата-центров. Оптические соединения могут работать на расстоянии до сотен метров, что позволяет инженерам проектировать более масштабные и эффективные системы. Как отметил Дарио Гил, старший вице-президент IBM по исследованиям: «Эта технология станет основой будущих вычислительных систем, где скорость и устойчивость будут ключевыми факторами».
Разработка компании подтверждает лидерство в области инноваций. Однако не только IBM двигает прогресс. На этой неделе Google представила мощнейший чип для квантовых вычислений.