Один из крупнейших дата-центров Amazon отключился из-за перегрева

Один из крупных дата-центров Amazon Web Services (AWS) в американском штате Вирджиния был вынужден частично остановить работу из-за проблем с охлаждением и перегрева оборудования. Сбой затронул клиентов облачной платформы, включая криптобиржу Coinbase, которая сообщила о длительной недоступности ключевых торговых сервисов.

По данным AWS, инженерам компании пришлось ограничить часть вычислительных мощностей и перенаправить нагрузку в другие дата-центры региона. Проблема возникла в одном из объектов AWS в Северной Вирджинии — крупнейшем узле облачной инфраструктуры компании.

В официальном обновлении Amazon заявила, что «специалисты работают над подключением дополнительных мощностей системы охлаждения, чтобы восстановить оставшееся оборудование в пострадавшей зоне». Полное устранение последствий заняло несколько часов, однако отдельные сервисы продолжали работать с задержками и ошибками даже после объявления о восстановлении.

Иллюстрация: Nano Banana

Полноценные остановки дата-центров считаются крайне редкими событиями. Ещё реже происходят аварии, связанные именно с системами охлаждения. Для крупных облачных платформ стандартом считается доступность выше 99,99% времени.

Инцидент оказался особенно показательным на фоне стремительного роста энергопотребления индустрии искусственного интеллекта. Масштабные ИИ-модели требуют всё большего количества серверов, а значит — всё более мощных систем охлаждения. Именно дата-центры сегодня становятся одним из самых быстрорастущих источников потребления электроэнергии в технологическом секторе.

По оценкам различных исследований, дата-центры уже обеспечивают около 0,5% мировых выбросов углекислого газа. Учёные Корнеллского университета ранее предупреждали, что при нынешних темпах развития ИИ объём выбросов от дата-центров к 2030 году может достичь 24–44 миллионов тонн CO2 в год — это сопоставимо с появлением на дорогах нескольких миллионов дополнительных автомобилей.

Некоторые исследования также указывают, что крупные дата-центры способны локально повышать температуру окружающей среды на многие километры вокруг объектов из-за постоянного отвода тепла.

На этом фоне ситуация с AWS выглядит почти символично: инфраструктура, поддерживающая бум искусственного интеллекта и потребляющая всё больше энергии, сама столкнулась с последствиями перегрева. По мере роста вычислительных мощностей проблема охлаждения становится не просто инженерной задачей, а одним из ключевых ограничений для всей ИИ-индустрии.

©  iXBT