Известные проекты, демонстрирующие силу облаков на OpenStack

Walmart, China Mobile, большой адронный коллайдер и даже игры Blizzard Entertainment — все используют OpenStack. Однако, делают это по-своему.

OpenStack — решение для организации облачных сред с открытым исходным кодом, которое обладает большой гибкостью и возможностями настройки. Поэтому решение справляется, как с рядовыми задачами, так и с высоконагруженными конфигурациями.

Хотя про OpenStack говорят не так активно, как 5 лет назад, он никуда не уходил. Напротив: всё больше компаний присматриваются к нему. Например, мы в «Инферит Облако» построили инфраструктуру именно на этом решении. 

Сегодня вспоминаем четыре облачных проекта, которые стали возможны благодаря гибкости и возможности масштабирования OpenStack.

CERN (Европейская организация ядерных исследований)

Внутри дата центра CERN. Фото superuser.openinfra.dev

Внутри дата центра CERN. Фото superuser.openinfra.dev

Главный проект CERN — большой адронный коллайдер. Эксперименты с коллайдером генерируют огромные объёмы данных. Облачная платформа на OpenStack играет решающую роль в управлении этими данными. Ещё учёные предоставляют инфраструктуру и ресурсы тысячам исследователей по всему миру.

К 2022 году частное облако разрослось до 9 000 физических узлов с 500 000 ядер. Эта инфраструктура поддерживает множество научных, административных и вычислительных задач, необходимых для функционирования CERN.

В CERN реализовали проект Worldwide LHC Computing Grid (WLCG). Это объединённая сеть из более чем 170 вычислительных центров в 42 странах.

WLCG использует OpenStack для обеспечения вычислительной мощности, необходимой для анализа огромного объёма данных, получаемых в коллайдере. Результат — тысячи учёных по всему миру получать доступ к данным в режиме реального времени. 

Грид-сеть CERN. В середине находится центр обработки данных Tier-0  где на ленточных носителях хранятся первичные данные. Фото academcity.org

Грид-сеть CERN. В середине находится центр обработки данных Tier-0 где на ленточных носителях хранятся первичные данные. Фото academcity.org

zOpenStack позволяет CERN быстро и эффективно выделять огромные вычислительные ресурсы. Пользователи могут запрашивать виртуальные машины и хранилища через специальный веб-портал, что значительно сокращает время, необходимое для развертывания ресурсов. По расчётам CERN, без развёрнутой облачной сети этот процесс мог занимать до нескольких месяцев. Благо сейчас процесс автоматизирован и занимает нескольких минут. 

Кстати, учёные продолжают использовать магнитные ленты для долгосрочного хранения данных. В среднем такая лента хранит данные 30 лет и не очень прихотлива в хранении.

Хранилище магнитных лент на складе CERN. Фото thereeltoreelrambler.com

Хранилище магнитных лент на складе CERN. Фото thereeltoreelrambler.com

Развёртывание OpenStack в CERN включает в себя расширенные функции, такие как оркестрация контейнеров с использованием Kubernetes и подготовка «голого железа» (Bare Metal) с помощью OpenStack Ironic.

Нагрузки облачной инфраструктуры CERN можно оценить в реальном времени на их сайте. 

График создания облачным виртуальных машин для нужд сети CERN. В пиковые нагрузки за час запускается до 800 новых ВМ. Фото monit-grafana-open.cern.ch

График создания облачным виртуальных машин для нужд сети CERN. В пиковые нагрузки за час запускается до 800 новых ВМ. Фото monit-grafana-open.cern.ch

В 2022 году эксперты CERN заявили, что готовятся модернизировать коллайдер. Это приведёт к увеличению обработки объёма данных и потребует новых вычислительных мощностей. Учёные планируют оставаться в экосистеме OpenStack.

Walmart

Крупнейшая в мире сеть оптовой и розничной торговли — сторонник продуктов с открытым исходным кодом. В разное время бизнес использовал более 60 OpenSource-решений.

Walmart создал сеть из 10 000 серверов, на которых развёрнута облачная инфраструктура на базе OpenStack, в распределительных центрах и более чем 5 500 магазинах. При этом частное облако OpenStack компании Walmart насчитывает более 800 000 ядер.

В центре обработки данных Walmart в Калифорнии. Фото reuters.com

В центре обработки данных Walmart в Калифорнии. Фото reuters.com

Главная фишка Walmart — собственный инструмент Galaxy. Его задача — проверка облачных операций. Если где-то фиксируется проблема, Galaxy сообщает об этом. Так инструмент помогает поддерживать бесперебойную работу облачной инфраструктуры. 

До Walmart в американском ритейле доминировал реактивный подход, когда компании реагировали на проблему при её обнаружении. Galaxy работает иначе: он постоянно выполняет проверки, чтобы подтвердить работоспособность всех компонентов облака. Сегодня проактивный подход к проверкам стал мейнстримом.

Несмотря на партнёрство с Microsoft Azure, Walmart продолжает инвестировать в OpenStack и использовать его для своих нужд. Компания использует мультиоблачную инфраструктуру, которую называет триединая сеть. Она объединяет публичное и частное облако, пограничные узлы, позволяя Walmart гибко балансировать рабочие нагрузки и поддерживать непрерывность работы в периоды пиковой активности или простоев.

Принцип работы мультиоблачной инфраструктуры Walmart, также известной как триединая сеть. Фото Walmart

Принцип работы мультиоблачной инфраструктуры Walmart, также известной как триединая сеть. Фото Walmart

Используя OpenStack и Kubernetes, Walmart организует работу контейнеров на обширной вычислительной базе. Инфраструктура поддерживает скоростные обновления и внедрение новых функций, что значительно повышает гибкость цифровых платформ Walmart. Переход к мультиоблачной среде помогает гибко управлять расходами и позволяет избежать привязки к поставщикам.

Несмотря на конкуренцию со стороны крупных поставщиков облачных сервисов, Walmart, тем не менее, придерживается Open Source-решений. Не так давно компания объявила о планах расширить пул инструментом на основе  решений с открытым исходным кодом. Облака на основе OpenStack занимают в этих планах ключевую позицию.

China Mobile

Официально: крупнейший оператор мобильный связи в мире, обслуживающий около миллиарда абонентов. 

China Mobile управляет одной из крупнейших в мире систем виртуализации сетевых функций (NFV) на базе OpenStack. Эта обширная инфраструктура управляет более чем 50 000 серверами, поддерживая обширную телекоммуникационную сеть, которая обслуживает более 3 миллионов базовых станций.

Вычислительные мощности China Mobile. Фото superuser.openinfra.dev

Вычислительные мощности China Mobile. Фото superuser.openinfra.dev

Сеть NFV China Mobile поддерживает более 465 миллионов пользователей 5G и 300 миллионов пользователей IMS (IP-мультимедийной подсистемы). 

Для эффективного управления такими масштабами компания China Mobile разработала автоматизированную платформу AUTO, которая значительно сокращает время, необходимое для настройки и тестирования оборудования. AUTO может настроить все устройства в пуле ресурсов, насчитывающем более 1000 физических узлов, всего за 20 минут, и завершить тестирование за 80 минут. За год эта платформа помогла China Mobile свести к нулю количество сбоев в конфигурации и устранить более 15 000 проблем.

China Mobile внедрила конвейер CI-CT-CD (Непрерывная интеграция, тестирование и поставка) в сотрудничестве с Ericsson для интеграции своих решений. Этот конвейер обеспечивает автоматизированное развертывание и тестирование новых версий ПО, повышая эффективность и надёжность сетевых облачных сервисов.

Важно, что China Mobile активно участвует в работе сообщества OpenStack, делится своим опытом в области автоматизации и CI/CD. Компания также участвует в конференциях и событиях, посвящённых развитию решений с открытым исходным кодом. Сообщество больше всего интересует опыт компании в использовании NFV в телекоммуникационных средах.

Сейчас компания сместила акцент на развитие искусственного интеллекта, а председатель совета директоров China Mobile заявил, что компания «перешла от облаков к вычислениям». Правда, доходы облачных направлений за прошлый год выросли на 83%, а в 2023 году клиентская база пользователей 5G выросла на 42% — сеть выдержала приток новых абонентов. Значит использование OpenStack приносит результат и отказываться от него точно не будут.

Blizzard Entertainment 

«Я получил власть, которая и не снилась моему отцу!» Вероятно так может сказать руководитель сетевой инфраструктуры Blizzard Entertainment. Всё-таки 12 000 вычислительных хостов и несколько облаков — это не шутки.

Запуск новых сезонов в играх Blizzard часто сопровождается очередями на сервера. Без OpenStack, возможно, ситуация была бы хуже. Скриншот Reddit

Запуск новых сезонов в играх Blizzard часто сопровождается очередями на сервера. Без OpenStack, возможно, ситуация была бы хуже. Скриншот Reddit

Вы или ваши знакомые играют в Overwatch 2, Diablo IV и World of Warcraft? Знайте: для поддержки инфраструктуры этих игр Blizzard Entertainment использует OpenStack. 

В первую очередь Blizzard ценят возможности автоматического масштабирования OpenStack для управления высокими и переменными рабочими нагрузками в онлайн-играх. Количество игроков в будни, выходные и в период крупных обновлений — это три совершенно разные нагрузки на инфраструктуру. Автоматическое масштабирование помогает поддерживать производительность и стабильность за счёт выделения ресурсов, необходимых для удовлетворения потребностей игровых серверов.

Один из методов, который Blizzard использует в OpenStack, называется NUMA pinning. Этот технический приём позволяет оптимизировать использование игровыми серверами вычислительной мощности компьютера (CPU). Грубо говоря, NUMA следит, чтобы процессоры использовали свои разделы памяти, а компонент OpenStack Nova — выполняет первичные задачи. Такой подход гарантирует, что каждая виртуальная машина будет находиться в своей зоне памяти, не пересекаясь с зоной других ВМ.

Компания Blizzard решила несколько проблем, связанных с масштабированием своей игровой инфраструктуры. Одна из таких проблем решена при помощи брокера сообщений — RabbitMQ, который помогает различным частям системы взаимодействовать друг с другом, подобно тому, как почта доставляет сообщения.

Другой серьезной проблемой было масштабирование Neutron, сетевого компонента OpenStack. Blizzard столкнулась с проблемами в работе из-за совместного размещения служб на хостах контроллеров.

Обычно в среде OpenStack хосты контроллеры отвечают за управление и оркестровку различных облачных сервисов, включая сетевые (Neutron) и вычислительные (Nova). Когда несколько сервисов работают на одном и том же оборудовании или виртуальных машинах, то они конкурируют за ресурсы. При волнообразной нагрузке такая конкуренция может привести к перегрузке системы и снижению производительности. Blizzard решили эту проблему, переведя сотрудников Neutron RPC на виртуальные машины, что снизило нагрузку на control plane до 75% при обычной работе.

Подход Blizzard к использованию OpenStack предполагает постоянную настройку и масштабирование для поддержания эффективности и надежности инфраструктуры. Эта стратегия позволяет им поддерживать стабильную работу онлайн-игр, минимизировать сбои и обеспечивать производительность.

Заключение

С 2020 по 2021 годы  количество ядер. управляемых OpenStack, выросло на 66%.

Статистика популярности OpenStack — за год создано больше 100 облаков, а в «клубе миллиона ядер» уже больше 7 компаний. Фото superuser.openinfra.dev

Статистика популярности OpenStack — за год создано больше 100 облаков, а в «клубе миллиона ядер» уже больше 7 компаний. Фото superuser.openinfra.dev

OpenStack продолжает отчитываться о появлении новых проектов, инструментов и компонентов. У OpenStack практически безграничный потенциал в части кастомизации, поэтому появление новых масштабных кейсов — вопрос времени.

При этом вокруг OpenStack существует множество мифов. Например, принято считать, что OpenStack развёртывается вручную, что много времени уходит на исправление ошибок. На деле есть класс инструментов, которые помогают в развёртывании OpenStack и его отдельных компонентов. 

Интересно, что ещё недавно было модным «хоронить» OpenStack, особенно в иностранном сегменте интернета. Просто раньше он был на переднем крае технологий. Сейчас OpenStack осел в недрах центров обработки данных, служа основой для Kubernetes, AI/ML stack и телекоммуникационного NFV.

Если вы слышали о других заметных и известных проектах на OpenStack, расскажите о них в комментариях. 

Habrahabr.ru прочитано 2191 раз