Оверлоад. К чему приводит перегрузка из-за слишком большого трафика
Народная мудрость гласит: в жизни нужно быть готовым ко всему, в том числе, и к популярности. Впервые я столкнулся с подобной проблемой чуть более 20 лет назад. В начале «нулевых» я запустил небольшой пет-проект на обычном shared-хостинге, и, видимо, он пришелся по душе не только мне самому. Упоминание о моем стартапе попало в популярную рассылку Алекса Экслера, после чего сайт благополучно рухнул под небывалым наплывом посетителей. Тогда я не потерял из-за этого инцидента ничего, кроме килограмма нервных клеток. Прошло почти два десятилетия, но подобное продолжает случаться с завидным постоянством, и крупные компании порой теряют миллионы долларов из-за отказов своих сайтов в результате непросчитанной нагрузки. Вот самые известные и курьезные случаи в этом ряду.
Неожиданный ажиотаж, связанный со случайными факторами (как в моем случае с рассылкой) прогнозировать очень непросто, и потому на эту удочку иногда попадаются даже крупные правительственные организации, непосредственно отвечающие за телекоммуникации. В 2014 году Федеральная комиссия по связи США (FCC) выдвинула инициативу «по защите и продвижению открытого интернета», после чего объявила о 120-дневнем периоде обсуждения этой самой инициативы. План предполагал, что некоторые компании должны доплачивать за более высокую скорость передачи данных в сети, что неизбежно привело бы к неравным конкурентным условиям для крупных и мелких провайдеров и росту тарифов.
В июньском выпуске телепрограммы «Last Week Tonight» ведущий одного из телеканалов сети HBO, популярный комик Джон Оливер призвал своих зрителей поделиться на сайте FCC всем, что они думают об этой инициативе вообще, и о вмешательстве американского правительства в регулирование интернета в частности. «Нам нужно, чтобы вы хотя бы раз в жизни направили свою неизбирательную ярость в полезное русло», — сказал в эфире Оливер. — «Ловите момент, мои милые тролли, включайте Caps Lock и вперед, мои красавцы!». В результате внезапно возросшего трафика сайт агентства с грохотом обвалился и не мог подняться несколько дней: за короткое время зрители HBO оставили на нем более 47 000 комментариев.
Схожая участь постигла в том же 2014 году популярный в США интернет-магазин электроники BestBuy.com. В самый разгар «черной пятницы» сайт не справился с наплывом покупателей и прилёг отдохнуть. Под натиском возмущенных комментариев в социальных сетях администрация BestBuy сообщила, что временные сбои связаны с отключением электроэнергии, высоким трафиком и неудачным расположением Луны в Козероге, и очень скоро они все починят. «BestBuy.com добился рекордного уровня посещаемости веб-сайта», — говорилось в опубликованном компанией в пятницу заявлении, — «это повлияло на производительность ресурса, и в результате мы временно закрыли сайт. Мы принимаем меры для скорейшего восстановления полной работоспособности интернет-магазина». Но «черная пятница» естественным образом перетекла в «черную субботу», и несмотря на отчаянные попытки, интернет-магазин так и не заработал. Тысячам недовольных покупателей предложили попытать счастья в мобильном приложении ритейлера, вследствие чего они закономерным образом уронили и его тоже.
Доподлинно неизвестно, сколько денег BestBuy потеряли в результате этого инцидента, но репутацию они себе подпортили основательно. «Если вы, парни, считаете себя одним из лидеров продаж в сфере техники и электроники, может быть, стоит сначала разобраться, как управлять технологиями», — писал в запрещенной на территории России социальной сети возмущенный американский покупатель по имени Шон Мартин.
В июле 2016 года в Англии проводился референдум о членстве Великобритании в Европейском союзе. Жителей туманного Альбиона усиленно агитировали участвовать в он-лайн голосовании, для чего следовало зарегистрироваться на сайте британского правительства gov.uk. Трафик на этом ресурсе неуклонно рос, пока в предпоследний день регистрации не достиг 200 000 посетителей в час. Вслед за этим сайт тихо отошел в мир иной, а возмущенные избиратели принялись писать в Спортлото соцсети, требуя обеспечить их право на свободное волеизъявление и восстановить попранные демократические свободы.
В результате правительство прониклось праведным гневом своих граждан и согласилось продлить срок регистрации еще на два дня. Сайт починили, голосование прошло успешно, и брекзит, как мы знаем, в конечном итоге состоялся. Однако тревожно сознавать, что судьба этого важнейшего исторического события в течение некоторого времени в буквальном смысле зависела от бездушного сервера, не выдержавшего наплыва британцев, пожелавших во что бы то ни стало исполнить свой гражданский долг.
В том же 2016 году компания Niantic выпустила на рынок популярную игру Pokemon Go. Все мы прекрасно помним похожих на зомби игроков, которые, уткнувшись в свои телефоны, сосредоточенно ловили покемонов на улицах городов по всему миру. Популярность новинки оказалась столь высока, что уже в первые выходные после запуска начались серьезные перебои в работе софта — игроки подолгу не могли подключиться к серверам. Впрочем, подобное случается со многими многопользовательскими играми, если количество игроков превышает определенный предел. Именно поэтому, например, некоторые MMORPG в спешке добавляют новые серверы вскоре после выхода игры на рынок, если предварительное тестирование не помогло разработчикам правильно оценить нагрузку. Pokemon Go отличилась тем, что вылетела на второй день после запуска, но в Niantic оперативно разобрались с проблемой и впоследствии сумели избежать серьезных сбоев. Как утверждали в интервью представители компании, они просто не ожидали, что игра настолько зайдет пользователям.
Знаете ли вы, друзья, что такое лайтстик? Вот и я не знал, примерно до 2018 года. Рассказываю: это такой светящийся шар на палке, напоминающий погремуху для взрослых детей, которым фанаты поп-групп могут лупить друг друга по голове размахивать на концертах, чтобы поддержать своих айдолов. При этом какая попало светящаяся погремуха для успешного и идеологически правильного размахивания не подойдет: разные поп-группы выпускают собственный мерч, поэтому истинные фанаты покупают лайстики с правильной символикой в правильных интернет-магазинах.
В 2018 году фирменный магазин мерча южнокорейской «мальчиковой» К-поп группы BTS анонсировал ограниченную серию лайстиков с символикой этого музыкального коллектива. Днем 27 июля, одновременно со стартом продаж, сайт неожиданно вышел из строя. Желающих купить светящуюся погремушку оказалось столько, что электронные потроха сервера, на котором хостился Big Hit Shop, не выдержали позора нагрузки. Этот случай наглядно демонстрирует, как покупательский ажиотаж способен нарушить продажи даже весьма экзотического товара, а также показывает несомненные преимущества перед навороченным электронным изделием простой китайской зажигалки из подвального магазина »24 часа».
21 октября 2022 года в жизни известной певицы Тейлор Свифт произошло целых два важных события: она выпустила свой альбом «Midnights» и сломала Spotify. Только за один этот день альбом Свифт прослушали 228 миллионов пользователей платформы, что сделало его абсолютным рекордсменом за всю историю существования сервиса: предыдущий рекорд составил 153 миллиона прослушиваний в сутки.
Отказ Spotify повлек за собой серьезные убытки для компании, поскольку она получает доход не только от платной подписки, но и от рекламы, которая стала недоступна пользователям вместе с самим сервисом. Но Тейлор Свифт решила не останавливаться на достигнутом: она объявила о поддерживающем новый альбом концертном туре, и обрушила популярный в Америке сервис продажи билетов Ticketmaster. Сайт не справился с наплывом 3,5 миллионов покупателей, многие фанаты Свифт не смогли завершить оплату и потеряли забронированные билеты. Говорят, когда видишь падающую звезду, нужно загадывать желание. Когда видишь падающий по вине звезды сервис, нужно, видимо, загадывать в качестве желания масштабирование и балансировку нагрузки.
Но, пожалуй, самым феерическим случаем «оверлоада» можно назвать случившееся в 2018 году крушение портала Amazon во время распродажи Prime Day. Причина банальна: сайт не справился с наплывом посетителей и даже вынужден был временно ограничить международный трафик, чтобы снизить нагрузку на серверы. Ирония ситуации состоит в том, что Amazon является крупнейшим поставщиком облачных сервисов AWS, и постоянно напирает в рекламе на устойчивости своих облаков к высоким нагрузкам за счет гибкого масштабирования и перераспределения ресурсов. Это, по-видимому, не сработало с самой Amazon, в самый неподходящий момент оставив сапожника без сапог, штанов и других важных предметов гардероба.
Выводы из рассмотренных нами случаев можно сделать вполне однозначные: даже использование передовых облачных технологий, внедрение нагрузочного тестирования и возможности динамического масштабирования архитектуры не спасут от проблем, если разработчики не сумели все это правильно сконфигурировать и настроить. Ну, а я от всей души желаю, чтобы в наступающем году вашим проектам неизменно сопутствовал успех, однако это не приводило к серьезным отказам и сбоям.
Статья поддерживается командой Serverspace.Serverspace — провайдер облачных сервисов, предоставляющий в аренду виртуальные серверы с ОС Linux и Windows из любой точки мира менее чем за 1 минуту. Для построения ИТ-инфраструктуры провайдер также предлагает: создание сетей, шлюзов, бэкапы, сервисы CDN, DNS, объектное хранилище S3.