IT-директор «СберСервиса» оценил причины глобального падения Facebook

image-loader.svg

Сергей Бобров, IT-директор «СберСервиса», прокомментировал версии масштабного сбоя, произошедшего накануне в Facebook. 

Согласно официальной версии Facebook, авария произошла из-за изменения конфигурации магистральных маршрутизаторов, которые координируют сетевой трафик между центрами обработки данных Facebook. Их перенастройка вызвала проблемы, которые стали причиной сбоя. Кроме этого, нарушение сетевого трафика оказало каскадное влияние на способы связи с центрами обработки данных. В результате этого внешние и внутренние сетевые услуги были остановлены.

«Если допустить, что официальная версия Facebook близка к истине, то уроки, которые могут вынести из сложившейся проблемы другие компании, лежит в области применения практик управления изменениями (Change management). Как правило, самые масштабные аварии случаются по крайне незначительным поводам. Допустим, был план по обновлению таблицы маршрутизации. Для этого должен быть план действий по подготовке, установке, пост-проверке, а также бэкаут-план, чтобы откатиться, если что-то пойдет не так. Планы должны валидироваться экспертами. При этом сложно предположить, чтобы такая компания, как Facebook, этого не делала. Вероятнее всего роль сыграл человеческий фактор. Будем откровенны: официальная версия звучит крайне правдоподобно: из-за действий одного человека может произойти масштабный сбой», ― объяснил Бобров.

Также IT-директор «СберСервиса» предположил, что даже если записи Facebook в DNS пропали из таблиц глобальной маршрутизации, то это не значит компания не использует внутренние системы доменных имен:

«История о Facebook, у которого отвалился свой СКУД (система контроля учета данных), выглядит довольно странно.  Учитывая проблемы с другими платформами, я бы ставил успешную попытку атаки, которая зацепила другие компании, пользовавшиеся одними дата-центрами или провайдерами». 

По словам Сергея Боброва, конспирологической версии, согласно которой падение Facebook стало следствием продолжительной негативной информационной кампании, также имеет право на существование:

«На фоне массовых проблем, которые преследуют Facebook в информационном поле, мог быть какой-нибудь саботаж политических групп. Масштаб сбоя и то, что он затронул другие компании, может поставить под сомнение официальную версию инцидента».  

Напомним, произошедший 4 октября сбой в работе Facebook стал самым серьезным инцидентом с 13 марта 2019 года, когда пользователи по всему миру более 24 часов не могли пользоваться Facebook, Instagram и WhatsApp.

© Habrahabr.ru