Как работает IT-структура Amazon

После покупки «Амазоном» сети Whole Foods и выхода на рынок продуктов питания, Джефф Безос, основатель фирмы, вплотную подошел к Биллу Гейтсу и уже в ближайшие недели может стать самым богатым человеком планеты. А сам «Амазон», судя по всему, станет первой компанией с рыночной капитализацией в $1 трлн, обойдя Google и Apple. По крайней мере, так считает основатель сервиса бизнес-аналитики L2 и профессор Нью-Йоркского университета Скотт Гэллоуэй.

458def3d6571482f811ee906b530922c.jpg

Учитывая темпы роста онлайн-ритейлера, поверить в такой сценарий несложно. Уже сейчас сайт фирмы обрабатывает 3–4 млн доставок каждый день. На ее серверах хранятся данные о 400 млн товаров. Как такое можно обслужить? «Амазон» держит всю информацию о своей IT-структуре в строжайшем секрете, как военную тайну. Но иногда что-то просачивается сквозь сети. Например, недавно стало известно, что сотрудники IT-отдела при поступлении на работу могут выбирать между ноутбуком с Windows или Mac. А основной труд у них проходит на десктопе с Linux (Ubuntu), подключенном к вычислительному облаку Amazon EC2.

В качестве Windows-ноутбука выдается Lenovo Thinkpad — видимо, из-за его скромной стоимости. Десктопы у компании тоже в основном Lenovo. Ценные сотрудники могут претендовать на MacBook Pro. А если кого-то не устраивает мощность стандартного макбука, они могут принести в офис собственный мак. Его переделают в рабочую машину, которую, правда, потом придется оставить в компании. На такую опцию сотрудники «Амазона» соглашаются редко, всё-таки аппаратное обеспечение в компании довольно высокого класса и регулярно модернизируется. Но есть и один недостаток, на который сами сотрудники постоянно жалуются на форумах. По умолчанию «Амазон» дает только один дисплей на рабочее место. Чтобы получить два или три, надо доказать свою полезность и преданность компании.

Самый большой магазин в интернете

А что касается самого «Амазона»? Огромное ядро, на котором он работает, полностью построено на «Линуксе». С 2005 года в «Амазоне» стоят 3 самые большие в мире базы данных на «Линукс». Тогда они хранили 7.8 ТБ, 18.5 ТБ и 24.7 ТБ данных, сейчас — почти на порядок больше. Центральное хранилище еще тогда включало в себя 28 серверов от HP, работающих на Oracle 9i. Оно было разделено на три секции: «запросы», «исторические данные» и ETL (extract, transform and load — для запроса информации у одного источника и ее интеграции в другой). Больше всего пространства как тогда, так и сейчас занимает секция с историей кликов, на нее уходит до 50% места в хранилище.

2892414d33754104aeab3baeaa641391.jpg

Начиная с 2003 года, сайт «Амазона» рассчитан на обработку не меньше 1,2 млн отправок и 20 млн обновлений инвентаря в день. Ситуация особенно критична в ноябре, когда друг за другом идут День благодарения, Черная пятница и Киберпонедельник. В этот период компания получает от $4,7 млрд, на нее приходится 40% покупок в Америке. Сервера должны обрабатывать огромные объемы поступающих данных. К тому же, данные нужно хранить и шифровать, а еще — анализировать поведение покупателей, чтобы предлагать им релевантные товары. В «сезон покупок» миллионы людей ежедневно отправляют номера своих банковских карт в «Амазон», и компания обязана их криптографировать, защита пользователей стоит в приоритете. Во время оформления заказа шифровка номеров карт проходит автоматически, плюс фирма позволяет пользователям дополнительно зашифровать любую другую вводимую ими информацию: их имя, адрес, пол.

Такой сумасшедший поток данных не проходит даже через Google. Для их шифрования «Амазон» использует Netscape Secure Commerce Server с SSL-протоколом. Вся информация о кредитках хранится в отдельной базе данных, недоступной из интернета, чтобы защитить ее от хакеров. А особенно осторожные пользователи могут ввести только часть цифр на кредитке, а остальное передать по телефону после отправки онлайн-заказа.

0ef615b31e1e4fcd9a176302afde4322.jpg

«Амазон» настолько увлекся обеспечением конфиденциальности обмена данными, что в 2016-м начал раздавать бесплатные SSL/TLS-сертификаты всем пользователям своей программы Amazon Web Services (AWS). А еще с 2015-го компания является официальным поставщиком SSL-сертификатом для Firefox и Android, а также для Microsoft и Apple. Фактически, единственный вариант, как могут украсть данные вашей карточки, — банальный фишинг. Это та же проблема, от которой никак не могут отбиться eBay и PayPal. Никогда не отвечайте на электронные письма «от Амазон» или от любого магазина или банка, запрашивающие информацию о вашей учетной записи.

AWS и облака

Главная гордость компании на IT-фронте — уже упомянутая AWS, секция «Амазона», занимающаяся облачными вычислениями. Ее услугами пользуются Netflix, Reddit, NASA и еще под 2000 государственных учреждений в 190 странах. Больше миллиона пользователей каждый месяц! Microsoft и Google пытаются построить свои похожие системы, инвестируя в это дело без оглядки, но «Амазон» пока что остается лидером. Только за первый квартал 2016-го AWS принесла фирме $2,6 миллиарда, и это на 64% больше, чем в 2015-м. Глава компании, Джефф Безос, рассчитывает, что облачные сервисы в этом году принесут больше $10 млрд. Если такое развитие будет продолжаться еще несколько лет, «облака» принесут «Амазон» больше денег, чем основной бизнес онлайн-ритейла.

f0dbde0d99fe4eb7b0b2005e1778fe45.jpg

Чтобы чуть-чуть представить себе масштаб AWS, можно поставить себе его в перспективу. Он состоит из 70 разных сервисов, занимающихся вычислениями, обработкой, анализом и управлением информации. Один из этих семидесяти сервисов — Amazon Elastic Compute Cloud (EC2), предоставляющий ресурсы для вычислений в облаке. В 2011-м профессор Хуанг Лю, занимавшийся исследованиями в этой сфере, выяснил, что Amazon EC2 состоит из 454 400 серверов. У Microsoft в то же время было порядка 200 тысяч серверов, у eBay — 50 тысяч, у Facebook и AT&T — под 100 тысяч, у Intel — 70 тысяч. Больше серверов, чем Амазон, для своих целей использует только Google, там их под миллион. Но дело в том, что Амазон — единственная, для которой нет публичных данных. А EC2 — только одна из частей AWS. А AWS — это пока что даже не основной бизнес компании, главный доход «Амазон» получает с веб-сайта с товарами. То есть, на самом деле масштабы там гораздо больше, чем 454 тысячи. Мы можем с уверенностью говорить о том, что у «Амазон», как минимум, есть сорок огромных дата-центров в США, Европе, Бразилии, Азии и Австралии, каждый площадью по пять-десять футбольных полей. А как максимум — кто знает. Возможно, учитывая их увлечение робототехникой, дроидами и интернет-вычислениями, они уже давно секретно захватывают мир, пока мы смотрим в сторону Google. А Маск предупреждал!

Официально «Амазон» никогда не рассказывал, сколько у него серверов и на какой ОС работает EC2, но большинство экспертов считает, что фирма до сих пор использует свою личную версию Red Hat Linux (RHEL). Виртуальные машины работают через кроссплатформенный гипервизор Xen — на Linux, Solaris, Windows 2003 и 2008, FreeBSD и NetBSD.

Небольшой бонус

Развитая инфраструктура и огромный масштаб позволяют «Амазону» держать минимальные цены. На некоторых категориях товаров ритейлер работает себе в убыток, чтобы не уступить конкурентам. Цены на сайте обычно в два-три раза ниже российских (без шуток). А доставить покупки оттуда в Россию можно через наш сервис. Чтобы вы оценили, какая на этом выходит экономия, один (случайный) комментатор к этому посту получит $25 на баланс Pochtoy.com. Его хватит, чтобы доставить ваш товар из США в Россию, даже с учетом страховки. А сборка посылки, упаковка товара и ваш персональный адрес в США для покупок у нас и так всегда бесплатно.

© Geektimes