Что нужно знать о вашем IaaS-провайдере еще до начала сотрудничества

adedb7ef810a459ca4156f9aa2286d11.jpg

/ фото Dennis van Zuijlekom CC

«Давайте посмотрим правде в глаза — такие технические аспекты сервиса, как аптайм, масштабируемость и безопасность, не являются однозначно ключевыми факторами принятия решения о выборе провайдера. Представители бизнеса, непосредственно не связанного с технологиями, не горят желанием принимать эти факторы в расчет.

Они обращают внимание только на обещания (зачастую на словах) IaaS-провайдера снять с компании груз ответственности за работоспособность и стабильность ее IT-инфраструктуры. Несмотря на распространенность такого подхода, хотим предостеречь вас — если вы рассчитываете делегировать часть ответственности по столь критичным вопросам облачному сервису, подумайте дважды, а лучше трижды»


Такой совет на последней конференции «Data Summit» в Нью-Йорке дали Дон Салливан (VMware)» и Майкл Кори (Ntirety), пропагандирующие осторожное отношение к обещаниям IaaS-провайдеров взять на себя заботу о технических нуждах клиентов.

Корпоративным пользователям облачных сервисов следует проявлять инициативу и выяснять, действительно ли провайдер будет уделять должное внимание возникающим проблемам. Кори и Салливан хорошо обозначили основную идею разграничения ответственности: «Когда сервис недоступен или работает некорректно, это должно касаться провайдера в той же степени, что и вас как клиента».

В дополнение к этим тезисам представители индустрии виртуализации составили список вопросов, на которые следует получить аргументированные ответы до того, как подписывать договор с провайдером IaaS. Этот список призван помочь вам в отделении «зерен от плевел». Мы, команда провайдера виртуальной инфраструктуры 1cloud.ru, решили сразу ответить эти на вопросы в рамках самопроверки.

1. Вы можете представить три реальных отзыва ваших клиентов (не тех, у которых ноги растут из вашей PR-активности)?

Ниже приведены три отзыва из оставленных клиентами на нашем сайте:

«Спасибо за ваш хостинг! Мы пришли к вам по рекомендации и решили остаться! Адекватные гибкие цены. Грамотная отзывчивая техподдержка. Удобные варианты оплаты, хоть за час. Надежные серверы. Высочайший uptime. Для российского рынка — 1cloud.ru — просто находка! Настоятельно рекомендую»

— Аарон Уркин, Сооснователь сервиса управления продажами недвижимости Real-Control.Pro


«Потрясающе простой и профессиональный сервис. Знакомство с ним я начал с удобного визарда по выбору конфигурации. Все остальное оказалось таким же приятным и понятным.

Мы в своей веб-студии придерживаемся ровно такого же подхода в работе с клиентами! Скорость работы, профессионализм и вежливость поддержки — все у Вас на высшем уровне. Для подтверждения данного отзыва или любых других консультаций области веб-разработки или SEO можете обращаться лично ко мне по адресу i@bizzcon.ru»

— Денис Иванов, PM bizzcon.ru


«Уже давно использую сервис 1Cloud. Раньше пользовался Azure. Перешел по следующим причинам:

1. Существенно дешевле.

2. Намного быстрее развертываются серваки.

3. Есть множество вариантов систем… для тестов есть все, что надо.

4. Само облако российское, что для нашей компании критично (пинг стабилен и минимален).

5. Отличная поддержка, все решают почти сразу.

6. С оплатой тоже все удобно и прозрачно. нет жестких ограничений и отрубов (в азуре например если кредитный лимит израсходовал — то у тебя все перестает работать, пока не кончится месяц.

В общем — спасибо за работу, сервис очень нравится»

— Иван Короблин, системный администратор ООО КонсалтингТрейд

Все отзывы наших клиентов, как позитивные, так и негативные, размещены у нас на сайте и на других обзорных площадках, например, на hosting101. Мы запрашиваем отзывы от клиентов не сразу, а по истечении 3-х месяцев использования нашего сервиса, когда их мнение о нас уже сформировано.

2. Вы можете сформулировать техническую специфику бизнеса нашей компании?

В условиях автоматизации управления IaaS-средой выделить специфику бизнеса каждого клиента затруднительно. Мы анализируем только сведения, полученные от самого клиента: обращения в техническую поддержку и онлайн чат, показатели спроса на конкретные категории услуг, отзывы на различных площадках (кстати, вы тоже можете поделиться отзывом или предложением о работе нашего сервиса, например, здесь).

Если представители компании-клиента желают поделиться информацией о специфике своей работы, мы принимаем эту информацию к сведению при формировании индивидуальных предложений и в процессе обслуживания клиента.

3. Я могу добавлять/удалять сервисы по мере необходимости?

Да, все предлагаемые нами услуги можно подключить/отключить в любой момент через панель управления. Тарификация осуществляется раз в 10 минут, поэтому не нужно оплачивать даже один лишний час использования услуги, в которой уже нет потребности. Если выключить виртуальный сервер, то средства будут списываться только за арендуемое дисковое пространство.

Обработка заданий по добавлению или удалению опций происходит автоматически за несколько минут. Например, в пару кликов создаются собственные шаблоны серверов, также разворачиваются новые виртуальные машины из этих шаблонов. Аналогичным образом создается частная сеть (знаний VPN не требуется).

Наши клиенты могут в пару кликов изменять и аппаратные конфигурации самих серверов под текущие потребности: увеличивать CPU, RAM, HDD «на лету». Ниже представлены: калькулятор заказа нового виртуального сервера (сверху), и конфигуратор ресурсов панели управления (снизу). Мы разработали эти инструменты именно для обеспечения возможности использовать только те мощности, которые нужны в данный момент.

1f72b7b498f24df5b12d14119868ba14.png

4027c1a98a7b454dbd61fca42fd0cd05.png

4. Вы получаете бонусы от производителей за лоббирование каких-то определенных брендов оборудования или ПО? Если да, то на каких условиях?

Все предлагаемые нами услуги построены на базе проверенных enterprise-решений от известных мировых производителей. На сегодняшний наши основные поставщики оборудования — Cisco (UCS, ASR, Nexus), Dell (PowerEdge), NetApp (FAS8000). Для виртуализации используется vSphere от VMware. На этой странице вы найдете подробный обзор нашего оборудования.

Так как мы предоставляем клиентам готовый сервис по фиксированной цене, то для нас в принципе не может быть интереса в лоббировании какого-то определенного поставщика. Вендор либо удовлетворяет нашим требованиям стабильности и гибкости — тогда мы используем его решения в своей инфраструктуре, либо не удовлетворяет — тогда мы с ним просто не работаем.

По нашему мнению, избирая иной подход, хостинг-провайдер рискует, как минимум, нести дополнительные издержки, связанные с обслуживанием навязанных извне, а не продуманных самостоятельно решений, и, как максимум, разочаровать клиентов сервисом, отталкивающимся от потребностей производителей, а не пользователей. Возможно, вендор и будет готов покрывать все эти «побочные» эффекты предлагаемыми бонусами — все может быть. Но такой подход идет вразрез с нашей бизнес-моделью, в основе которой лежит принцип клиентоориентированности.

5. Ваша собственная инфраструктура тоже размещена на облачных платформах или вы используете иные решения?

Все предлагаемые клиентам технические решения мы используем и для своих внутренних корпоративных потребностей — проводим практически все работы по разработке и обслуживанию сервиса в той же IaaS-инфраструктуре 1cloud. Все сотрудники компании работают с виртуальными машинами — это существенно облегчает процесс удаленного взаимодействия и снимает зависимость работоспособности команды от конкретных рабочих мест и устройств.

6. Когда произошел последний простой вашего сервиса и как долго он продолжался?

Как и у любой компании, иногда случаются «падения» каких-то частей инфраструктуры. Последний простой случился около 2-х месяцев назад, продолжался менее 15 минут и затронул примерно 10 процентов виртуальных машин, оказавшихся недоступными по сети.

Причиной простоя стало попадание в нашу внутреннюю сеть избыточного трафика в результате DDoS-атаки. Это привело к частичной потере пакетов между нодами виртуального маршрутизатора. В результате, система high-availability на маршрутизаторе дала сбой: slave-ноды получили ложную информацию о недоступности master-ноды и взяли ее функцию на себя.

Проблема была быстро разрешена, для предотвращения ее проявления в будущем был оперативно настроен мониторинг статуса нод, а затем внедрена система глубокого анализа трафика и защиты от DOS и DDoS атак «Скат». В течение и после инцидента мы поддерживали постоянную связь с клиентами. Благодаря этому удалось получить ценный опыт относительно действий в таких ситуациях и работы по их предотвращению.

Если для кого-то из клиентов нам не удается обеспечить доступность сервиса в рамках SLA, то мы выплачиваем этому клиенту денежную компенсацию, размер которой устанавливается тем же SLA.

7. Предлагаемая вам архитектура достаточно диверсифицирована для нивелирования рисков простоя? За счет чего?

Все узлы нашей инфраструктуры дублируются, что в значительной степени снижает риск простоев. Используемое оборудование имеет высокие показатели доступности, безопасности и производительности (вы можете получить более подробную информацию об используемых нами компонентах здесь: Cisco UCS, Dell, NetApp). В организации каналов связи используется резервирование с разделением по разным провайдерам и физическим трассам.

Виртуальные серверы 1cloud располагаются на дисковых массивах NetApp FAS6240/FAS8040, оснащенными чипсетами Intel, использующими высокопроизводительную память и NVRAM и гарантирующими высокий уровень доступности (>=99,999%).

В каждом контроллере имеется служебный процессор, изолированный от основного контроллера. Он продолжит работать даже в случае выхода из строя основной части платы. К стойкам с контроллерами прикреплены к массивам СХД. Оборудование размещено в центрах обработки данных SDN (Санкт-Петербург) и Dataspace (Москва), прошедшими сертификаты уровня Tier lll.

b63294b3b99a464ebe090b9821c7a241.jpeg

Полки расширения дискового пространства для системы хранения данных NetApp

8. В чем преимущество вашего соглашения об уровне обслуживания (SLA) относительно конкурентов?

Мы не беремся оценивать конкурентов. Соглашение об уровне обслуживание у нас есть, оно опубликовано на сайте и подразумевает реальные финансовые гарантии с нашей стороны. Например, установленный уровень доступности оборудования (uptime) по соглашению — 99,9%. Если наши услуги не соответствуют этому показателю — мы выплачиваем клиенту денежную компенсацию (5–100% стоимости в зависимости от фактических показателей доступности).

9. У вас предусмотрен единый инструмент управления всеми предлагаемыми услугами?

Клиент может полностью контролировать свою IaaS-инфраструктуру через единую панель управления с широким функционалом., а также через наш API. С помощью этих инструментов можно создавать и удалять серверы, создавать снапшоты и резервные копии, разворачивать частные сети и управлять ресурсными записями доменных зон.

a89524477e1440e4ad26d1cd76b9b44e.png

Получить ключ для доступа к API 1cloud можно из панели управления в любой момент

Благодаря REST API доступна полная автоматизация задач по управлению пользовательской инфраструктурой без необходимости выполнения действий вручную через веб-панель 1cloud.

На данный момент имеется несколько реализаций клиентских приложений для API 1cloud:

  • На C# — код на Github (благодарность за создание partyz0ne);
  • На PHP — код на Github (благодарность wapmorgan);
  • На node.js — код на Github (благодарность serkamikadze).


Для хабровчан, решивших воспользоваться нашим API, мы готовы предоставить расширенный тестовый период (3 дня для физ. лиц, 5 дней для юр. лиц) и оказать всяческую поддержку (для активации тестового периода достаточно обратиться в службу поддержки по адресу support@1cloud.ru).

10. Вы предлагаете один общий счет на оплату всех услуг?

Да, оплата услуг происходит по общему счету. Клиент имеет один аккаунт, с которого списываются средства на оплату всех используемых услуг по мере их потребления. В любой момент можно изучить историю списаний: когда, за что и сколько заплатил пользователь, на сколько дней пользования сервисом хватит средств на счете. В панели управления можно в пару кликов подтверждающие оплату детализированные акты.

Здесь рассказано о том, как мы оптимизировали процедуру приема и контроля платежей. А поскольку мы работаем и с физическими лицами, и с клиентами-компаниями, мы позаботились и об автоматизации формирования счетов и актов для юридических лиц. С одной стороны, это направление нельзя назвать профильным или критическим для провайдера, с другой, возможность в любой момент получить полную информацию о состоянии счета и копии бухгалтерских документов серьезно облегчает жизнь нашим корпоративным клиентам.

c6411caf571a4b8fa7f1f8bcefed78d6.png

Процесс генерации актов по счетам наших корпоративных клиентов

11. У вас есть единая система мониторинга состояния клиентской инфраструктуры и уведомления о возникающих сбоях?

Автоматизированные системы мониторинга регистрируют alert в случае отказа какого-либо компонента инфраструктуры. Специалисты service desk осуществляют работы по устранению таких сбоев в круглосуточном режиме. При необходимости привлекаются специалисты второй линии поддержки, получающие уже детально обозначенный запрос непосредственно от сотрудников первой линии.

Это помогает сделать работу со сбоями более оперативной. Что касается инструментов мониторинга, предназначенных для самого клиента, мы писали об этом в своем блоге (ознакомиться можно здесь).

12. Каковы ваши заявленные параметры отказоустойчивости и скорости восстановления после сбоев?

Эти параметры подробно описаны в нашем SLA. Исходя из заявленного нами уровня доступности — 99,9%, на восстановление после сбоев может уходить не более 2-х часов, причем это месячный, а не разовый лимит.

13. Соглашение об уровне услуг (SLA) подкреплено вашей реальной финансовой ответственностью?

Да, мы берем на себя финансовые обязательства, гарантирующие возмещение средств пользователю (5–100%) при несоответствии сервиса нашему SLA. Размеры компенсаций фиксированы и опубликованы в вышеуказанном соглашении.

14. Реплицируются ли виртуальные машины и, если да, то на какое количество экземпляров?

Вычислительные мощности серверов (CPU, RAM) выдаются с отказоустойчивого кластера и отделены от дисковых массивов, поэтому в репликации виртуальных серверов попросту нет необходимости. В случае выхода из строя аппаратного хоста все виртуальные серверы перезапускаются на другом гости.

Что касается репликации дисковых массивов, то данные клиента дублируются на три физически удаленных диска. Балансировка рабочей нагрузки на доступные виртуальные ресурсы реализована средствами VMware DRS, которая обеспечивает возможность развертывания новых мощностей или миграции виртуальных машин без необходимости приостановки сервиса (подробнее — здесь).

15. Какой гипервизор вы используете?

Мы используем vSphere от компании VMware. Эта платформа нас устраивает и с точки зрения надежности, и в плане ее гибкости.

16. Какие профессиональные сертификаты у вас есть?

Наши сотрудники имеют различные профессиональные сертификаты, в частности: Cisco Certifications, NetApp Certificate of Completion, Microsoft Certificate of Excellence, многочисленные сертификаты FastLane.

17. Предлагаемые вами решения кроссплатформенны?

Да. Мы предлагаем серверы под управлением семейств Windows, Linux, BSD. Для работы с нашей панелью управления нужен только веб-браузер. В панели имеется веб-консоль для подключения к серверу, что позволяет получить доступ к нему даже при отсутствии необходимых утилит на клиентском устройстве.

18. Как структурируется и мотивируется ваша команда по поддержке клиентов?

Мы работаем по принципу «пустой папки inbox», т.е. если обращение клиента в течение длительного времени остается без ответа, это считается проблемой. У нас также есть внутренние метрики качества службы технической поддержки, такие как установленное максимальное время реакции и время разрешения вопроса.

Работают две линии технической поддержки: первая линия состоит из специалистов с базовыми знаниями администрирования Windows/Linux ОС. Эти сотрудники могут осуществлять мониторинг инфраструктуры 1cloud и разбираются в принципах её построения.

Вторую линию составляют сотрудники, владеющие углубленными знаниями по этим вопросам, а также всеми навыками работы с ПО VMware (vCloud Director, vSphere и др.) и профессионально разбирающиеся в сетевой инфраструктуре и системах хранения данных.

При необходимости мы можем сформировать экстренную конференцию на уровне третьей линии — ответственных специалистов компании, которые работают с самыми сложными и интересными вопросами, отлично понимают специфику архитектуры 1cloud, обладают широкими компетенциями в системном администрировании и разработке на .NET.

19. У вас есть системы контроля качества поддержки клиентов? Как они работают?

Мы постоянно собираем отзывы клиентов о нашем сервисе, в том числе и о качестве технической поддержки. Руководство компании еженедельно выборочно проверяет ряд клиентских обращений: их актуальный статус и историю обработки.

20. Какова процедура реагирования на экстренные клиентские запросы?

В случае с 1cloud.ru, экстренный запрос клиента может быть связан только с недоступностью сервиса. Если это массовые обращения, то они обрабатываются по стандартной процедуре Major-инцидента: вне зависимости от времени суток мы организовываем экспресс-конференцию с участием ответственных представителей по каждому направлению нашей работы (сетевые администраторы, специалисты по виртуализации, дисковым массивам, автоматизации, IT-директор), что способствует скорейшему решению возникшей проблемы и исключает принцип «футбола» от специалиста к специалисту.

Такой подход помог нам оперативно справиться с возникшей несколько месяцев назад проблемой, уже упомянутой выше — недоступностью части клиентских виртуальных машин в результате DDoS-атаки. Тогда мы справились меньше чем за 15 минут: с момента получения первого обращения от клиента, чей сервер оказался недоступен, на активизацию ответственных специалистов ушло менее 5 минут, почти столько же времени потребовалось для диагностирования проблемы, ее устранение заняло около 3-х минут.

Если бы сам коллектив нашей компании не использовал предлагаемые нами технологии виртуализации (в данном случае, рабочих мест), мы бы не смогли решить проблему так быстро.

21. Вы проводите последующий анализ обращений? Каким образом?

Полученные сведения анализируются, и при необходимости в правила клиентской поддержки вносятся соответствующие изменения (например, автоматизируются процедуры обработки типовых запросов). Именно таким образом, например, мы пришли к трехуровневой структуре технической поддержки.

Кроме того, мы внимательно читаем комментарии к нашим материалам на Хабре и работаем над тем, чтобы наши сервисы были не только полезными, но и удобными в использовании. Поэтому мы запустили новый сайт, поработали над его юзабилити и дизайном и учли многие советы и пожелания наших пользователей.

Комментарии (0)

© Habrahabr.ru