NutanixOS 4.5: Важное обновление и большие планы
Наконец, после вынужденного летнего затишья (очень утомительно новости знать, но не иметь права рассказывать, уж поверьте) и бурного внутреннего кипения новостей в компании, на гора выдан свежий релиз.
Весной у нас произошло большое и важное обновление «аппаратной платформы», в связи с переходом на CPU Intel Haswell у нашего поставщика оборудования, и мы выпустили модели «G4», Generation Four, а сейчас, в первых числах октября, зарелизился Acropolis Hypervisor, AHV, и все с ним связанное, и были объявлены новые планы по софтовой части продукта.
Но, по порядку.
Все лето в компании шли большие работы по выпуску нового, большого и важного релиза, который получил название 4.5. Главной новостью стало то, что Nutanix решил обзавестись своим собственным гипервизором, форкнув KVM и продолжив развивать его независимо от RedHat. Назвать его решили Acropolis Hypervisor, как вы помните, именно Project Acropolis назывался наш инструментарий управления KVM (KVM Management Tool), появившийся в начале этого года.
Вызвано это было, прежде всего, ну, кроме понятного бла-бла про удовлетворение нужд пользователей и инновации, тем, что у Nutanix издавна сложились сложные и вынужденно тесные отношения с компанией VMware. Существенная, скажу так, сильно большая половины часть бизнеса Nutanix — это системы под VMware vSphere. И все, в общем, всех устраивало, пока VMware делала только гипервизор и пока у нее не появился продукт, прямо и непосредственно конкурирующий с нами, я про VSAN и EVO:RAIL. Неизбежно встал вопрос о мерах по защите бизнеса, так как возник риск и соблазн для VMware заняться продвижением своего продукта путем «выкручивания рук» его главному конкуренту, нам. А в этом, надо сказать, и VMware и EMC те еще мастера, и их доминирующее положение на рынке это большой соблазн поступать так.
Поэтому наши разработчики сели, и написали свой гипервизор, сами знаете с чем. За основу был взят открытый KVM, который, впрочем, и так уже довольно давно в компании пилился, в первую очередь для стабильности и секурности, поэтому выбор был очевиден.
Таким образом, у нас (и у вас, разумеется) теперь есть новый гипервизор на открытом ядре. На сегодня в системах Nutanix на базе KVM в мире уже свыше 1200 нод, он поставляется уже около двух лет, их используют такие заметные компании как Nintendo, Swisslos (швейцарский оператор национальной лотереи), азиатский многопрофильный телеком-холдинг PCCW, и другие. Но одним гипервизором все не ограничилось, стоило ли поднимать столько шума из-за форкнутого KVM. Нет, все куда больше и хитрее, и вышедшая пару дней назад в паблик версия Nutanix OS 4.5 это только начало, в ближайшие месяцы, в минорных релизах появятся многие фишки, которые было решено выкатывать постепенно. О них я говорить не могу, упомяну только, что большого обновления дожидается наш GUI управления Prism, в который будет интегрировано много новых возможностей. Будет также несколько новых направлений использования Nutanix.
Но и без него есть о чем рассказать. Сейчас я расскажу о новинках бегло и в общих чертах, а затем, отдельными статьями по мере прибытия подробностей, буду рассказывать о каждой фиче подробно.
Итак, у нас есть свой гипервизор, созданный на ядре и основе KVM, и называется он Acropolis Hypervisor. Это, впрочем, не означает, что мы перестаем заниматься VMware ESX/vSphere или Microsoft Hyper-V, вовсе нет. Они по прежнему большой кусок парка наших пользователей, и по-прежнему будут поддерживаться, развиваться и расти. Но, вместе с тем, у нас появилась возможность «поиграть в свой блэкджек», и сделать какие-то вещи так, как мы считаем правильным. И, возможно, убедить в правильности нашего подхода пользователей.
Прежде всего, частью выкаченного обновления, кроме собственно AHV, стали две новые архитектурные концепции, которые, и это важно, являются полностью «кроссгипервизорными», то есть будут работать поверх любого гипервизора, не только с AHV, но и с VMware ESXi и c MS Hyper-V, и даже с будущими виртуальными, «облачными нутаниксами» в AWS и Azure.
Это то, что у нас стало называться Distributed Storage Fabric (DSF), и App Mobility Fabric (AMF).
Теперь «Acropolis» будет называться все вышеперечисленное.
В Distributed Storage Fabric будет входить все, связанное со «слоем» хранения данных на дисках, так, например, в рамках DSF будет развиваться наш Erasure Coding, о котором я уже писал, когда он появился в Technical Preview, и который вышел в продакшн как раз в опубликованной два дня назад NOS 4.5, и средства создания и работы со снэпшотами, мгновенными снимками состояния дискового хранилища вашей системы, и средства резервного копирования «в облако» внешних облачных провайдеров Amazon Web Services и MS Azure, и интеграция в сторонние бэкапные софты, такие как CommVault Simpana/IntelliSnap, и VM Flash Pinning, о котором отдельно чуть ниже.
В App Mobility Fabric войдут средства, связанные с кросс-гипервизорностью и миграцией приложений в среде кластера Nutanix. Я уже упоминал мельком, что Nutanix занят кросс-браузерностью, и сейчас у нас уже есть специальная capacity node, NX-6035C, «дисковая полка» для кластера Nutanix, придуманная для задачи недорогого расширения пространства хранения. При этом на 6035C стоят емкие и плотные недорогие жесткие диски, а работает это все — под KVM, однако, в отличие от других моделей, которые требуют составления кластера нод из узлов под управлением одного и того же гипервизора, единого во всем кластере, ноды 6035С c KVM внутри могут быть включены в кластер ESXi или Hyper-V. Причем важно, что при этом вам не потребуется докупать лицензии на сокеты для коммерческих гипервизоров, таких как vSphere. С учетом их цены — это существенная выгода.
В будущем у нас стоит задача обеспечить полную прозрачную кросс-гипервизорность для приложений. Вашему приложению, базе данных, веб-сервису, будет совершенно неважно, на каком гипервизоре он исполняется. Приложение — это то, что вам важно, на чем оно работает и как для бизнеса безразлично, если работает оно хорошо.
В настоящее время в рамках AMF у нас разрабатываются средства для легкой миграции из среды ESXi в среду Acropolis Hypervisor, а также средства High Availability, позволяющие перезапускать и сохранять доступность виртуальных машин при выходе из строя ноды-сервера, на которой она выполнялась.
Одной из интересных особенностей, которые появились в вышедшей 4.5, и на которых я обещал выше остановиться, стал VM Flash Pinning. Как следует из названия, это возможность «пришпилить» VM и ее vdisk-и на уровне Flash хранения.
Как я уже рассказывал ранее, одной из особенностей дисковой подсистемы Nutanix является ее двухуровневость и прозрачность уровней хранения для приложений. Все активные операции идут на SSD, и за счет этого обеспечивается скорость и производительность, а для «холодных», объемных, или пишущихся-читающихся последовательно данных доступен емкий и недорогой уровень, составленный из дисков SATA. По мере «остывания» данных они переносятся на SATA, прозрачно для приложения. Когда к данным снова появляется доступ, они вновь мигрируют на SSD. Все это выглядит прозрачно для приложения, и оно этим не управляет, у него есть просто большое пространство из суммы емкостей SSD и SATA дисков системы, и оно всегда быстрое. Ну или почти всегда.
Проблемы начинаются тогда, когда приложению быстрый доступ нужен всегда и ко всему объему данных. Когда время доступа и latency операций критически важно. Когда ситуация, когда к соседним блокам данных время доступа может быть существенно разным, потому что система решила, что этот блок данных никто не трогал уже час, а давай я его снесу на SATA, никто поди не заметит.
Под задачи, когда время доступа критично, и оно должно быть всегда постоянным (и предсказуемо субмиллисекундно постоянным) в наше время принято покупать All-Flash storage. Таких задач, положа руку на сердце, немного. Под них у большинства стораджевых вендоров созданы системы, называющиеся All-Flash Storage, есть они и у нас, это серия NX-9000. Однако широкое использование AllFlash довольно дорогое удовольствие.
Хорошо, когда денег много и IT-отдел может их тратить не считая, когда вы, допустим, банк «из первой сотни», крупный биржевой брокер или, например, крупный сервис бронирования авиабилетов, где промедление в доли секунды и правда вопрос успешности бизнеса в целом, просто покупаете Violin и забываете о проблеме года на три. Остальным все же приходится выбирать вариант достичь результата максимально эффективно имеющимися средствами. И один из них — закрепить VM с приложениями, которым нужны скорости SSD, на этих SSD, запретив с них мигрировать на более медленный Tier. В результате вы получаете высокую скорость отклика All-Flash для конкретного критичного приложения, и высокую эффективность хранения — для всех прочих приложений, плюс гибкость в расходовании дорогостоящего пространства на Flash.
Совсем коротко о возможностях App Mobility Fabric.
Одной из наиболее, на мой взгляд, интересных явился механизм миграции виртуальных машин из внешних, сторонних инсталляций VМware vSphere, в среду Nutanix KVM (AHV, Acropolis Hypervisor).
Несмотря на то, что в KVM уже некоторое время назад появилась возможность работать с файлами виртуальных дисков VMware (структуры *-flat.vmdk), оставался вопрос с драйверами «виртуального оборудования». Теперь же у Nutanix есть автоматизированный сервис встраивания драйверов VirtIO в виртуальные машины под управлением Windows, так что теперь, с нашим Imaging Service этот процесс создания и конвертирования образа виртуальной машины из под одного гипервизора в другой гипервизор стал еще проще.
Этой возможностью функциональность этой системы не ограничивается, и будет в дальнейшем расширяться, вплоть до полной победы нашей идеи про Invisible Infrastructure, IT-инфраструктуре, который «не видно», когда вы пользуетесь результатом ее работы, и для вас все равно как и какие нижележащие IT-средства вам этот результат доставляют.
Наконец, без особой помпы у Nutanix появилась интеграция с OpenStack, через специальный интеграционный механизм-драйвер, который позволяет встроить системы Nutanix в инфраструктуру OpenStack, про эту возможность недавно написал наш архитектор Steven Poitras, ведущий блог Nutanix Bible. Для занимающихся OpenStack тоже может быть интересно посмотреть что там.
Это пока все, о чем можно рассказать в октябре, ждем дальнейших объявлений в минорных релизах, с которыми будут добавляться функциональные модули, и помните, что обновление NutanixOS на системах Nutanix происходит non-disruptive, без остановки системы и доступности приложений и сервисов, выполняется из веб-интерфейса Prism в вашем любимом веб-браузере. На днях я как раз так обновил нашу тестовую систему, которую мы демонстрировали заказчику. Просто в течение часа, во время перерыва все и произошло, был скачан пакет обновлений, который развернулся и накатился на все четыре ноды кластера по очереди, причем в процесс была включена миграция VM с ноды на ноду кластера, инициация и выход из maintenance mode, и прочего. Все приложения при этом продолжили работать.