Будущее за флэш-памятью: IBM FlashSystem

Время — ключевой фактор в бизнесе, особенно в критически важных бизнес-приложениях. Те, кто видел фильм «Аполлон-13», или люди постарше, помнящие этот злополучный космический полет, знают, что бывает, когда критически важные системы выходят из строя. По сюжету фильма три американских космонавта отправляются на Луну, но в пути космический аппарат взрывается и получает серьезные повреждения, а они лишь чудом остаются в живых. Космонавтам удается вернуться домой только благодаря героическим усилиям и толике везения. К счастью, последствия сбоя критически важных бизнес-приложений редко бывают столь же серьезными (по сравнению, скажем, с приложениями, от которых зависит работа служб и учреждений, например, в отделениях интенсивной терапии, авиадиспетчерских службах и т. д.). Но с другой стороны — сбои таких приложений напрямую отражаются на жизнеспособности компании: если системы работают безупречно, компания экономически здорова и развивается, если нет — она с трудом удерживается на плаву.
1cb80ec167b949c591c12e6a1253cba8.jpg

К разряду критически важных для бизнеса относятся приложения для самых разных задач, например: бизнес-аналитика (BI — business intelligence), оперативная транзакционная обработка (OLTP — online transaction processing), оперативная аналитическая обработка (OLAP — online analytical processing), инфраструктура виртуальных рабочих столов, высокопроизводительные вычислительные системы и приложения для доставки содержимого (облачные системы хранения, предоставление видео по запросу и т. д.). Все эти важные задачи объединяет одно: высокие требования к скорости работы, ведь от нее зависит то, насколько быстро руководство, сотрудники, клиенты и другие ключевые деловые партнеры получат доступ к нужной информации.

Невозможность быстро получить доступ к важным данным и обработать их приводит к существенным деловым и финансовым рискам. В частности, такие задержки вызывают:

— Неспособность своевременно и правильно оценить ситуацию — не имея доступа к критически важным данным в нужное время и в нужном месте, люди не видят полной картины происходящего и, как следствие, принимают неправильные решения, допуская совершенно необязательные ошибки.

— Резкое снижение способности прогнозировать результаты бизнеса — качество финансовых прогнозов на уровне отдельного проекта, отдельного направления деятельности и всей компании зависит от возможности своевременно получать самые точные данные. Не имея доступа к таким данным, компания не может их проанализировать, что негативно отражается на ее деятельности.

— Рост недовольства клиентов — во многих отраслях (финансовые услуги, здравоохранение, туризм и т. п.) качество сервиса напрямую зависит от наличия мгновенного доступа к актуальной информации, особенно в связи с тем, что современный клиент ожидает обслуживания в круглосуточном режиме 7 дней в неделю и 365 дней в году. В этих условиях неспособность оперативно предоставить клиентам нужную информацию не только означает упущенную прибыль, но и зачастую ведет к потере клиента, а то и доли рынка.

— Слишком большие объемы, разнообразие и скорость поступления информации — взрывной рост объемов данных ведет к неизбежному падению производительности основных приложений на многих предприятиях. Увеличение задержек становится источником недовольства пользователей, и предприятия упускают возникающие возможности.

Руководителям отделов ИТ, ищущим решение этих проблем, которое бы имело оптимальное сочетание функционала, времени внедрения, масштабируемости и стоимости систем, не позавидуешь. В конечном счете, верное решение может оказаться далеко не очевидным.

Постановка задачи (подсказка: скорость процессора — неправильный ответ)

Как правило, на замедление работы системы отдел ИТ реагирует в первую очередь добавлением или модернизацией процессоров и памяти. Однако слишком часто прирост производительности от этой модернизации минимален, тогда как стоимость высока. Второй метод, зачастую сопутствующий первому, по крайней мере, применительно к базам данных, — это оптимизация инструкций SQL. Предприятия тратят на нее миллионы долларов и даже получают какие-то результаты. Но упускают из виду тот факт, что и самая идеальная база данных будет бессильна перед низкой скоростью работы системы хранения данных, а именно последняя часто и является источником проблемы.

Действительно, первопричина проблем с производительностью приложений зачастую кроется в системе хранения данных, а не в скорости процессора или нехватке памяти. Когда процессор простаивает в ожидании информации от системы хранения, драгоценное время и ресурсы расходуются впустую. А учитывая то, что в последние 20 лет вычислительная мощность процессоров растет в геометрической прогрессии, этот простой становится все больше и больше. Проще говоря, вычислительные ресурсы современных процессоров намного превосходят скорость, с которой жесткие диски могут доставлять им данные. Особенно остро этот разрыв в производительности ощущается в серверах баз данных, где количество операций ввода-вывода обычно гораздо больше, чем в других системах. В итоге сверхбыстрые процессоры и огромная пропускная способность часто задействованы далеко не на полную мощность, потому что на доступ к данным на жестких дисках уходит по несколько миллисекунд, что для современных процессоров — целая вечность. А когда серверы долго ждут данных от систем хранения, пользователи долго ждут ответа от серверов. Вот где реальный источник проблемы с низкой скоростью операций ввода-вывода.

Эта проблема обусловлена чисто физическими причинами. Перемещение данных на твердотельных накопителях и через сеть происходит на скорости, сопоставимой со скоростью тока в электрической цепи, т. е., по сути, скорости света, тогда как жесткие диски — это устройства механические, считывающие информацию за счет вращения пластины. Таким образом, при всей своей надежности и работоспособности жесткие диски в плане скорости доступа являются однозначно самым слабым звеном в цепи передачи информации.

Недостатки традиционных путей обхода проблемы со скоростью HDD

Проблемы с производительностью из-за неэффективности жестких дисков пытаются решать несколькими способами, в частности, созданием массивов JBOD (just a bunch of disks — просто набор дисков) или RAID (redundant array of independent disks — избыточный массив независимых дисков). С увеличением количества дисков появляется возможность распределять операции ввода-вывода, осуществляемые базой данных, по нескольким дискам. К сожалению, это дает слишком скромный прирост производительности HDD.

Еще принято перемещать часто используемые файлы на отдельный диск. Скорость операций ввода-вывода у одного диска при этом действительно вырастает до своего максимума, только вот даже на максимуме эта скорость по-прежнему невысока. В лучшем случае один жесткий диск выдает ~200, без применения дополнительного функционала, операций ввода-вывода в секунду (IOPS — input/output operations per second), что в разы ниже скорости, которая могла бы сократить разрыв в производительности между процессором и HDD.

Третьим традиционным способом повысить производительность HDD является замена JBOD на RAID. Производительность в результате действительно вырастает, особенно если подключить диски к контроллеру с бОльшим кэшем, который будет распределять данные по разным дискам. Но при этом, чтобы достичь высокой скорости операций ввода-вывода, ожидаемой пользователями, потребуется такое количество дисков, что их стоимость, занимаемое пространство, энергопотребление, тепловыделение и вес окажутся просто-напросто неприемлемыми.

Ответ: системы хранения только на базе флэш-памяти

Разрыв в производительности между вычислительной мощностью серверов и системами хранения данных на жестких дисках, особенно остро ощущаемый в критически важных бизнес-приложениях, требует принципиально иных, более быстрых систем хранения.

Системы хранения на базе флэш-памяти — это устройства с твердотельными накопителями, призванные решить проблему с недостаточной скоростью операций ввода-вывода; их скорость доступа к данным и операций ввода-вывода в разы лучше, чем у жестких дисков. Эти системы хранения могут дополнять или полностью заменять традиционные массивы из жестких дисков для многих критически важных бизнес-приложений, включая ERP-системы, транзакционные базы данных и аналитические приложения (бизнес-аналитика и т. п.). Более того, в связи с постепенным снижением цен на эти новые устройства сегодня вполне возможно построить целую систему хранения на базе одной флэш-памяти.

В широком смысле слова под SSD (solid state drive — твердотельный накопитель) понимается любое устройство ввода-вывода данных, лишенное механических компонентов. Однако в последнее время термин SSD используется в основном для обозначения твердотельных накопителей, имеющих традиционный форм-фактор жесткого диска и идущих ему на смену. SSD-накопители такого форм-фактора не следует путать с системами хранения на базе флэш-памяти. Интерфейсы и контроллеры таких SSD-накопителей основываются на традиционных для жестких дисков технологиях, которые создавались исходя из присущих HDD задержек доступа и ограничений пропускной способности. Системы же хранения на базе флэш-памяти изначально разрабатывают исходя из особенностей этой технологии и в расчете на быстрый контроллер FPGA, ставя цель минимизировать задержку и получить максимальную пропускную способность.

У современных систем хранения на базе флэш-памяти время ожидания операций ввода-вывода сокращено за счет того, что скорость доступа в 250 раз быстрее, чем у жестких дисков (0,2 мс против 5 с). А увеличение скорости доступа в свою очередь позволяет флэш-памяти выдавать в 2000 раз больше операций ввода-вывода в секунду, чем у HDD (400 000 с лишним IOPS против 200). Такое улучшение может резко сократить задержки доступа к информации, обусловленные медлительностью системы хранения.

Внедрение технологий флеш накопителей или замена существующих дисков позволяет, серверам любой архитектуры, увеличить возможности ЦПУ по количеству выполняемых задач за единицу времени. Так на примере IBM Power Systems прирост производительности сервера при работе с БД Oracle достигал до 40% на открытых тестированиях, что позволяет значительно увеличить эффективную утилизацию существующей инфраструктуры. То есть сервер без изменения конфигурации сможет выполнять на 40% больше запросов за тот же период времени.

Семейство IBM FlashSystem

IBM считает флэш-память стратегически важной технологией хранения данных и ставит своей целью быть в авангарде разработки систем хранения только на базе флэш-памяти. (Одним из следствий этой политики стала покупка в октябре 2012 года компании Texas Memory Systems (TMS) — высококлассного производителя мощных и надежных систем хранения на базе флэш-памяти.)

Целенаправленное использование IBM FlashSystem помогает предприятиям повысить свою гибкость и эффективнее задействовать аналитику — персонал в любой момент может оперативно получить информацию, которая всегда актуальна, поскольку поступает в режиме реального времени, а не с большими задержками. Кроме того, эта система способствует оптимизации центров обработки данных и консолидации ресурсов, в результате чего растет эффективность бизнес-процессов и работы критически важных приложений. Повышается и устойчивость систем, причем без потерь производительности и доступной емкости.

Системы хранения только на базе флэш-памяти имеют емкость больше, чем у всех предыдущих технологий хранения данных. Это объясняется тем, что они не требуют дополнительных батарей для копирования DDR-кэша в случае отключения электроэнергии, равно как и обходятся без большого количества дорогих модулей DDR-памяти. Объем нужной им DDR-памяти минимален — она служит в качестве буфера записи для флэш-памяти и хранилища метаданных во время работы. Электропитание, необходимое, чтобы в моменты отключения электроэнергии скопировать небольшой кэш и метаданные на флэш-память, обеспечивается маленькими батареями. Система хранения данных только на базе флэш-памяти с 57-ю терабайтами адресуемой памяти и высоким уровнем доступности имеет размер всего 2U.

В продуктах IBM FlashSystem применяется технология FlashCore которая позволяет используя тип носителя многоуровневого класса MLC получить показатели сроков хранения и производительности не хуже, чем SLC.

Системы хранения FlashSystem способны на 1 000 000 операций чтения в секунду с задержкой менее 100 микросекунд и при этом настолько компактны, что в одном отсеке 2U можно разместить устройства емкостью до 57 ТБ. Другим немаловажным преимуществом является высокий уровень доступности и надежности, обязательный для предприятий: отсутствие компонентов, отказ которых приводит к отказу всей системы, наличие нескольких уровней коррекции данных, резервных микросхем и компонентов с поддержкой «горячей замены».

Продукты IBM FlashSystem имеют наименьшую задержку и наивысший показатель IOPS среди конкурентов и при этом привлекательны с точки зрения совокупной стоимости владения. Нужно учесть что сравниваются не отдельные параметры, а совокупность времени отклика и количества операций ввода-вывода. Они могут использоваться в качестве систем хранения т. н. уровня 0 (Tier 0, т. е. превосходящего по возможностям традиционный уровень Tier 1 — системы хранения данных, необходимых для первоочередных задач предприятия) в комбинации с SVC (IBM System Storage SAN Volume Controller). Также IBM FlashSystem будут особенно полезны, когда работоспособность критически важных бизнес-приложений напрямую зависит от охлаждения, низкого энергопотребления и компактного размера. На сегодня представлены две основные модели IBM FlashSystem 900 и IBM FlashSystem V9000. Первая занимает 2 юнита и обеспечивает высокую производительность в то время как вторая система занимает 6U и дополнительно к высоким показателям обладает набором High End функционала. Что позволяет оптимизировать использование объёма, более эффективно распределять нагрузки, создавать кластера хранения как в пределах датацентра так и географически разнесённые. В ближайшие дни планируется к запуску новейшая разработка которая увеличит портфель предлагаемых систем и добавит функционал в линейку IBM FlashSystem.

Экономические выгоды IBM FlashSystem

Системы хранения только на базе флэш-памяти имеют не только технические преимущества, но и ряд экономических выгод по сравнению с традиционными системами на базе HDD. Например, стоимость лицензирования ПО для систем хранения IBM FlashSystem на 50% ниже, чем у систем на базе HDD.

К тому же гораздо меньший размер и более высокая плотность хранения данных позволяют значительно сократить занимаемую площадь. Как отмечалось выше, система хранения данных только на базе флэш-памяти с 57-ю терабайтами адресуемой памяти и высоким уровнем доступности имеет размер всего 2U. Таким образом, в одной стойке можно разместить систему емкостью более чем 1 петабайт.

Системы хранения данных только на базе флэш-памяти также гораздо более энергоэффективны, чем сопоставимые системы на базе HDD, — затраты на электроэнергию ниже на 75%.

— Стоимость лицензирования ПО для IBM FlashSystem на 50% ниже, чем у систем на основе HDD.
 — IBM FlashSystem занимает значительно меньше места и экономит до 75% электроэнергии по равнению с HDD.
 — Стоимость эксплуатационной поддержки систем на базе флэш-памяти на 35% ниже по сравнению HDD
 — Совокупная стоимость системы хранения данных только на базе флэш-памяти на 31% меньше, чем у HDD

Переход на флэш-память

Залогом максимальной отдачи и экономической эффективности флэш-памяти является стратегическое ее использование. Система хранения только на базе флэш-памяти полезна многим приложениям, но далеко не всем; в первую очередь она нужна основным приложениям предприятия. Ключ к высокой производительности приложений, удовлетворению пользователей оптимальной совокупной стоимости владения лежит в умении идентифицировать те приложения, которые выиграют от перехода на системы хранения только на базе флэш-памяти, и те, которым хватит традиционных систем на базе HDD или же гибридных систем на основе комбинации этих технологий.

Низкая производительность приложений обычно связана с большим объемом одновременных и зачастую высокосложных запросов к базе данных. Если слабым звеном при этом является подсистема ввода-вывода, то необходимо выявить компоненты базы данных, которые работают под наибольшей загрузкой и таким образом вызывают задержку в операциях ввода-вывода.

В некоторых случаях на системы хранения на базе флэш-памяти переносят целые базы данных. Обычно это БД со стандартно высоким объемом одновременных запросов или регулярным случайным доступом ко всем таблицам БД, когда вычленить подмножество наиболее часто используемых файлов не представляется возможным.

Хорошо подходят для переноса на системы хранения на базе флэш-памяти также БД малого и среднего размера, потому что такие решения крайне привлекательны по цене, особенно по сравнению с RAID-системами. Аналогичное справедливо для крупных баз данных с большим количеством запросов на чтение.

Другие доводы в пользу флэш-памяти — это такие недостатки больших дисковых массивов из HDD, как большая занимаемая площадь и высокое энергопотребление.

Дополнительные ресурсы

Для получения дополнительных сведений о системах хранения только на базе флэш-памяти и семействе IBM FlashSystem предлагаем ознакомиться со следующими источниками:

Видео: «Практический взгляд на флэш-память»

Видео: «Будущее за флэш-памятью от IBM»

Видео: «Где нужна флэш-память»

Видео: «Флэш-память против дисков»

Видео: «Системы хранения на базе флэш-памяти — настоящий прорыв»

Технический документ: «Повышение производительности БД Oracle в связке с IBM FlashSystem»

«Флэш-память или SSD: для каких целей нужна IBM FlashSystem»

«Преимущества IBM FlashSystem в среде VDI»

«Лучшие методики использования SVC и FlashSystem 820»

«Руководство по решению: IBM FlashSystem в БД на базе OLAP»

«Пример внедрения: система хранения данных на базе флэш-памяти применяется компанией Rathbone Brothers Plc для управления инвестициями на миллиарды долларов»

«Пример внедрения: Sprint повышает производительность в 45 раз и резко улучшает качество обслуживания клиентов, внедрив сверхбыструю систему хранения на базе флэш-памяти IBM»

Комментарии (3)

  • 23 августа 2016 в 10:52

    0

    57-ю терабайтами… всего 2U

    мегабакс в 2U?
    У кого-нибудь на памяти есть девайсы такой замечательной ёмкости?
  • 23 августа 2016 в 12:40

    0

    Проблемы с производительностью из-за неэффективности жестких дисков пытаются решать несколькими способами, в частности, … или RAID (redundant array of independent disks — избыточный массив независимых дисков)

    RAID не решает проблемы с производительностью HDD, он их создает, так как задача RAID — не повышение производительности, а сохранение информации в случае отказа одного или более HDD за счет дублирования этой информации. соответственно, у каждого RAID есть RAID-пенальти — фактор, который показывает отношение количества фактических операций записи на одну операцию, прилетевшую на массив. Для RAID5 фактор пенальти равен 4 — прилетела одна запись, а реально записали 4 раза.
    • 23 августа 2016 в 13:15 (комментарий был изменён)

      0

      Помимо пенальти (на запись) там есть такой фактор как количество шпинделей, так что еще как решает, бенчмарки хотя бы посмотрите прежде чем такое писать

© Habrahabr.ru