Надёжность SSD в реальном мире: опыт Google

cc11298490bc42058e87c1344bcb3728.jpgНа конференции FAST 2016 компания Google представила доклад со статистикой надёжности разнообразных SSD-накопителей при длительной работе в серверах. Собрана статистика по общей наработке в миллионы часов за шесть лет. Это первое масштабное и детальное исследование практической надёжности твёрдотельников.

Доклад опубликован на страницах 67–80 сборника докладов конференции.

В серверах Google установлены десять моделей SSD-накопителей (правда, конкретные производители не называются) трёх типов: MLC, eMLC и SLC. Это накопители как корпоративного класса, так и бюджетные потребительские.

Опыт практического использования принёс несколько неожиданных результатов.
Неожиданным оказалось, что на надёжность накопителей влияет возраст, а не интенсивность использования.

Ещё один неожиданный результат: «профессиональные» накопители SLC не более надёжны, чем обычные MLC.

212e12209066429e86a35f28e06f20b0.png

01cbd6b94a9848a3873e0742cb7a301c.png

Выяснилось также, что в новых накопителях постоянно встречаются плохие блоки, это вполне обычное явление. При этом чем больше плохих блоков изначально, тем более вероятно появление сотен новых плохих блоков в будущем. Вероятно, это связано с аппаратными сбоями.

e99ebf5807564aadb96a397b99395dc1.png

По статистике, у 30–80% SSD-накопителей появляется хотя бы один новый плохой блок в течение первых четырёх лет эксплуатации. Сбой микросхемы за тот же срок наблюдается у 2–7% накопителей.

155f16e3296c4ed88327a3f16b582394.png

Ещё одно, на чём делают акцент исследователи Google: сбои SSD-накопителей случаются реже, чем сбои винчестеров, но они коварнее, потому что у SSD выше количество неисправимых ошибок (uncorrectable error). При этом, как упоминалось выше, показатель не зависит от количества циклов чтения и записи, так что значение UBER (Uncorrectable Bit Error Rate) в документации накопителя не имеет смысла.

© Geektimes