Естественный износ головок жесткого диска. Обнаружение и оценка
Введение
Выход из строя головок жесткого диска — довольно частая проблема, с которой встречаются специалисты по восстановлению данных. Причин выхода головок из строя несколько, наиболее часто встречаются:
1) Повреждения головок при аварийном завершении работы диска (залипание на поверхности, неправильный заход на парковку и т.п.).
2) Повреждения головок при физическом воздействии на диск (падение диска, удар по диску, сильные вибрации во время работы и т.п.).
3) Повреждения головок при электрическом шоке (сгорел блок питания, скачок напряжения в сети электропитания, переполюсовка при подключении питания (не спрашивайте меня как, разъем каким-то образом умудряются другой стороной забить) на накопитель и т.д.).
4) Заводской брак.
5) Естественный износ.
В этой статье я хотел бы поговорить о последней причине. Эта причина выхода из строя блока магнитных головок жестких дисков (естественный износ) лично мне кажется наиболее интересной, так как ее довольно сложно диагностировать. Обычно для первых четырех причин все более-менее понятно практически при первом же взгляде на головки, часто — даже без микроскопа. Естественный же износ невооруженным взглядом практически не виден.
Для чего это нужно? Не проще ли, обнаружив, что головки неисправны, просто заменить их и вычитать данные? Увы, нет. От того, что именно явилось причиной выхода из строя блока магнитных головок, зависит то, как мы будем подходить к процедурам восстановления доступа к данным. Поясню на примере.
Если головки вышли из строя в результате удара, то прежде, чем устанавливать в диск исправный узел, потребуется детальное исследование магнитных пластин: не пострадали ли они в результате удара? Нет ли где царапин, сколов? Не может ли установка нового блока магнитных головок без предварительной подготовки привести к новым повреждениям? Как следствие — значительно возросший список подготовительных процедур, вплоть до нанесения на повреждения поверхностей специальных химикатов.
Другой пример. Если головки вышли из строя при неправильной аварийной парковке — то потребуется другое исследование. Потребуется оценить, каким образом повреждены головки, не погнулся ли их слайдер, не привело ли это к потере фрагментов блока внутри гермозоны, и т.п. Соответственно, и порядок работ при восстановлении информации, опять же, будет другим, вплоть до доработки парковочного элемента внутри гермозоны и значительных модификаций микропрограммы накопителя.
Ну, а если головки вышли из строя в результате естественного износа, то в подавляющем большинстве случаев будет достаточно просто заменить головки и приступить к вычитыванию информации (конечно, при условии, что использованы исправные совместимые запчасти). Именно поэтому задача определения степени износа блока магнитных головок и видится мне достаточно важной.
Немного теории
Головка жесткого диска — узел, который во время работы накопителя парит над поверхностью диска, используя аэродинамические свойства своего слайдера. Для обеспечения максимальной эффективности аэродинамики поверхность MR-элемента головки выполняется идеально ровной и имеет определенный рисунок из углублений и выпуклостей.
Скорость вращения шпиндельного двигателя современного жесткого диска может варьировать от 5400 до 15000 оборотов в минуту в зависимости от назначения накопителя. Многие ноутбучные накопители делаются для увеличения энергетической эффективности низкооборотистыми; диски для серверов и высокопроизводительных платформ делаются высокооборотистыми. При такой скорости вращения внутри диска образуется мощный воздушный поток, который и используется для аэродинамики головок.
Однако у этого воздушного потока есть и другой эффект — постепенное выбивание из керамических и пластиковых частей блока магнитных головок, находящихся в непосредственном с ним соприкосновении, мелких частиц. Банальное выветривание, если говорить терминами школьного природоведения. Для того, чтобы эти частицы не повреждали поверхность (хотя, конечно, полностью этого избежать нельзя) в диске устанавливается фильтр-уловитель мелкодисперсной пыли, который находится в таком месте, где он может охватить максимальный объем проходящего воздушного потока. Борьба же с микроповреждениями поверхности, которые все-таки произошли, происходит посредством дефект-менеджмента микропрограммы жесткого диска: дефектные сектора заносятся в растущий лист дефектов и переназначаются на исправные сектора из резерва диска.
Естественный износ: как проявляется
Как правило, естественный износ блока магнитных головок начинает проявляться задолго до того, как жесткий диск окончательно выйдет из строя. Не замечают его только те, кто не следит за состоянием своего компьютерного железа в принципе. В жестком диске имеется подсистема SMART, которая накапливает статистику ошибок (переназначенные сектора, неудачные попытки старта, количество попыток переназначить сектор и т.п.), исходя из которой делается примерный прогноз выхода диска из строя. При запуске компьютера подсистема SMART опрашивается, и если все хорошо, то компьютер загружается; если же какой-то из атрибутов SMART «просел» настолько, что вышел за границы нормальности, вы увидите сообщение на втором экране POST BIOS такого типа: Hard Disk Drive XX SMART Status BAD, или похожее по смыслу. Запуск компьютера будет возможен только по нажатию одной из функциональных клавиш (обычно это F1).
К сожалению, довольно многие пользователи, имеющие проблемы с первоначальной сборкой компьютера (например, неправильный монтаж CPU FAN), которая приводит к постоянному появлению таких сообщений (что-то типа «CPU FAN speed error») и необходимости нажатия функциональной клавиши для продолжения запуска компьютера, отключают эту функцию в BIOS. В этом случае при запуске машины игнорируются все уведомления, и увидеть, было ли уведомление о плохом SMART-статусе диска при старте, становится невозможно.
Правда, операционная система Windows также распознает диски с плохим SMART-статусом, но для фактически уже умирающего диска это может оказаться слишком поздно. Да и не всегда этот механизм отрабатывает, как показывает практика: довольно часто диски с одним — двумя «просевшими» атрибутами могут не вызывать у Windows никаких подозрений весьма продолжительное время. Поэтому — смотрите накапливаемую SMART статистику, она полезна. Следить за ней можно с помощью массы бесплатных утилит, например — Victoria.
Износ диска начинается с момента начала его эксплуатации, но вначале он происходит с низкой интенсивностью. По истечении определенного времени, когда степень износа достигает определенного, критического, значения, изнашивание переходит из линейного в экспоненциальный рост, и диск переходит в неисправное состояние довольно быстро.
Основные признаки перехода диска на стадию износа по экспоненте: быстрый рост количества переназначенных секторов в отчете SMART, рост количества ошибок при попытках переназначить сектор, «подтормаживания» диска, появление «тыркающих» звуков при обращении к определенным файлам или папкам. На финальном этапе износа появляется большое количество дефектных секторов (система дефект-менеджмента уже не может справиться с потоком появляющихся дефектов), серьезные тормоза в работе диска. Выход из строя головки (или нескольких головок) по причине износа — апофеоз этого процесса. Компьютер перестает загружаться или загружается очень медленно, вы не можете скопировать никакие свои файлы, все жутко тормозит, и, наконец, просто перестает работать. Все. Головки изношены и больше не могут ничего прочитать.
Справедливости ради надо сказать, что у некоторых накопителей активирована система блокировки микропрограммы в случае ее проблем (в том числе — и дефект-менеджмента). В этом случае диск отказывается работать (либо не определяется вовсе, либо определяется, но не отдает емкость, либо определяется «заводским» именем, и т.п.). Блокировка предотвращает критический износ в случае, если диск подошел непосредственно к этой грани, при условии, что пользователь не будет пытаться «запустить» диск с помощью многократных включений («а вдруг заведется»), танцев с бубном и сомнительных рекомендаций из интернета («на полной луне положите свой диск на системный блок, плюньте три раза в вентилятор процессора и, когда прилетит обратно, произнесите «Информация вернись, жесткий диск загрузись» и тому подобная антинаучная ересь). Тут только один правильный совет: нести заблокированный диск людям, которые понимают, как вытащить из него данные.
Диагностика естественного износа блока магнитных головок с помощью микроскопа
Микроскопирование головок жесткого диска уже давно стало стандартом в индустрии восстановления данных. Обследование головок под микроскопом дает возможность выявить поверхности, на которых имеются серьезные повреждения (пыль на головках, полированная поверхность головки и т.п.), выявить природу происхождения повреждений головок и т.п. Однако общепринятой методики выявления естественного износа головок нет.
С учетом того, что износ головки — это прежде всего выбивание из ее поверхности микрочастиц в результате воздействия сильного тока воздуха (микроповреждения поверхности), вполне логично, что оценить степень износа можно по состоянию ее рельефа. Однако при стандартном освещении можно увидеть только крупные изъяны рабочей поверхности MR-элемента; для того, чтобы «проявить» микрорельеф полностью, требуется два источника света: основной, направленный перпендикулярно поверхности, и некое подобие контрового света, направленного под небольшим углом (20 — 30 градусов) к поверхности. Для усиления «проявления» микрорельефа в качестве основного источника света мы использовали обычный белый свет от кольцевой галогеновой лампы, а в качестве дополнительного («контрового») света использовался светодиод теплого синего свечения.
Установка для исследования, таким образом, состоит из: тринокулярный микроскоп МС-ВП; переходник на байонет Canon EF, камера Canon EOS 5D Mark II, кольцевая лампа Model 2401, источник «контрового» света — штатный осветитель микроскопа с замененным светодиодом.
Установка для исследования степени износа блока магнитных головок жесткого диска.
При обычном освещении прямым светом на поверхности MR-элемента заметны только крупные повреждения рельефа. Это и понятно: свет идет сверху вниз под прямым углом, источник света — со всех сторон (кольцевой осветитель); при этом тени практически не отбрасываются. Введение в световую схему «контрового» источника света позволяет увидеть тени от многочисленных микронеровностей поверхности и оценить характер повреждения MR-элемента.
Пример
В качестве примера возьмем два одинаковых достаточно старых накопителя, у которых процесс износа уже идет давно, но один диск находится в критическом («предсмертном») состоянии, а второй в состоянии, когда SMART-статус только начинает предупреждать о возможном скором выходе из строя диска (диск только выходит на экспоненциальный рост износа). Диски Seagate ST3160215AS, семейство Seagate Barracuda 7200.10, емкость 160 Гбайт. В конструкции гермозоны используется 2 головки. Условия съемки одинаковые: ISO 320, выдержка 1/30, F 0 (диафрагма полностью открыта, так как съемка идет через микроскоп).
Диск в «предсмертном состоянии» имеет крайне печальные атрибуты SMART и огромное количество дефектов. Диск, SMART которого только начал показывать ошибку, имеет ровный график чтения и менее печальные показатели атрибутов SMART.
График чтения подопытного диска в критическом состоянии износа, первые 3 млн. секторов.
Атрибуты SMART подопытного диска в критическом состоянии износа.
График чтения подопытного диска в предкритическом состоянии износа, первые 3 млн. секторов.
Атрибуты SMART подопытного диска в предкритическом состоянии износа.
Посмотрим на головки сначала при обычном освещении сверху. Поверхность MR-элемента выглядит ровной.
Общий вид микрорельефа MR-элемента головок диска Seagate ST3160215AS, под прямым источником света.
Ну, а теперь давайте включим «контровый» свет. Картинка рельефа преобразилась: там, где у нас при обычном освещении видны углубления, при двойном освещении они выглядят, как выпуклости, а «зернистость» поверхности заметно увеличена.
У диска с меньшим износом поверхности MR-элемента размер зерна относительно мельче, но самое главное — нет крупных выбоин. Диск с большей степенью износа обладает относительно более крупной зернистостью и имеет хорошо видимые крупные выбоины на поверхности MR-элемента.
Разная степень зернистости микрорельефа одного участка поверхности MR-элемента головок накопителей Seagate ST3160215AS c разной степенью износа, масштаб 100%.
Общи вид микрорельефа поверхности MR-элемента головок накопителей Seagate ST3160215AS c разной степенью износа.
Заключение
Использование описанной методики позволяет с высокой степенью достоверности определять головки жесткого диска, вышедшие из строя в результате естественного износа. Мной методика используется для всех дисков, поступающих с диагнозом «неисправный блок магнитных головок», поскольку исследование головок под микроскопом — обязательная часть диагностики. Однако, хочу оговориться: крайне нежелательно в качестве источников основного света использовать точечные лампы, в особенности — яркие светодиоды. Для идеального проявления рельефа поверхности нам требуется равномерное освещение поверхности.