Диагностика HDD

Несмотря на то что стоимость жестких дисков постепенно снижается, зачастую ценность информации, которая на них хранится, очень высока. Вместе с тем, учитывая конструкцию и принцип работы HDD, они являются одним из наименее надежных составляющих компонентов ПК. Потому, если вам дороги ваши данные и в один момент вы не хотите лишиться всего накопленного за годы, можно воспользоваться простым методом экспресс-диагностики HDD, которая с большой вероятностью позволит избежать потерь информации.

Производители жестких дисков достаточно давно осознали необходимость наличия системы раннего предупреждения о потенциальных проблемах в работе накопителей. Прежде всего это нужно для возможности резервирования информации, хранимой на винчестере. История подобных систем началась в 1992 году, когда IBM стала использовать в своих серверных накопителях технологию Predictive Failure Analysis (PFA). Позже компания Compaq совместно с Seagate, Quantum и Conner создала усовершенствованную технологию IntelliSafe, позволяющую отслеживать большее число параметров HDD. Именно эти наработки в итоге послужили основой для нового стандарта, получившего название S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology).

Главным предназначением S.M.A.R.T. является извещение пользователя о надвигающихся неприятностях с жестким диском. Большинство проблем с винчестерами связаны с механическими сбоями и повреждениями. Однако, как правило, окончательному выходу из строя накопителя предшествуют некоторые косвенные признаки, как то: заметное повышение температуры HDD, посторонние шумы, пощелкивания, проблемы с чтением/записью информации, появление нечитаемых секторов (bad-блоков).

Итак, что же необходимо для того, чтобы проверить атрибуты S.M.A.R.T.? На нынешнем уровне развития технологии отслеживание всех параметров проводится автоматически, не требуя никаких дополнительных действий со стороны пользователя. Однако для того чтобы получить собранные накопителем сведения, нужно воспользоваться соответствующим программным обеспечением. Было бы вполне логично, чтобы функции мониторинга состояния S.M.A.R.T. брала на себя операционная система, но они не реализованы в современных ОС в явном виде. Потому для проверки используются самые разнообразные сторонние утилиты. Это могут быть как специализированные программы, единственной задачей которых является отслеживание необходимых параметров, так и универсальные инструменты, для которых просмотр атрибутов S.M.A.R.T. — это только одна из многочисленных обязанностей. Все, что нужно, — получить таблицу атрибутов. Для скрупулезного анализа данных требуются определенные знания и подготовка, однако для того чтобы понять, что с диском начало происходить что-то нехорошее, особых навыков не требуется.

К сожалению, технология S.M.A.R.T. не имеет четкого стандарта. Изготовители HDD могут по-своему интерпретировать различные параметры и даже использовать недокументированные. По этой причине при оценке S.M.A.R.T. можно наблюдать немало частных случаев, характерных не только для дисков различных производителей, но и для разных моделей одной линейки. Однако основные параметры в большинстве своем все же совпадают.

Что же можно увидеть в таблице S.M.A.R.T.? Это список параметров (как правило, 15-30), которые помимо названия имеют следующие поля: Value/ Current — текущее значение атрибута, Worst — наихудший показатель за все время работы накопителя, Threshold -критическое минимальное значение. Все это относительные показатели, которые изменяются в диапазоне от 0 до 253. В течение периода эксплуатации HDD текущие показатели (Value) атрибутов могут уменьшаться. При достижении ими порогового значения (Threshold) вероятность сбоя в работе накопителя предельно высока. Фактически в подобном случае производитель не гарантирует работоспособности HDD. Многие диагностические утилиты позволяют посмотреть поле Raw/Data, отражающее количественный показатель измеряемого параметра, которое для удобства обычно автоматически переводится в десятичный формат.

Различные модели накопителей имеют свой перечень параметров S.M.A.R.T.. Отдельно отметим критически важные атрибуты, изменения которых должны насторожить в первую очередь.

Raw Read Error Rate. Появление ошибок при чтении данных с HDD, как правило, говорит о проблемах с поверхностью магнитного диска или головок чтения/записи.

Spin Up Time. Время, необходимое накопителю на раскрутку дисков до «крейсерской скорости». Изменение этого параметра может быть вызвано нарушениями в работе двигателя привода, что недопустимо, когда речь идет о столь точном механическом устройстве. При изменении данного атрибута стоит подумать о более качественном БП. Нередко пульсации и недостаточное/избыточное напряжение питания приводит к неприятным последствиям в работе HDD.

Reallocated Sector Count. Переназначенные секторы де-факто уже являются bad-блоками, информация откуда перенесена в резервную область (spare area). При увеличении секторов, которым понадобился remapping, производительность накопителя может заметно снизиться.

Seek Error Rate. Ошибки позиционирования часто связаны с проблемами блока магнитных головок.

Ultra ATA CRC Error Rate. При возникновении ошибок при передаче данных по интерфейсу можно попробовать заменить кабель (SATA или IDE).

Непрерывное отслеживание состояния атрибутов S.M.A.R.T. для домашней системы, скорее всего, будет излишним. Однако периодически утилиту мониторинга стоит запускать для проверки даже в том случае, если накопитель работает исправно.

Увы, несмотря на постоянное развитие, рассматриваемая технология диагностики до сих пор несовершенна. Следует четко понимать, что S.M.A.R.T. может лишь спрогнозировать сбои в работе накопителя, но не способен им воспрепятствовать. Сложности с винчестером на аппаратном уровне могут возникнуть даже в том случае, когда для этого, казалось бы, нет никаких предпосылок. Однако анализ атрибутов часто помогает предвидеть проблему с HDD и избежать ее последствий. Несколько лет назад компания Google опубликовала результаты исследования работоспособности 100 тыс. жестких дисков. Так вот, согласно полученной статистике, порядка 64% сбоев были предсказаны S.M.A.R.T., потому периодический мониторинг данных параметров точно не лишен смысла. Предупрежден — значит вооружен.

  • Raw Read Error Rate Ошибки чтения данных с HDD (критичный параметр)
  • Spin Up Time Время раскрутки шпинделя жесткого диска (критичный параметр)
  • Start/Stop Count Количество запусков/остановок привода накопителя (информативный параметр)
  • Reallocated Sector Count Переназначенные (reallocated) секторы (критичный параметр)
  • Seek Error Rate Ошибки позиционирования магнитных головок (критичный параметр)
  • Power on Hour Count Количество отработанных часов (информативный параметр)
  • Spin Retry Count Число повторных попыток запуска привода (критичный параметр)
  • Hardware ECC Recovered Количество ошибок передачи данных, которые удалось исправить аппаратно (важный параметр)
  • Temperature Температура жесткого диска (информативный параметр)
  • Reallocated Event Count Число всех попыток переназначения секторов (критичный параметр)
  • Current Pending Sector Количество секторов, которые потенциально подлежат переназначению (важный параметр)
  • Ultra DMA CRC Error Count Количество ошибок при передаче данных по интерфейсу (важный параметр)
  • Write Error Count Общее число ошибок при записи (важный параметр)

Комментарий “Диагностика HDD

Комментарии закрыты