Всем известно, что любая техника, рано или поздно требует профилактики и ремонта, а в тяжелых случаях и замены. Уровень сложности современной аппаратуры настолько велик что зачастую производитель встраивает системы мониторинга состояния работоспособности. Современная техника сама в состоянии предупредить владельца о текущем состоянии дел. Одним из сложнейших устройств является жесткий диск вашего компьютера, о его системе мониторинга мы и поговорим в статье.
S.M.A.R.T.
В этой статье я хочу поделиться с читателем информацией о технологии — S.M.A.R.T. Дословная расшифровка аббревиатуры S.M.A.R.T. звучит так — Self-Monitoring, Analysis and Reporting Technology (технология мониторинга, самоанализа и оповещения).
Самое интересное что S.M.A.R.T. , если написать без точек, переводится как «умный». И действительно, система смарт делает жесткий диск компьютера умнее.
Стоит обратить внимание читателей на то, что технология S.M.A.R.T. не может решить возникшую проблему с винчестером, ее единственное предназначение — мониторинг состояния, оповещение пользователя о проблеме, либо ее скором появлении. Также S.M.A.R.T. не в состоянии предсказать проблемы возникшие в результате скачков напряжения , либо других внешних факторов
Историческая справка.
Все начиналось в далеком 1995 году. Компанией IBM была предложена технология Predictive Failure Analysis (PFA) которая позволяла в режиме реального времени следить за состоянием накопителя, и с высокой точностью предсказать повреждение или выход его из строя.
Теми же возможностями обладала технология Intelli Safe от компании Compaq. Не обошлось здесь и без таких гигантов компьютерной индустрии как Seagate, Quantum, Conner, объединившись с Compaq они также принимали участие в разработке. Конечно, наработки вышеуказанных компаний никак не спасали винчестеры от поломки, но, сводили к минимуму потерю на нем информации.
Первое рождение технологии S.M.A.R.T произошло после объединения всех гигантов для совместной разработки технологии удовлетворяющей современные требования.
Думаю нетрудно догадаться что S.M.A.R.T базируется на существовавших тогда PFA и Intelli Safe.
Первая реализация технологии S.M.A.R.T позволяла контролировать всего лишь 20% предполагаемых сбоев. Во второй реализации S.M.A.R.T была введена проверка поверхности накопителя в фоновом режиме, увеличен процент контролируемых параметров, он составлял уже 50%, технология вела собственный журнал ошибок набор контролируемых параметров был существенно расширен.
Эра S.M.A.R.T. III
Параметры, за которыми ведется наблюдение именуются атрибутам. Каждому атрибуту присвоен идентификатор (ID), текущим значением (нормализованным), наихудшим значением (worst), а также пороговым значением (threshold). Каждый атрибут обладает максимальным значением, это может быть 100, 253,255 (все зависит от производителя), и не нормализованным (Raw Value). Уровень максимального, порогового и наихудшего значения разнятся у производителей жестких дисков, они сами устанавливают эти значения.
Это говорит о том что технология S.M.A.R.T. не стандартизирована, с одной стороны это хорошо, а вот с другой — хорошего мало.
Очень часто случается что атрибут с одним идентификатором может иметь различные названия хотя за ним стоит один и тот же контролируемый параметр, или наоборот — идентификатор один, а параметры разные.
Атрибуты.
Существует всего лишь два вида атрибутов — критические и некритические. Изменение критического атрибута в сторону порогового значения означает что скоро ваш винчестер выйдет из строя. В случае когда некритический атрибут достигает своего порогового значения последует только ухудшение работы накопителя, но никак не поломка.
Вот некоторый список критических атрибутов:Raw Read Error Rate (ID=0x01) — атрибут ссылается на частоту ошибок при чтении данных с носителя. Происхождение ошибок обусловлено его аппаратной частью.
Spin Up Time (0x03) — величина времени необходимая для раскрутки пакета дисков находящих в состоянии покой до рабочего состояния. При расчете нормализованного значения текущее время раскрутки сравнивается с эталонным значением, установленным производителем. Неухудшающееся максимальное значение Spin Up Retry Count (RAW, равном 0) никоем образом не свидетельствует о поломке жесткого диска. Разница между эталонным временем и действительным может быть вызвана рядом сторонних причин. Одной из таких причин может быть ухудшение работы блока питания компьютера.
Reallocated Sector Count (0x05) — число равное количеству операций переназначения секторов. Дело в том что S.M.A.R.T. в состоянии «на ходу» произвести детальный анализ состояния секторов на их стабильность, и после признания сектора сбойным произвести его переназначение.
Seek Error Rate (0x07) — частота проявления ошибок при позиционировании блока головок винчестера. Высокое RAW-значение показатель наличия проблемы при позиционировании. Одной из причин высокого RAW-значения является повреждение сервометок. Чрезмерное термическое расширение дисков, либо механические повреждения в блоке позиционирования также могут быть причиной высокого RAW-значения.
Spin Up Retry Count (0x0A) — данный атрибут характеризует число повторных попыток раскрутки дисков винчестера до рабочей скорости. Срабатывает атрибут при неудачной первой попытке раскрутить диски. Ненулевое значение RAW дает нам понять что присутствует проблема в механической части жесткого диска.
Перечень некритических атрибутов:Start/Stop Count (0x04) — атрибут характеризует полное число запусков/остановок шпинделя жесткого диска. Дело в том что двигатель винчестера способен выдержать определенное (гарантированное) количество включений/выключений. Данное значение выбирается в качестве threshold (пороговое значение).
Power On Hours (0x09) — в данном атрибуте отражается число часов работы винчестера во включенном состоянии. Обычно значение данного атрибута ровняется паспортному времени работы жесткого диска на отказ (MBTF). Учитывая что величина MBTF неимоверно велика, обычно параметр не достигает критического порога. Даже если представить достижение критического значения, выход из строя винчестера маловероятен.
Drive Power Cycle Count (0x0C) — атрибут отображает количество полных рабочих циклов включения-выключения диска. Принимая во внимание предыдущий атрибут можно выяснить время работы винчестера перед покупкой (необходимо сравнивать RAW-значение).
Temperature (0xC2, 0xE7 — второй датчик) — температурный режим работы жесткого диска. В данном атрибуте хранятся показания встроенных термодатчиков. Температурный режим работы жесткого диска имеет огромное влияние на долгосрочность работы, даже если он находится в пределах допустимого значения.
Current Pending Sector Count (0xC5) — атрибут характеризует количество подозрительных секторов, так называемых кандидатов на замену. Данные сектора еще не были помечены как плохие, но время считывания с этих секторов отличается от нормы. Еще такие сектора называют нестабильные.
Uncorrectable Sector Count (0xC6) – количество ошибок при обращении к сектору, которые не были скорректированы. Одной из возможных причин возникновения подобного рода ошибок может быть сбои механической части, либо порча поверхности.
UDMA CRC Error Rate (0xC7) — количество ошибок возникающих при передаче информации по внешнему интерфейсу. Одной из причин возникновения — некачественные шлейфы, либо нештатный режим работы жесткого диска.
Write Error Rate (0xC8) — в данном атрибуте хранится значение количества возникших ошибок при записи данных на диск. Причина — качество поверхности пластин, механика жесткого диска.
Программы для работы со S.M.A.R.T. :HDDScan , CrystalDiskInfo.