S.M.A.R.T.

S.M.A.R.T. (Self-Monitoring Analysis and Reporting Technolodgy) [Технология Самотестирования и Анализа жесткого диска] — технология самотестирования разработанная производителями HDD для обеспечения более высокой степени надежности хранения информации.

Суть S.M.A.R.T. технологии заключается в том, что сам винчестер отслеживает состояние своей работоспособности и способен заранее предупредить пользователя о своем предаварийном состоянии.

Состояние работоспособности оценивается по нескольким параметрам работы накопителя, которые называются атрибутами надежности — attributes.
Каждый атрибут имеет свой номер — ID (идентификатор).

Критически важные атрибуты:

Raw Read Error Rate — частота ошибок при чтении данных с диска.
Частота появления ошибок чтения информации с диска, происхождение которых обусловлено аппаратной частью жесткого диска.

Read Channel Margin — запас канала чтения. Назначение неизвестно.

Reallocated Event Count — Количество операций переназначения сбойных секторов.
Показывает общее число попыток переназначения сбойных секторов в резервную область диска.
При этом учитываются как успешные, так и неудачные операции.

Reallocated Sector Count — число переназначенных секторов.
Когда жесткий диск встречает ошибку чтения/записи, он пытается переместить поврежденные данные в резервную область и, в случае успеха, помечает сектор как переназначенный.
Благодаря этой возможности жесткие диски способны скрывать незначительное число плохих секторов.

Seek Error Rate — ошибки позиционирования блока головок.
Ошибки позиционирования возникают при повреждении сервометок, перегреве носителя или в случае сбоя механической системы позиционирования.
Большое количество ошибок позиционирования свидетельствует о низком качестве поверхности или поврежденной механике головок носителя.

Spin Retry Count — число повторных попыток раскрутки дисков до рабочей скорости при условии, что первая попытка была неудачной.
Атрибут имеет не прямое значение, а отражает некий сборный параметр надежности.

Spin Up Time — среднее время раскрутки диска из состояния покоя до рабочей скорости.
Ухудшение атрибута зачастую свидетельствует о некачественном блоке питания.
Ухудшение атрибута свидетельствует о возможных механических и температурных проблемах.

Информационные атрибуты:

Current Pending Sector Count — текущее число нестабильных секторов.
Здесь хранится число претендентов на переназначение в резервную область диска.
Если сектор будет считываться успешно, то он исключается из списка.
Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить и перенести информацию в резервную область, а сам сектор пометит как переназначенный.
Постоянно нулевое значение этого атрибута говорит о низком качестве поверхности диска.

Disk Shift — сдвиг пакета дисков относительно оси шпинделя (часто возникает при падении винчестера).

Drive Temperature — температура. Отражает показания встроенного термодатчика.
Температура имеет огромное влияние на срок службы диска.

G-Sense Error Rate — частота появления ошибок в результате ударных нагрузок.
В соответствии с показаниями ударочувствительного сенсора выводит общее количество ошибок, возникших в результате удара, падения или неаккуратной установки диска в корпус компьютера.

GMR Head Amplitude — амплитуда дрожания головок в рабочем состоянии.
Воздействие центробежной силы приводит к дрожанию головок над поверхностью диска.
Высокая амплитуда дрожания может вызвать соприкосновение блока головок с поверхностью.
Как следствие — появление поврежденных секторов.

Hardware ECC Recovered — количество ошибок чтения, которые были исправлены аппаратной частью HDD.
При записи на диск к основным данным добавляется избыточная информация, которая позволяет восстановить данные, если они были считаны с ошибкой (естественно, восстановление возможно в некоторых пределах).

Load Friction — нагрузка на привод головок, вызванная трением в механических частях накопителя.

Load-in Friction (Hours\Time) — общее время работы головки под влиянием нагрузок.
Показывает общее время работы головок под влиянием центробежных сил.

Load-in Time — общее время нагрузки на привод головок.
Предположительно данный атрибут показывает общее время работы накопителя под нагрузкой при условии, что головки находятся в рабочем состоянии (вне парковочной зоны).

Load/Unload Cycle Count — количество циклов вывода головок в специальную парковочную зону/в рабочее положение.

Load/Unload Retry Count — нагрузка на привод головок, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п.
Учитывается только период, в течение которого головки находились в рабочем положении.

Loaded Hours — нагрузка на привод головок, вызванная общей наработкой часов накопителем.
Учитывается только период, в течение которого головки находились в рабочем положении.

Offline Correctable — этот атрибут относится к фоновому тестированию поверхности на предмет сбойных или ненадежных секторов.
Предположительно, содержит количество сбойных секторов, найденных в этом режиме.

Power Cycle Count (Device (Drive) Power Cycle Count) — число полных циклов включения/выключения винчестера.
По этому атрибуту можно оценить, как часто использовался диск.

Power Off Retract Count — количество зафиксированных повторов включения/выключения питания накопителя.

Power-On Hours — количество наработанных часов.
Показывает общее время работы диска.
В качестве порогового значения выбирается паспортное время наработки на отказ (MTBF — Mean Time Between Failures).

Recalibration Retries — количество повторов рекалибровки.
Характеризует количество попыток установки головок на нулевую дорожку, при условии, что первая попытка была неудачной.
Значение этого атрибута, меньшее порогового, говорит о неполадках в механике жесткого диска.

Seek Time Performance — средняя производительность операций позиционирования головок.
Данный параметр показывает среднюю скорость позиционирования привода головок на указанный сектор.
Снижение значения этого атрибута говорит о неполадках в механике привода.

Soft Read Error Rate — частота появления «программных» ошибок при чтении данных с диска.
Информирует о программных ошибках чтения данных.
К таковым можно отнести ошибки программного обеспечения, драйверов, файловой системы и неверную разметку диска.
В общем, почти все, что не относится к аппаратной части винчестера.

Start/Stop Count — число циклов запуск-остановка шпинделя.
Двигатель жесткого диска имеет вполне определенное — гарантированное производителем — число старт-стопов.
Это значение и выбирается в качестве критического порога.

Throughput Performance — средняя производительность диска.
Показывает среднюю пропускную способность жесткого диска.
Уменьшение значения с некоторой вероятностью указывает на проблемы в накопителе.

Torque Amplification Count — количество усилий вращающего момента привода.

UltraDMA (Ultra ATA) CRC Error Count — общее количество ошибок CRC в режиме UltraDMA.
На практике подобные ошибки появляются при разгоне системы, сильно перекрученном шлейфе, а также по вине драйвера.

Uncorrectable Sector Count — число нескорректированных ошибок.
Информирует об ошибках чтения/записи, которые не удалось исправить.
Возможной причиной возникновения подобных ошибок может быть повреждение механики или поверхности диска.

Write Error Rate (Multi Zone Error Rate) — частота появления ошибок при записи данных.
Показывает общее число ошибок записи на диск.
Чем меньше значение атрибута, тем хуже состояние поверхности или механики винчестера.

Пользователь компьютера оснащенного S.M.A.R.T. HDD и специальной программой S.M.A.R.T. диагностики будет заранее знать о возможном предаварийном состоянии HDD и следовательно сможет избежать потери данных хранящихся на винчестере.

В настоящее время S.M.A.R.T. технологию поддерживают все производители HDD.

Большинство S.M.A.R.T. HDD имеют от 3 до 15 атрибутов надежности.
Максимально возможное их количество 30.
Состав и количество атрибутов надежности определяются самими производителями индивидуально для каждого типа HDD.

Значения атрибутов надежности могут лежать в диапазоне от 1 до 253.
Первоначально атрибуты имеют максимальные значения.
По мере износа винчестера или в случае возникновения предаварийного состояния значения атрибутов надежности уменьшаются.

Следовательно, высокое значение атрибутов говорит о низкой вероятности выхода накопителя из строя и, соответственно, низкое значение атрибутов — о низкой надежности накопителя и о высокой вероятности выхода его из строя.
Как правило, верхние границы атрибутов надежности имеют значение 100 (IBM, Quantum, Fujitsu) или 253 (Samsung).
Но есть и исключения, так у HDD Western Digital моделей WDAC34000, WDAC33100, WDAC31600 первый атрибут надежности имеет максимальное значение 200, а остальные 100.

Для каждого атрибута надежности разработчиками HDD определяется пороговое значение — thresholds.
Если хотя бы одно из значений атрибутов меньше, чем соответствующее пороговое значение, значит хранить данные на таком винчестере становится опасно.

Кроме порогового значения для каждого атрибута определен дополнительный параметр pre-failure/advizory так-же характеризующий предаварийное состояние накопителя.

Возможны три состояния накопителя, характеризуемые состоянием pre-failure/advizory:

— pre-failure/advizory = 0, характеризует высокий запас надежности накопителя, при условии что значение атрибута надежности больше соответствующего порогового значения;
— pre-failure/advizory = 0, характеризует низкий запас надежности накопителя, при условии что значение атрибута надежности меньше соответствующего порогового значения;
— pre-failure/advizory = 1, характеризует предаварийное состояние накопителя, при условии что значение атрибута надежности меньше соответствующего порогового значения.

Все S.M.A.R.T. параметры — attributes, thresholds и pre-failure/advizory хранятся в энергонезависимой памяти HDD.

Посмотреть S.M.A.R.T. атрибутов винчестеров можно бесплатной программой SMARTUDM — HDD S.M.A.R.T. Viewer, она также определяет примерную дату выхода винчестера из строя. Программа работает только под управлением ОС DOS.

^Наверх