Проверка жесткого диска на ошибки в CentOS Stream

На примере операционной системы CentOS Stream я покажу вам как можно проверить состояние жесткого диска hdd или ssd используя технологию S.M.A.R.T.

S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя. Технология S.M.A.R.T. является частью протоколов ATA и SATA.

В данной статье проверим состояние диска используя программу smartmontools.

Для начала установим утилиту smartmontools в дистрибутиве Centos 7.

sudo yum install smartmontools -y

Выведем список наших дисков командой fdisk:

sudo fdisk -l

У меня будет диск sda.

Теперь проверим смарт данного диска:

smartctl -a /dev/sda

В начале система выведет информацию о модели вашего hdd или ssd диска:

информация о диске

Ниже будут показаны смарт атрибуты диска (тип атрибутов меняется в зависимости от производителя диска):

атрибуты смарт

На основе данной таблицы можно сделать вывод, что диск начинает выходить из строя, так как параметр Reallocated_Sector_Ct начинает увеличиваться.

Приведу таблицу с описанием всех атрибутов S.M.A.R.T

#IDHEXИмя атрибутаОписание
11Raw Read Error RateЧастота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено аппаратной частью винчестера.
22Throughput PerformanceОбщая производительность накопителя. Если значение атрибута уменьшается перманентно, то велика вероятность проблем с винчестером.
33Spin-Up TimeВремя раскрутки шпинделя из состояния покоя (0 rpm) до рабочей скорости. В поле Raw_value содержится время в миллисекундах/секундах в зависимости от производителя
44Start/Stop CountПолное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска.
55Reallocated Sectors CountЧисло операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков — физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов.
77Seek Error RateЧастота ошибок при позиционировании блока магнитных головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска.
88Seek Time PerformanceСредняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.
99Power-On Hours (POH)Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ.
100ASpin-Up Retry CountЧисло повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.
110BRecalibration RetriesКоличество повторов рекалибровки в случае, если первая попытка была неудачной.
120CDevice Power Cycle CountЧисло циклов включения-выключения винчестера.
130DSoft Read Error RateЧисло ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.
187BBReported UNC ErrorsНеустранимые аппаратные ошибки.
190BEAirflow TemperatureТемпература воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 — Airflow Temperature
191BFG-sense error rateКоличество ошибок, возникающих в результате ударов.
192C0Power-off retract countЧисло циклов аварийных выключений.
193C1Load/Unload CycleКоличество циклов перемещения блока головок в парковочную зону.
194C2HDA temperatureПоказания встроенного термодатчика накопителя.
195C3Hardware ECC RecoveredЧисло коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу).
196C4Reallocation Event CountЧисло операций переназначения в резервную область, успешные и неудавшиеся попытки.
197C5Current Pending Sector CountЧисло секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят.
198C6Uncorrectable Sector CountЧисло некорректируемых ошибок при обращении к сектору.
199C7UltraDMA CRC Error CountЧисло ошибок при передаче данных по внешнему интерфейсу.

Данная утилита работает и в дистрибутивах Ubuntu. Надеюсь данная статья оказалась вам полезна. Удачи!

Оставьте комментарий