Smart на що звернути увагу. Як виправити SMART помилку жорсткого диска чи SSD. Програми для S.M.A.R.T

З метою запобігання поломці і, як наслідок, запобігання втраті даних користувачів сучасні жорсткі диски оснащуються технологією S.M.A.R.T. Що це за технологія, як проаналізувати її дані, за допомогою яких програм це можна зробити – з цими питаннями ознайомимося нижче в подробицях.

1. S.M.A.R.T.: про суть технології

S.M.A.R.T – це система самодіагностики, набір характеристик, що фіксуються електронікою жорстких дисків. Ця технологія з'явилася в 1995 завдяки спільним зусиллям виробників жорстких дисків. Їй передували розроблені в 1992 технології IntelliSafe і Predictive Failure Analysis. S.M.A.R.T. – це, в порівнянні з технологіями-попередницями, досконаліший механізм визначення важливих характеристик жорстких дисків, який використовується і до сьогодні. Диски з цією технологією оснащуються вбудованим процесором, який забезпечує підрахунок відпрацьованого годинника, визначення бед-блоков (збійних, пошкоджених секторів), вимірювання температури, а також відстежує інші характеристики. S.M.A.R.T. оснащуються і HDD, і SSD. Природно, через різницю облаштування цих типів дисків параметри, що відстежуються технологією, будуть різними.

S.M.A.R.T. – це лише діагностика, її дані мають інформативний характер. Ця технологія не лікує HDD. При критичному значенні окремих параметрів (зокрема, при досягненні межі допустимих бэд-блоков) вона може дати себе знати під час завантаження комп'ютера повідомленням типу «S.M.A.R.T. Status BAD». Це означає, що незабаром HDD може вийти з ладу, і потрібно терміново зайнятися резервним копіюванням (або поміщенням у файлові інтернет-сховища) значних даних. Якщо технологія видає таке повідомлення в рамках гарантійного терміну придбаного ПК, ноутбука або жорсткого диска, ці пристрої необхідно нести в точку продажу, де вони купувалися, і вимагати заміни жорсткого диска. Якщо гарантійний термін закінчився, і продавцю неможливо пред'явити претензії, комп'ютер необхідно нести до сервісного центру після резервного копіювання даних.

Як і не лікує, S.M.A.R.T. також не дає навіть приблизних прогнозів часу, наскільки швидко HDD вийде з ладу. Можливо, що з окремих критичних значеннях параметрів диск прослужить ще кілька років. І навпаки: відомі випадки виходу з ладу HDD без попередження технології оцінки стану.

Щоб дізнатися про стан жорсткого диска згідно з даними діагностики S.M.A.R.T., не обов'язково чекати появи повідомлення під час завантаження комп'ютера. Звіт можна переглянути за допомогою спеціальних утиліт, які можуть бути провідником, інтерфейсом для виведення даних. Нижче буде розглянуто декілька інструментів, які в числі свого функціоналу передбачають виведення звіту SMART. Але спочатку необхідно розібратися у значеннях параметрів, якими оперує ця технологія.

2. Значення S.M.A.R.T.

Звіт S.M.A.R.T. у додатках для відображення результатів її діагностики, як правило, подається в таблиці, де навпаки параметрів жорсткого диска (названих також атрибутами) стоїть те чи інше значення. Граф із значеннями у звіті декілька:

Графа Value, що відображається в додатках з російськомовним інтерфейсом як Поточне - це, відповідно, поточне значення параметра жорсткого диска;
Графа "Worst" ("Гірше") - найнижче значення параметра, яке було зафіксовано за весь час роботи диска;
Графа "Threshold", вона ж "Порогове" або "Поріг" - це критично низьке, небажане значення параметра.

Стан жорсткого диска головним чином визначається зіставленням значень поточного (Value) і порогового (Threshold). Ці значення виражені числовим показником від 1 до 255. В окремих виробників HDD може бути від 1 до 200.

Логіка поточних значень («Value») – щось на кшталт системи набору балів, що більше, то краще. Високе поточне значення ("Value") параметрів, як правило, означає їх стабільність.

Порогове значення (Threshold) частіше визначається цифрою 0, але це не правило для всіх параметрів. Для граничних значень окремих параметрів встановлюється показник більше 0 (наприклад, 51 або 140). Це означає, що поточні значення таких параметрів можуть бути нижчими від порогового.

Отже, що більше різниця між поточним значенням («Value») і пороговим («Threshold»), то краще стан жорсткого диска. Зниження поточного значення (Value) до порогового (Threshold) або нижче за нього означає, що незабаром можлива поломка жорсткого диска. Однак не завжди низьке поточне значення (Value) – це погано. Наприклад, технологія оцінки стану може оцінювати значне напрацювання годинника жорсткого диска низьким показником, але це не привід турбуватися, якщо значення інших параметрів в нормі. Кількість відпрацьованого годинника – «голий» показник, без урахування навантажень, яким диск піддавався за час роботи, ця цифра скаже небагато. У будь-якому випадку оцінювати дані діагностики необхідно з урахуванням специфіки кожного параметра.

Поточне («Value»), найгірше («Worst») і граничне («Threshold») – це основні значення, що відображаються програмами для виведення звіту. Але окремі програми можуть містити у звіті інші дані, наприклад, Raw-значення (дані у шістнадцятковому вигляді) або конкретні показники для окремих параметрів (кількість запусків/зупинок шпинделя, кількість бід-блоків, сумарний час роботи жорсткого диска в годиннику тощо) .).

Щоб полегшити сприйняття даних діагностики, у деяких програмах значення параметрів надаються певні колірні індикатори. Як правило, індикатор теми оформлення інтерфейсу таких програм означає, що жорсткий диск має гарний стан. А жовтий (іноді може бути помаранчевий) і червоний індикатори говорять про погіршення здоров'я, відповідно, помірне і дуже серйозне.

3. Програми виведення звіту S.M.A.R.T.

AIDA64

Переглянути звіт S.M.A.R.T. можна у відомій програмі для комплексного аналізу складових комп'ютера AIDA64. У деревоподібній структурі зліва розкриваємо гілку «Зберігання даних», клацаємо розділ «SMART», зверху вибираємо потрібний диск і внизу дивимося по ньому звіт.

На додачу до основних значень AIDA64 у графі «Дані» відображає конкретні показники за окремими параметрами, а у графі «Статус» дає значенням свою оцінку.

CrystalDiskInfo

Невелика безкоштовна утиліта CrystalDiskInfo – найзручніший спосіб відстеження діагностики S.M.A.R.T. У вікні утиліти зверху необхідно вибрати HDD, і всі його параметри будуть відображені у таблиці внизу. Плюси CrystalDiskInfo – відображення додаткових даних, назви параметрів російською мовою, колірна індикація, акцентний блок "Техстан".

HDDScan

Щоб переглянути звіт S.M.A.R.T., у безкоштовній програмі HDDScan необхідно вибрати HDD у меню "Select Drive".

І натиснути кнопку під назвою технології.

HDDScan відображає основні значення та має додаткову графу з виведенням Raw-значення. Вгорі звіту програма показує характеристики жорсткого диска – модель, серійний номер, прошивку тощо. Передбачається колірна індикація значень параметрів.

HD Tune Pro

У платному HD Tune Pro для отримання даних необхідно вибрати вгорі у списку потрібний HDD і перейти на вкладку «Здоров'я».

Крім граф таблиці з основними значеннями, HD Tune Pro передбачає додаткові графи з конкретними показниками параметрів (Дані) та власну оцінку значень S.M.A.R.T. («Стан»). Є колірна індикація. Перевага програми – відображення назв параметрів російською мовою.

Hard Disk Sentinel

Безкоштовна у стандартній редакції або у тріал-версії Pro програма Hard Disk Sentinel звіт S.M.A.R.T. відображає по вибраному жорсткому диску при виборі в меню "View" пункту під назвою технології.

На додаток до основних значень S.M.A.R.T. цей інструмент відображає Raw-значення (графа Date) і має власну оцінку показників (графа Status). Передбачено колірну індикацію.

Victoria

Безкоштовна портативна утиліта Victoria надасть дані S.M.A.R.T. після вибору потрібного жорсткого диска у вкладці "Standart".

Далі необхідно перейти на вкладку утиліти «SMART» та натиснути кнопку «Get SMART». До основних значень технології додані графи Raw-значення та індикації здоров'я жорсткого диска (Health). Здоров'я визначається колірним та рівневим індикатором.

4. Детальна довідка за параметрами S.M.A.R.T. та нюанси їх відображення у різних програмах

Назви тих самих параметрів у різних програмах дослівно можуть не збігатися. Якщо значення якогось із параметрів зацікавило, докладніше дізнатися, що це за параметр, наскільки важливу роль він відіграє, як впливає на продуктивність жорсткого диска тощо, можна в Інтернеті. Окремі розглянуті вище програми передбачають копіювання назв параметрів та значень у контекстному меню інтерфейсу. Ті, які не передбачають такої можливості, можуть запропонувати експорт даних у файл TXT або інші формати.

Крім того, що можуть не збігатися назви параметрів (навіть у програмах з відображенням їх англійською мовою) різні програми можуть видавати різні добірки параметрів. Порівнювати один і той же параметр у різних програмах необхідно за його ідентифікатором - графі "ID", вона ж "Num", вона ж "№". Але і ідентифікатори будуть різними, якщо порівнювати звіти S.M.A.R.T. у програмах з відображенням параметрів різними мовами.

Чудового Вам дня!

Стан якого викликає у вас підозри, перше, що потрібно зробити, це перевірити дані технології SMART. Ця технологія призначена для збирання інформації про стан жорсткого диска та проведення процедури самодіагностики. За допомогою SMART можна швидко оцінити, в якому стані знаходиться жорсткий диск, чи ризик втрати даних і що потрібно робити для подальшої діагностики та ремонту комп'ютера.

Технологія SMART (або S.M.A.R.T.) з'явилася у жорстких дисках ще 1992 року. Тоді першим накопичувачем із цією системою став дисковий масив від компанії IBM. З того часу SMART отримала широке застосування і зараз використовується абсолютно у всіх HDD та більшості SSD дисків.

Інтерфейс програми CrystalDiskInfo дуже простий і буде зрозумілий навіть початківцям. У верхній частині вікна знаходиться список дисків, підключених до комп'ютера. Після вибору жорсткого диска в нижній частині вікна з'явиться вся інформація, доступна для цього HDD.

Трохи нижче розташований блок основної інформації про обраний накопичувач. Тут можна дізнатися назву диска, версію його прошивки, серійний номер, інтерфейс, швидкість обертання шпинделя, число включень, загальний час роботи, а також іншу інформацію.

У блоці з основною інформацією найважливішими даними є «Число включень» та «Загальний час роботи». Чим більше ці значення, тим гірший стан жорсткого диска, оскільки в процесі роботи він неминуче деградує. У настільних комп'ютерах сучасні диски зазвичай нормально працюють протягом 15-25 тисячі годин, після чого починають з'являтися проблеми. Для ноутбуків це число ще менше, там диски зазвичай витримують не більше ніж 10-20 тисяч годин.

Ближче до лівої частини вікна є ще два важливі параметри. Це оцінка технічного стану жорсткого диска та його температура. Оцінка технічного стану жорсткого диска – це загальна оцінка, яку програма надає на основі даних технології SMART. Ця оцінка може набувати одного з трьох значень:

Добре – з диском все гаразд, жодні дії не потрібні.
Тривога – диск має деякі проблеми, варто перевірити наявність резервних копій, диск бажано замінити.
Погано – диск має значні несправності, диск необхідно замінити.

Не має прямого відношення до його стану. Нормальної температури для HDD вважається від 20 до 45 градусів Цельсія. Якщо температура перевищує 45 градусів, це говорить про погане охолодження корпусу комп'ютера.

Найкорисніша інформація про стан жорсткого диска знаходиться в нижній частині вікна програми. Тут розташований список параметрів, які відстежує технологія SMART, а також надані їм значення. Використовуючи цю інформацію, можна швидко оцінити стан HDD та прийняти рішення щодо подальших дій.

При вивченні списку параметрів SMART слід дивитися значення колонки «RAW-значення». Дані вказані у форматі HEX.

Список параметрів, що відстежуються технологією SMART, досить великий, але далеко не всі мають критичне значення для стану жорсткого диска. Нижче ми розглянемо лише найважливіші з них.

03 – Час розкручування (Spin-Up Time)– час, який потрібно розкрутити диск з вимкненого стану до робочої швидкості. Це значення збільшується при зносі механічної частини накопичувача, також великий час розкручування може свідчити про просадку напруги при запуску диска.
05 – Перепризначені сектори (Reallocated Sectors Count)– кількість секторів, які були визнані несправними та перепризначені в резервну область. Наявність перепризначених секторів свідчить про проблеми з поверхнею диска.
0A – Повторні спроби розкручування (Spin-Up Retry Count)– кількість повторних спроб розкручування диска. Це значення збільшується при зносі механічної частини накопичувача.
BB – Невиправні помилки (Reported UNC Errors)– кількість помилок, які вдалося усунути апаратними засобами накопичувача.
BC - Таймаут команди (Command Timeout)– кількість операцій, які були перервані через таймаут. Збільшення цього параметра може свідчити про проблеми з живленням диска або кабелями.
C4 - Спроби перепризначення секторів (Reallocation Event Count)– кількість спроб здійснити операцію перепризначення сектора. Враховуються як вдалі, і не вдалі спроби перепризначення секторів. Наявність спроб перепризначення вказує на проблеми із поверхнею диска.
C5 - Нестабільні сектори (Current Pending Sector Count)– кількість підозрілих секторів, які можуть бути перепризначені у майбутньому. Наявність нестабільних секторів свідчить про проблеми з поверхнею диска.
C6 - Невиправні помилки секторів (Uncorrectable Sector Count)– кількість секторів, які неможливо виправити засобами жорсткого диска. Наявність непоправних помилок вказує на проблеми з поверхнею або механічною частиною диска.

Якщо значення RAW для всіх вказаних вище параметрів дорівнюють нулю, це вказує на те, що жорсткий диск знаходиться у відмінному стані. Жодних проблем технологія SMART не виявила. Якщо ж деякі параметри мають значення більше нуля, стан HDD варто перевірити більш ретельно, можливо, такий диск вимагатиме швидкої заміни.

Найважливішим параметром SMART є параметр «Переназначені сектори» або «Reallocated Sectors Count». Він вказує на кількість несправних секторів, які були призначені диском в резервну область. Зазвичай, після появи всього кількох перепризначених секторів поверхню диска починає швидко деградувати і накопичувач повністю виходить з ладу через кілька днів чи тижнів.

Тому при виявленні перепризначених секторів необхідно перевірити наявність резервних копій усіх важливих даних, які зберігаються на такому диску. Якщо резервних копій немає, їх потрібно терміново зробити, інакше ви ризикуєте втратити дані.

Багато користувачів ПК практично не замислюються про перевірку стану HDD. Перевірка вінчестера, перш за все, потрібна для раннього виявлення в ньому помилок.
Якщо вам вдасться виявити наперед неполадки вінчестера, то ви зможете зберегти всю важливу інформацію, що зберігається на ньому до його остаточного виходу з ладу.
У цьому матеріалі ми опишемо на конкретних прикладах процедуру перевірки стану HDD, а також розповімо, як бути у ситуації, якщо ваш вінчестер несправний.

Як перевірити стан жорсткого диска

Перевірити стан жорсткого диска можна за допомогою різних утиліт, які зчитують стан вашого вінчестера з його системи самодіагностики SMART. Технологія SMART зараз встановлена на кожному вінчестері, що випускається. Технологія SMART була розроблена ще далекого 1992 року і до цього дня вдосконалюється. Головним завданням SMART є протоколювання процесу старіння вінчестера. Тобто ведеться збір такої інформації, як кількість включень HDD, кількість обертів шпинделя та безлічі інших. Ще SMART стежить за помилками«гвинта», як програмними, так і механічними та в міру можливості виправляє їх. У процесі стеження SMART виробляє різні тести типу короткого і довгого виявлення тих самих несправностей. У цьому матеріалі ми розглянемо такі програми, які вміють читати інформацію зі SMART:

Ashampoo HDD Control 3;
Defraggler;
HDDlife;
Victoria.

Кожна програма зі списку, крім зчитування показань SMART, пропонує низку функцій, тестів, які тією чи іншою мірою продовжують життя вінчестера. Але найцікавішою є програма Victoria. Програма Victoria крім визначення стану HDD також вміє виробляти REMAP поганих секторів. Тобто вона вміє приховувати биті сектори шляхом заміни їх на резервніякщо є їх наявність. По суті, процедура REMAP може повністю відновити вінчестер. Також варто відзначити можливість виправлення жорсткого диска завдяки консольному додатку. chkdsk». Консольна програма «chkdsk» може виправити помилки файлової системи, що дозволить не встановлювати заново Windows.

Ashampoo HDD Control 3

Першою ми розглянемо програму Ashampoo HDD Control 3. Запустимо цю утиліту на комп'ютері під керуванням Windows 10.

У вікні Ashampoo HDD Control 3 видно повідомлення « ✓ ОК», а також напис « Цей жорсткий диск не має проблем». Ця інформація означає, що вінчестер у повному порядку. Якщо під час відкриття програми ви побачите повідомлення « Помилка», а також напис « Цей жорсткий диск має проблему», то це означає, що він має биті сектори або перегрівається. Для перегляду повних відомостей про здоров'я «гвинта», взятих зі смарт, необхідно натиснути на виноску «», що знаходиться в центральному блоці.

Окрім перегляду інформації зі смарт, Ashampoo HDD Control 3 вміє запускати тест самотестування S.M.A.R.T. і тест перевірки поверхні. Протестувати ці тести можна у блоці «».

Виконавши ці тести, можна виявити проблеми з HDD. Крім зняття показань зі смарт та тестів, Ashampoo HDD Control 3 вміє:

Виробляти дефрагментацію;
Очищати систему від сміття;
Шукати та видаляти дублікати файлів;
Надійно затирати файли з HDD без можливості відновлення.

Наявність такої функціональності Ashampoo HDD Control 3 у моніторингу здоров'я гвинта та додаткових функціях ставить утиліту на перше місце.

Defraggler

Утиліта Defragglerперш за все призначена для дефрагментаціїале крім цього вона вміє зчитувати показання SMART. Утиліта безкоштовна і будь-який користувач може завантажити її з сайту www.piriform.com. Після запуску утиліти потрібно перейти на вкладку « Стан».

У вікні видно, що утиліта видає повідомлення про стан гвинта, як ДОБРЕ»- це означає, що він у повному порядку. Якщо ви побачите повідомлення « Помилка» у статусі, це означатиме, що на вінчестері є несправні сектори і його час міняти. Утиліта досить проста і підійде, перш за все, користувачам-початківцям ПК, які хочуть стежити за здоров'ям HDD і проводити його дефрагментацію. Також хочеться відзначити, що утиліта підтримує всі актуальні операційні системи, починаючи з Windows XP до Windows 10.

Як перевірити жорсткий диск за допомогою HDDlife

Утиліта HDDlifeмає приємний інтерфейс і відразу видає необхідну нам інформацію, що відповідає за справність та поломку гвинта.

З зображення вище видно, що у блоці здоров'я стоїть. ОК!», а це означає, що з HDD все гаразд. Щоб переглянути подробиці смарт, вам достатньо натиснути на посилання « натисніть , щоб переглянути S.M.A.R.T. атрибутів».

Якщо ви побачите повідомлення в блоці здоров'я НЕБЕЗПЕКА!», то це означає, що ваш HDD скоро прийде в непридатність.

У такому разі вам необхідно провести заміну старого вінчестера на новий. Утиліта HDDlife, перш за все, підійде користувачам-початківцям ПК, так як її простота дозволить легко стежити за здоров'ям «гвинта». Крім стандартної утиліти, розробник ще випускає HDDlife for Notebooksяка призначена для ноутбуків. Версія для ноутбуків має той самий функціонал, що й стандартна версія, але також може здійснювати контроль рівня шуму HDD. Також варто зазначити, що програма підтримує всі актуальні операційні системи, починаючи з Windows XP до Windows 10.

Victoria

Програма Victoriaрозробляється у варіанті під DOSі по Windows. Для прикладу ми скористаємося версією вікторії для Windows, яку можна завантажити на сайті http://hdd-911.com. На даний момент вікторія доступна у версії 4.47. Запустивши утиліту Victoria, ми потрапимо до такого вікна.

Вікторія не має гарного інтерфейсу, як у попередніх утилітах і написана такими старими мовами, як Delphiі Асемблер.

У першій вкладці вікторії « Standart» знаходиться вся інформація про встановлені жорсткі дискив комп'ютер.

Друга вкладка « SMART» потрібна для зняття свідчень смарт. Щоб відобразити результати смарт, натисніть кнопку Get SMART , після чого відобразяться результати.

У вінчестері вікторія виявила 1212 битих сектора. Така кількість BAD-секторів є критичною, тому в цьому випадку необхідно здійснити повний бекапвсіх даних із HDD. Для ремонту вінчестера тестом REMAP в Victoria необхідно перейти на вкладку « Tests» та вибрати режим « Remap». Після цих дій можна розпочинати процедуру перепризначення битих секторів на резервні кнопкою Start.

Тест REMAP у Victoria може тривати дуже довго. Час тесту залежить від кількості BAD-секторів. Цей тест утиліти Вікторія не завжди допомагає, тому що у «гвинті» могло не залишитись резервних секторів.

Зауважте, що використовуючи тести Victoria, ви можете пошкодити справність HDD та інформацію на ньому.

Як перевірити диск на справність за допомогою chkdsk

Може статися, що перевіривши значення S.M.A.R.T. за допомогою описаних вище утиліт ви не знайшли несправностей, але система все одно поводиться нестабільно. Нестабільність може бути синіми екранами смерті, зависаннями в програмах.Така поведінка операційної системи Windows викликана помилками файлової системи. У цьому випадку нам допоможе консольна команда. chkdsk». Виконавши команду "chkdsk", можна повністю відновити працездатність Windows. Для цього ми візьмемо комп'ютер з новою операційною системою Windows 10. Насамперед відкриємо в Windows 10 консоль від імені адміністратора. Це можна легко зробити, клацнувши правою кнопкою миші по значку « Пускі вибравши необхідний нам пункт.

У запущеній консолі виконаємо таку команду CHKDSK F: /F /R Після перевірки за допомогою командної програми chkdsk в консолі буде виведено результат перевірки.

Тепер розглянемо команду « CHKDSK F: /F /R" Детальніше. Відразу після команди «chkdsk» йде буква « F» - ця буква локального дискана якому ми виправляємо помилки. Ключі « /F» та « /R» виправляють помилки у файловій системі, а також виправляють пошкоджені сектори. Ці ключі використовуються практично завжди, на відміну від інших. Переглянути інші ключі можна командою chkdsk/?

Також варто відзначити, що в Windows 10 значно розширені можливості програми Chkdsk завдяки новим ключам.

Як перевірити жорсткий диск на працездатність за допомогою DST

Абрівіатура DSTрозшифровується Disk Self Test, тобто диск самотестування. Цей метод виробники спеціально вбудовують у HDD, щоб потім за допомогою спеціального програмного забезпечення зробити самодіагностику DST, яка виявить проблеми. Виробляючи тестування «гвинта» за допомогою DST можна отримати дані про ймовірну поломку вінчестера. Особливо зручно використовувати DST на серверах та комп'ютерах підприємств, де надійне зберігання інформації відіграє велику роль. Тепер розглянемо використання DST на прикладі ноутбуків HP. Для нових ноутбуків HP з підтримкою UEFI BIOSіснує спеціальне меню діагностики Startup Menu». Запускається це меню за допомогою комбінації клавіші включення та клавіші ESC.

Для запуску тестів системи натисніть кнопку F2.

У вікні DST має назву Hard Disk Test. Після його вибору запуститься самотестування.

В інших виробників також є метод DST, тільки запуск на ПК від інших виробників відрізняється від розглянутого вище.

Перевірка жорсткого диска на Linux

Наприклад візьмемо комп'ютер з урахуванням операційної системи Ubuntu 16.04. Для цього запустимо термінал в Ubuntu. У терміналі наберемо таку команду sudo apt-get install smartmontools Ця команда повинна інсталювати

Якщо вам не подобається працювати в консольному режимі, ви можете встановити графічну утиліту Gnome-disk-utility. У ній можна побачити все необхідне про HDD та про його стан.

Підбиваємо підсумок

У розглянутій статті ми описали, як можна моніторити стан HDD, а також як виправити його сектори та файлову систему, якщо це можливо. З матеріалу стає зрозуміло, що моніторинг стану жорстких дисків є дуже важливим, оскільки дозволяє передбачити поломку HDD.

Якщо ви виявили, що ваш вінчестер є проблемним, то не відкладайте його заміну на потім. Проблемний «гвинт» може вийти з ладу в будь-який момент, і ви втратите всю інформацію, що зберігається на комп'ютері.

Сподіваємось, наш матеріал буде корисним нашим читачам, і повністю допоможе вирішити задачу перевірки жорсткого диска.

Відео на тему

Невелика розповідь про S.M.A.R.T. атрибутах, їх важливості та розумінні. У статті йтиметься про розшифрування всіх smart атрибутів ATA дисків. У попередніх статтях йшлося про і. Тепер хочу трохи описати атрибути звичайних дисків АТА на прикладі Seagate Barracuda ES.2 (ST31000340NS). Також визначимо найважливіші атрибути, на які потрібно звертати увагу при моніторингу дисків, використовуючи smartctl. Для початку можна переконатися, що наш диск підтримує смарт

[email protected] s01:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Model Family: Seagate Barracuda ES.2 Device Model: ST31000340NS Serial Number: 9QJ2ADVC … ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 4 Local Time is: Fri Feb 21 16:18:35 20 … SMART support is: Available - device has SMART capability. SMART support is: Enabled

Два останні рядки свідчать про те, що диск підтримує smart і можна переглянути значення всіх його атрибутів та їх інтерпретація буде коректною (інтерпретація RAW_VALUE). В даному випадку тип інтерфейсу (пристрою) не вказувався явно (не було вказано атрибут "-d"), тому smartctl автоматично визначив тип пристрою і сказав, що "SMART support is: Enabled". Але якщо застосовуються, наприклад масиви дисків (RAID контролер), то smartctl може сказати, що смарт не підтримується:

[email protected]:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 (місцева будова) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net 2.90 User Capacity: 2,996,997,980,160 bytes Logical block size: 512 bytes Logical Unit ID: 0xSerial number: Device type: disk Local Time is: Fri Feb 21 17:32:27 2014 IST

Але насправді потрібно просто знати (або підбирати) які дискові масиви використовуються, і тоді можна отримати бажаний результат явно вказавши тип пристрою:

[email protected]:~# smartctl -d megaraid,14 -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SEAGATE Product: ST1000NM0001 Revision: 0002 User Capacity: 1,000,204,886,016 bytes Logical block size: 512 bytes Logical Unit ID: 0x5000c50041080343 Serial number2 : SAS Local Time is: Fri Feb 21 17:34:45 2014 IST Device supports SMART and is Enabled Temperature Warning Enabled

Також може бути проблема у версії smartctl, бо не всі жорсткі диски додаються до бази SMART відразу після виходу в світ нового HDD або RAID контролера. Або в BIOS відключено підтримку (потрібно включити). Також може бути проблема в прошивці (firmware) жорсткого диска. Можете також варто спочатку спробувати включити SMART командою:

[email protected]:~# smartctl -s on /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF ENABLE/ DISABLE COMMANDS SECTION === SMART Enabled.

Наступна частина, що нас цікавить, покаже сумарний результат перевірки статусу здоров'я диска (Якщо не Passed – потрібно проводити заміну диска). Також виводиться додаткові характеристики диска та передбачуваний час виконання коротких та довгих тестів.

[email protected]:~# smartctl -Hc /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x82) Offline data collection активність була виконана без error. Auto Offline Data Collection: Enabled. Self-test execution status: (41) Self-test routine був interrupted by host з hard or soft reset. Total time to complete Offline data collection: (634) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data до введення в експлуатацію потужності. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Шорсткий self-test routine recommended polling time: (1) хвилин. Розширений self-test routine recommended polling time: (226) хвилин. Конвеянція шляху-резистентного курсу recommended polling time: (2) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported.

У нашому випадку тип пристрою визначився автоматично і тепер можна вивести найцікавіше – список атрибутів.

[email protected]:~# smartctl -A /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# s - 130449727 3 Spin_Up_Time 0x0003 099 099 000 Pre- fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 23 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 4 7 Seek_Error_Rate 0 - 549998464474 9 Power_On_Hours 0x0032 052 052 000 Old_age Always - 42335 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 63 184 End-to-End_Error 0x0032 100 100 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 093 000 Old_age Always - 4295032870 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 076 049 045 O4 Temperature_Celsius 0x0022 024 051 000 Old_age Always - 24 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 041 021 000 Old_age Always - 130449727 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x000 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

Використовуючи SMART можна передбачити з досить великою ймовірністю проблеми, пов'язані з:

Магнітними головками диска
Фізичні пошкодження диска
Логічними помилками
Механічними проблемами (проблеми приводу, системи позиціонування)
Подачею харчування (плати)
Температурою

Розшифруємо отриманий висновок.

Кожен атрибут має групу значень:

ID#- Ідентифікаційний номер атрибути (деталі). Кожен атрибут має свій унікальний ID, який повинен бути однаковим для всіх фірм виробників дисків.
ATTRIBUTE_NAME- Назва атрибута. Так як різні фірми виробники дисків можуть називати атрибути по своєму (скорочувати синоніми), найкраще орієнтуватися по ID атрибута.
FLAG (Status flag)– кожен атрибут має певний прапор, призначений фірмою розробником диска. У ОС із графічним інтерфейсом значення цього прапора надається як набору буквених позначень – w,p,r,c,o,s (розшифровка нижче). І ці набори надаються у вигляді шістнадцяткового числа, які ви бачили вище.

W arranty: Вказує на життєво важливий атрибут диска та покривається гарантією. Якщо цей прапор встановлений і значення атрибута з цим прапором досягне порогового (threshold) значення, тоді як диск ще на гарантії, то фірма повинна буде замінити диск безкоштовно.
P erformance: Вказує на атрибут, який є показником продуктивності диска – не критичний.
Error R ate: Атрибут із частотою помилок.
C ount of occurrences: Атрибут-лічильник подій.
O nline test: Атрибут, який оновлює значення лише через тести on-line. Якщо не вказано, то оновлюється через offline тести.
S elf preserving: Вказує на атрибут, який може збирати та зберігати дані про диск, навіть якщо S.M.A.R.T. вимкнено.

Value– Поточне значення атрибута (оцінка атрибута диска на основі Raw_value). Низьке значення говорить про швидку деградацію диска або про можливий швидкий збій. тобто. що значення Value атрибута, то краще. Це значення атрибуту потрібно порівнювати з граничним (threshold) значенням. Якщо це критичний атрибут і значення нижче порогового, потрібно проводити заміну диска.
Worst– Найнижче атрибут за життєвий цикл диска. Значення може змінюватися протягом життя диска, і не повинно бути нижчим або рівним граничному значенню (threshold).
Thresh (Threshold)– Порогове значення атрибута, призначене творцем диска. Значення не змінюється за цикл життя диска. Якщо значення атрибута Value стане рівним або менше порогового – з'явиться повідомлення в колонці WHEN_FAILED. І диск слід замінити.
Type– тип атрибуту. Може бути критичним (pre-fail), який вказує на майбутню відмову диска через помилки або критичний, що вказує на досягнення кінця життєвого циклу диска.
Raw_value– Об'єктивне значення атрибута, яке відображається у десятковому форматі (обчислюється firmware диска) та відомих лише виробнику одиницях (має зв'язок з Value, Threshold та Worst значеннями).
WHEN_FAILED– Вказує на проблеми із атрибутом.

Атрибут диска набуде значення failed, у випадку:

Value= f( Raw_value) <= Threshold

f(Raw_value) – функція обчислення деградації (зменшення) значення параметра Value залежно від Raw_value.

Недоліки такого підходу до обчислення деградації диска:

Для кожного виробника дисків та навіть моделі диска функція f(Raw_value) обчислюється по-різному.
Оцінка кожного атрибута підраховується незалежно друг від друга – тобто. ігноруються зв'язки між атрибутами.

Тепер хочу подати таблицю з переліченими всіх атрибутів. Ті атрибути, які виділені рожевим - відносяться до критичних атрибутів. Крім того, вказано тип параметра в залежності від величини значення. Тобто. Чим більше значення параметра, тим краще стан здоров'я диска чи навпаки.

Тепер приступимо до атрибутів:

#ID	HEX	Ім'я атрибуту	Краще якщо…	Опис
01	01	Raw Read Error Rate		Частота помилок під час читання даних із жорсткого диска. Походження їх обумовлено апаратною частиною вінчестера.
02	02	Черезпуть Performance		Загальна продуктивність накопичувача. Якщо значення атрибуту зменшується перманентно, то велика ймовірність проблем із вінчестером.
03	03	Spin-Up Time		Час розкручування шпинделя зі стану спокою (0 rpm) до робочої швидкості. У полі Raw_value міститься час у мілісекундах/секундах залежно від виробника
04	04	Start/Stop Count	*	Повна кількість запусків, зупинок шпинделя. Іноді зокрема кількість включень режиму енергозбереження. У полі raw value зберігається загальна кількість запусків/зупинок жорсткого диска.
05	05	Reallocated Sectors Count		Число операцій перепризначення секторів. При виявленні пошкодженого сектора на вінчестері інформація з нього позначається і переноситься в спеціально відведену зону, відбувається утилізація bad блоків, з подальшим консервуванням цих місць на диску. Цей процес називають remapping. Чим більше значення Reallocated Sectors Count, тим гірший стан поверхні дисків - фізичне зношування поверхні. Поле raw value містить загальну кількість перепризначених секторів.
07	07	Seek Error Rate		Частота помилок під час позиціонування блоку магнітних головок. Чим більше значення, тим гірший стан механіки або поверхні жорсткого диска.
08	08	Seek Time Performance		Середня продуктивність операції позиціонування. Якщо значення атрибуту зменшується, то велика ймовірність проблем із механічною частиною.
09	09	Power-On Hours (POH)		Час, проведений пристроєм у включеному стані. Як порогове значення для нього вибирається паспортний час напрацювання на відмову.
10	0A	Spin-Up Retry Count		Число повторних спроб розкрутки дисків до робочої швидкості, якщо перша спроба була невдалою.
11	0B	Recalibration Retries		Кількість повторів рекалібрування у разі, якщо перша спроба була невдалою.
12	0C	Device Power Cycle Count		Число циклів включення-вимикання вінчестера.
13	0D	Soft Read Error Rate		Число помилок при читанні з вини програмного забезпечення, які не піддалися виправленню.
187	BB	Reported UNC Errors		Непереборні апаратні помилки.
190	BE	Airflow Temperature		Температура повітря усередині корпусу жорсткого диска. Ціле значення або значення за формулою 100 - Airflow Temperature
191	BF	G-sense error rate		Кількість помилок, що виникають внаслідок ударів.
192	C0	Power-off retract count		Число циклів аварійних вимкнень.
193	C1	Load/Unload Cycle		Кількість циклів переміщення блоку головок у паркувальну зону.
194	C2	HDA temperature		Показання вбудованого термодатчика накопичувача.
195	C3	Hardware ECC Recovered		Число корекції помилок апаратною частиною диска (помилок читання, помилок позиціонування, помилок передачі зовнішнього інтерфейсу).
196	C4	Reallocation Event Count		Число операцій перепризначення в резервну область, успішні та невдалі спроби.
197	C5	Current Pending Sector Count		Число секторів-кандидатів на перенесення в резервну зону. Позначені як ненадійні. При наступних коректних операціях атрибут можна зняти.
198	C6	Uncorrectable Sector Count		Число помилок, що не коректуються при зверненні до сектора.
199	C7	UltraDMA CRC Error Count		Число помилок під час передачі даних за зовнішнім інтерфейсом.
200	C8	Write Error Rate / Multi-Zone Error Rate		Загальна кількість помилок під час заповнення сектора інформацією. Показник якості накопичувача.
201	C9	Soft read error rate		Частота появи програмних помилок при читанні даних з диска, а не апаратної частини HDD.
202	Ca	Data Address Mark errors		Число помилок адресно позначеної інформації (Data Address Mark (DAM)). Якщо автоматично не коригується - замінити пристрій.
203	CB	Run out cancel		Кількість помилок ECC даних, що приєднуються до сигналу, що передається, дозволяють приймаючій стороні визначити факт збою або виправити несуттєву помилку.
204	CC	Soft ECC correction		Кількість помилок ECC, скоригованих програмним способом.
205	CD	Thermal asperity rate (TAR)		Число помилок внаслідок температурних коливань.
206	CE	Flying height	*	Висота між головкою та поверхнею диска комп'ютера.
209	D1	Offline seek performance	*	Drive's seek performance під час offline operations.
220	DC	Disk Shift		Дистанція усунення блоку дисків щодо шпинделя. В основному виникає через удар або падіння.
221	DD	G-Sense Error Rate		Число помилок, що виникли через зовнішні навантаження та удари. Атрибут зберігає показання вбудованого crash датчика.
222	DE	Loaded Hours	*	Час, проведений блоком магнітних головок між вивантаженням з області паркування в робочу область диска і завантаженням блоку назад в паркувальну область.
223	DF	Load/Unload Retry Count	*	Кількість нових спроб вивантажень/завантажень блоку магнітних головок вінчестера в/з області паркування після невдалої спроби.
224	E0	Load Friction		Величина сили тертя блоку магнітних головок при вивантаженні з паркувальної області.
225	E1	Load Cycle Count		Число циклів вхід-вихід у паркувальну зону.
226	E2	Load ‘In’-time	*	Час, за який привід вивантажує магнітні головки з області паркування на робочу поверхню диска.
227	E3	Torque Amplification Count		Кількість спроб компенсувати крутний момент.
228	E4	Power-Off Retract Cycle		Кількість повторів автоматичного паркування блоку магнітних головок внаслідок вимкнення живлення.
230	E6	GMR Head Amplitude	*	Амплітуда «тремтіння» (відстань переміщення блоку магнітних головок, що повторюється).
231	E7	Temperature		Температура жорсткого диска.
240	F0	Head flying hours	*	Час позиціонування голівки.
250	FA	Read error retry rate		Число помилок під час читання жорсткого диска.

Атрибути дисків потрібно дивитися в цілому і самостійно прогнозувати заміну, не лише спираючись на атрибути smart. Потрібно додатково проводити тести на бедблоки та запускати fscheck та smart тести, про які йтиметься у наступних статтях.

Сучасні жорсткі диски досить "розумні" пристрої і, крім основних властивих їм як пристрої зберігання та обробки даних властивостей, підтримують технологію самотестування, аналізу стану, і накопичення статистичних даних про погіршення власних характеристик S.M.A.R.T. (S elf- M onitoring A nalysis a nd R eporting T echnology). Основи S.M.A.R.T. були розроблені 1995 р. спільними зусиллями провідних виробниками жорстких дисків (HDD). У наступні роки стандарти S.M.A.R.T допрацьовувалися відповідно до змін технологій та обладнання (SMART II та SMART III) і продовжують удосконалюватися в даний час.

Жорсткий диск, починаючи з моменту його виготовлення, постійно відстежує певні параметри свого стану та відображає їх у спеціальних характеристиках - атрибутах(Attribute), що зберігаються у постійному запам'ятовуючому пристрої, як правило, у спеціально виділеній частині дискової поверхні, доступної тільки внутрішній мікропрограмі накопичувача - службовій зоні. Дані атрибутів можуть бути зчитані відповідно до специфікації ATA ( AT A ttachment) за командами підтримки SMART (SMART READ DATA та ще більше десятка команд), які передаються в накопичувач спеціальним програмним забезпеченням, як наприклад, утилітами від виробників обладнання або універсальними програмами тестування та моніторингу стану HDD (udisks, smartctl, GSmartControl, gnome-disks і т.п.). Сучасні стандарти ATA включають підтримку протоколу SCT (SMART Command Transport), що забезпечує зчитування журналів статистики пристрою. Журнал статистики пристрою - це доступний тільки для читання журнал SMART, що передається накопичувачем при отриманні команд READ LOG EXT, READ LOG DMA EXT або SMART READ LOG.

Атрибут є характеристикою певного стану жорсткого диска, яка змінюється в процесі експлуатації, приймаючи числове значення від максимального, встановленого в момент виготовлення даного пристрою, до мінімального, при досягненні якого, працездатність накопичувача не гарантується. Усі атрибути ідентифікуються своїм цифровим номером, більшість із яких однаково інтерпретується жорсткими дисками різних моделей. Деякі з них можуть використовуватися лише конкретним виробником обладнання та підтримуватися окремими моделями накопичувачів. Так, наприклад, атрибут з ідентифікатором 7 , що характеризує кількість помилок встановлення головок на потрібну доріжку поверхні диска Seek_Error_Rateнемає сенсу для твердотільних дисків (SSD) і, відповідно, не підтримується ними, а атрибут з ідентифікатором 9 , Що характеризує сумарний час роботи накопичувача за весь термін експлуатації та позначається як Power_On_Hours,підтримується як SSD, і традиційними HDD.

Атрибути складаються з декількох полів, (найчастіше позначаються як Val, Worst, Tresh, RAW), кожне з яких є певним показником, що характеризує технічний стан накопичувача на даний час. Програми зчитування S.M.A.R.T. виводять вміст атрибутів, як правило, у вигляді кількох колонок:

ID#- Чисельний ідентифікатор атрибуту

Attribute- назва атрибуту

Flags- Прапори атрибутів, що задаються виробником HDD. Характеризують тип атрибута (більшість програм інтерпретують прапори як символів k,c,r,s,o,pабо абревіатури, наприклад, EC – Event Count, лічильник подій).

Pre-Failure (PF, 01h)- при досягненні граничного значення даного типу атрибутів диск потребує заміни. Іноді цей біт прапорів позначають як Life Critical (CR)або Pre-Failure warranty (PW)
O nline test (OC, 02h) – атрибут оновлює значення під час виконання off-line/on-line вбудованих тестів SMART;
P erfomance R elated (PE або PR, 04h) - атрибут характеризує продуктивність;
E rror R ate (ER, 08h) - атрибут відображає лічильники помилок обладнання;
E vent C ounts (EC, 10h) – атрибут є лічильником подій;
S elf P reserving (SP, 20h) – атрибут, що самозберігається;
Деякі програми можуть інтерпретувати прапори у вигляді текстових описів, близьких за змістом до розглянутих вище. Один атрибут може мати декілька встановлених в одиницю значень прапорів, наприклад атрибут з ідентифікатором 05 що відображає кількість перепризначених через збоїв секторів з резервної області, має встановлені прапори SP+EC+OC – лічильник подій, що самозберігається, оновлюється при автономному та інтерактивному режимі накопичувача.

Value- поточне значення атрибуту

Threshold- мінімальне граничне значення атрибуту

Worst- Найгірше значення атрибуту за весь час роботи накопичувача

Raw- абсолютне значення атрибуту

Type- деякі програми в даному необов'язковому полі відображають інформацію з прапорців атрибутів або ознаки їх критичності ( Criticalабо Pre-Fail, що відображають погіршення характеристик обладнання, та Old-ageдля атрибутів, що відбивають вироблення ресурсу);

Для аналізу стану накопичувача, мабуть найважливішим значенням атрибуту є Value- Умовне число (зазвичай від 0 до 100 або до 253), задане виробником. Значення Valueспочатку встановлено максимум при виробництві накопичувача і зменшується у разі погіршення його параметрів. Для кожного атрибуту існує граничне значення, при досягненні якого виробник не гарантує його працездатність - поле Threshold. Якщо значення Valueнаближається або стає менше значення Threshold, - Накопичувач пора міняти.

Перелік атрибутів та їх значення жорстко не стандартизовані та деякі з них можуть визначатися виробником накопичувача, але основна частина інтерпретується однаково. Наприклад, атрибут з ідентифікатором 05 (Reallocated sector count) характеризуватиме кількість забракованих і перепризначених із резервної області секторів диска, як для пристроїв виробництва компанії Seagate Technology, так і для пристроїв виробництва Western Digital. Набір атрибутів, що підтримуються, залежить від моделі накопичувача і може значно відрізнятися за складом для різних моделей.

Найбільш поширеним програмним засобом для отримання даних S.M.A.R.T в середовищі Linux є утиліта smartctlз комплекту smartmontools, як правило, програмного забезпечення, що входить до складу встановлюваного за умовчанням будь-якого дистрибутива. При необхідності оновити версію, а також завантажити документацію англійською мовою можна на сайті проекту smartmontools.org.

Для роботи з утилітою smartctlпотрібні права суперкористувача root.

Формат командного рядка smartctl:

smartctl параметри пристрій

Приклади використання smartctl

smartctl -help або smartctl --usage- Відобразити підказку про використання команди.

Параметри smartctl:

-V, --version, --copyright, --license- Відобразити версію, інформацію копірайту та ліцензії.

-i, --info- Відобразити ідентифікаційну інформацію для пристрою.

-g NAME, --get=NAME- Відобразити параметри налаштувань диска (all, aam, apm, lookahead, security, wcache, rcache, wcreorder)

-a, --all- Відобразити всі дані SMART зазначеного диска.

-x, --xall- Відобразити всі технічні дані для вказаного диска.

--scan- Виконати пошук дискових пристроїв.

-q TYPE, --quietmode=TYPEвстановити режим деталізації виводу для smartctl (errorsonly, silent, noserial)

-d TYPE, --device=TYPE- встановити тип пристрою (ata, scsi, sat[,auto][,N][+TYPE], usbcypress[,X], usbjmicron[,p][,x][,N], usbsunplus, marvell, areca,N /E, 3ware,N, hpt,L/M/N, megaraid,N, cciss,N, auto, test) Зазвичай установка типу пристрою потрібна в тих випадках, коли утиліта smartctlне може визначити його автоматично.

-b TYPE, --badsum=TYPE- задати реакцію виявлення помилок контрольних сум (warn, exit, ignore)

-r TYPE, --report=TYPE- опція призначена для розробників smartmontoolsта дозволяє отримати деталізовану інформацію при виконанні транзакцій функції керування пристроями вводу/виводу ioctl(ioctl, ataioctl, scsiioctl та рівень налагодження). Подробиці - man smartctl

-n MODE, --nocheck=MODE- режим заборони виконання тестів для режимів енергозбереження (never, sleep, standby, idle). Зазвичай використовується для запобігання запуску шпиндельного двигуна за командою Smartctl.

-s VALUE, --smart=VALUE- відключення або увімкнення SMART (on/off)

-o VALUE, --offlineauto=VALUE- заборона або дозвіл автоматичного виконання тестів у неінтерактивному режимі (в режимі простою накопичувача), значення, що приймаються - on/off

-S VALUE, --saveauto=VALUEавтозбереження атрибутів (on/off)

-s NAME[,VALUE], --set=NAME[,VALUE]- заборона/дозвіл параметрів обладнання накопичувача (aam,, apm,, lookahead,, security-freeze, standby,, wcache,, rcache,, wcreorder,)

-H, --health- Відобразити стан накопичувача (SMART health status)

-c, --capabilities- Відобразити інформацію про підтримувані можливості SMART зазначеного жорсткого диска.

-A, --attributes- Відобразити атрибути SMART

-f FORMAT, --format=FORMAT- задати формат атрибутів SMART (old, brief, hex[,id|val]). В основному, впливає на формат значень ідентифікаторів атрибутів, що відображаються, і формат відображення їх прапорів:
old- ідентифікатори атрибутів виводяться в десятковій системі числення, значення прапорів відображаються у шістнадцятковій та інтерпретуються у вигляді тексту.
hex- те, що й у попередньому випадку, але ідентифікатори атрибутів відображаються в шістнадцятковій системі числення.
brief- компактний висновок, ідентифікатори відображаються в десятковій системі числення, прапори відображаються у вигляді символів із розшифровкою в нижній частині таблиці:
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE 1 Raw_Read_Error_Rate POSR-- 114 100 006 - 78309029 . . . . . . 254 Free_Fall_Sensor -O-CK 100 100 000 - 0 ||||||_ K auto-keep |||||__ C event count ||||___ R _____ O updated online |______ P prefailure warning

-l TYPE, --log=TYPE- відобразити вказаний журнал пристрою (selftest, selective, directory[, g|s], xerror[,N][,error], xselftest[,N][,selftest],background, sasphy[,reset], sataphy[,reset ], scttemp, scttempint,N[,p], scterc[,N,M], devstat[,N], ssd, gplog,N[,RANGE], smartlog,N[,RANGE]

-v N,OPTION , --vendorattribute=N,OPTION- встановити параметр для визначеного виробником атрибуту з ідентифікатором N

-F TYPE, --firmwarebug=TYPE- адаптація програми для обліку помилок в апаратній прошивці накопичувача (none, nologdir, samsung, samsung2, samsung3, xerrorlba, swapid)

-P TYPE, --presets=TYPE- Налаштування параметрів диска. За замовчуванням, виявивши інформацію про накопичувач у своїй базі, утиліта smartctl, використовує набір параметрів для цієї моделі. Опція use- Використовувати передустановки для цього накопичувача, ignore- не використовувати, show- відобразити налаштування для даного диска, showall- Відобразити налаштування для зазначеної моделі. Приклади:

smartctl –P ignore /dev/hdb- ігнорувати попередні установки для диска /dev/hdb;
smartctl -P show /dev/sdb- відобразити налаштування для зазначеного диска;
smartctl -P showall 'ST9250315AS'- - відобразити налаштування для зазначеної моделі диска - ST9250315AS;
smartctl -P showall 'ST3750515AS' 'SD15'- відобразити налаштування для зазначеної моделі диска ST3750515AS з прошивкою SD15;

-B [+] FILE, --drivedb = [+] FILE- прочитати та змінити базу даних моделей дисків із файлу FILE. Знак “+” перед ім'ям файлу, означає додавання нових записів до бази, перед існуючими.

За промовчанням база даних зберігається у файлі /usr/share/smartmontools/drivedb.h

DEVICE SELF-TEST OPTIONS =====

-t TEST, --test=TEST- Запустити виконання тесту TEST Run test. TEST: offline, short, long, конвеєр, праця, vendor,N, select,M-N, pending,N, afterselect,

-C, --captive- Виконання тестів в режимі захоплення накопичувача. Використовується разом із параметром -tдля тестів нев режимі offline. Використання цього параметра може викликати зайнятість пристрою на весь час виконання тесту та призвести до порушення роботи системи та втрати даних. Не варто використовувати опцію -cдля виконання тестів накопичувачів із монтованими розділами. Для SCSI пристроїв ця опція означає виконання вбудованих тестів у режимі "Foreground mode".

-X, --abort- примусово завершити тест, який виконується без ключа --captive.

Приклади використання Smartctrl.

smartctl --info /dev/sdb- Відобразити ідентифікаційну інформацію для пристрою /dev/sdb. Приклад виведення команди:

=== START OF INFORMATION SECTION === Device Model: ST9500620NS Serial Number: 9XF0AW8T Firmware Version: SN01 User Capacity: 500,107,862,016 Local Time is: Tue Oct 28 15:05:31 2014 MSK SMART support is: Available - device has SMART capability. SMART support is: Enabled

smartctl --all /dev/hdа- відобразити всі дані SMART для пристрою /dev/hda

Приклад даних, що відображаються:

=== START OF INFORMATION SECTION === Device Model: ST9500620NS Serial Number: 9XF0AW8T Firmware Version: SN01 User Capacity: 500,107,862,016 Local Time is: Tue Oct 28 15:05:45 2014 MSK SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x82) Offline data collection активність була здійснена без error. Auto Offline Data Collection: Enabled. Self-test execution status: (0) Попередній self-test routine зроблений без аварії або не self-test має будь-яку ходу. Total time to complete Offline data collection: (634) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data до введення в експлуатацію потужності. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Шорсткий self-test routine recommended polling time: (1) хвилин. Розширений self-test routine recomended polling time: (102) хвилин. Конвеянція шляху-резистентного курсу recommended polling time: (2) minutes. SCT capabilities: (0x10bd) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST TRESH TYPE UPDATED 274202 3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 72 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000s 07 32 9 Power_On_Hours 0x0032 073 073 000 Old_age Always - 24037 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 72 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 182 Report Old_age Always - 0 188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 081 048 045 Old_age Always - 19 191 G-Sense_Error_0 Always - 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 38 193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 73 194 Temperature_Celsius 0x0022 019 052 000 Old_age Always - 19 (0 14 0 0) 195 Hardware_ECC_Recovered 0x001a 118 100 002 Old Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 fter scanning selected spans, do NO read-scan remainder of disk. Якщо Selective self-test is pending on power-up, resume after 0 minute delay.

smartctl -A -v 9, хвилини /dev/hda- відобразити всі дані атрибутів SMART для пристрою /dev/hdaта атрибут з ідентифікатором 9 (час перебування у включеному стані) інтерпретувати як внутрішнє значення, що задається у хвилинах, а чи не в годинах.

smartctl --smart=on --offlineauto=on --saveauto=on /dev/hda- увімкнути SMART для диска /dev/hda, дозволити автоматичне виконання офлайн-тестів та самозбереження атрибутів. Команду можна виконувати на працюючій системі. Фактично це встановлення стандартних параметрів експлуатації для звичайного дискового накопичувача.

smartctl --test=long /dev/hda- Виконати розширені вбудовані тести для диска /dev/hda.Команду можна використовувати на працюючій системі. Для перегляду результатів виконання тестів використовується команда виведення внутрішнього журналу після завершення тесту
smartctl -l selftest /dev/hda

smartctl --attributes --log=selftest --quietmode=errorsonly /dev/had- Відобразити дані внутрішнього журналу самотестування та атрибути помилок.

smartctl -s on -t offline /dev/hdc- увімкнути SMART та виконати офлайн-тест для диска /dev/hdc. Якщо при тестуванні буде виявлена помилка, то інформація про неї буде записана у внутрішній журнал, переглянути який можна за допомогою параметра -l error.

smartctl -q silent -a /dev/had- Перевірити дані SMART без виведення отриманої інформації. Зазвичай використовується у скриптах. Після виконання команди перевіряється код повернення (змінна $? командної оболонки) для визначення факту виходу значення якогось атрибуту за граничну величину або наявності запису про помилки в журналах пристрою.

smartctl -q errorsonly -H -l selftest /dev/had- виводити інформацію лише за наявності помилкового стану SMART або якщо якийсь із внутрішніх тестів завершився з помилкою.

smartctl -t select,10-100 -t select,30-300 -t afterselect,on -t pending,45 /dev/hda- виконати внутрішній тест у заданій області блоків LBA і після його завершення сканувати частину диска, що залишилася. Якщо під час сканування буде вимкнено живлення, то продовжити його через 45 хвилин після ввімкнення.

smartctl --all --device=3ware,0 /dev/sda- Отримати дані SMART для першого ATA-диска, підключеного до RAID контролера 3ware.

smartctl -a -d 3ware,0 /dev/twe0- Отримати дані SMART для першого ATA-диска, підключеного до RAID контролера 3ware RAID 6000/7000/8000.

smartctl -a -d 3ware,0 /dev/twa0- Отримати дані SMART для першого ATA-диска, підключеного до RAID контролера 3ware RAID 9000

smartctl -t short -d 3ware,3 /dev/sdb- запустити виконання коротких внутрішніх тестів для 4-го диска другого дискового SCSI пристрою /dev/sdb

smartctl -a -d hpt,1/3 /dev/sda- отримати дані SMART диска, підключеного до 3 каналу першого контролера HighPoint RocketRAID

Розшифрування атрибутів S.M.A.R.T

Ідентифікатори атрибутів вказані в десятковій системі числення, а в дужках вони ж – у шістнадцятковій.

001 (1h) Raw Read Error Rate- Абсолютне значення помилок зчитування. Існує деякі відмінності у формуванні значення атрибуту різними виробниками. З практики можу сказати, що накопичувачі Seagate можуть мати гігантське значення RAW цього атрибуту, реально будучи у хорошому стані, а накопичувачі Western Digital можуть мати його нульовим, маючи критичні показники за іншими характеристиками. Деякі моделі взагалі не підтримують цей атрибут.

002 (02h) Throughput Performance- усереднена продуктивність жорсткого диска. Рідко зустрічається атрибут.

003 (3h) Spin Up Time- Середній час розкручування шпинделя диска від 0 RPM до робочої швидкості. Для дисків SSD не підтримується.

004 (4h) Start/Stop Count- Кількість циклів запуску/зупинки шпинделя.

005 (5h) Reallocated Sector Count- кількість перепризначених (перерозподілених) секторів. Сучасні накопичувачі мають резервну область поверхні для використання її обсягу у разі погіршення характеристик блоків із основної зони. Якщо мікропрограма накопичувача виявляє помилки із запису/читання будь-якого блоку робочої поверхні, то запускається механізм, що забезпечує переадресацію звернень до дефектного блоку (сектору), на блок із резервної частини. Він автоматично переміщає його дані до резервної області, а цей блок позначається як "переназначений". Часто цей процес називають "remapping", або "automatic defect reassignment". Процедура перепризначення збійних секторів на резервні виконується автоматично внутрішньою мікропрограмою накопичувача, і для користувача (операційної системи) вона невидима. Сам факт перепризначення та кількість перепризначених секторів доступні лише з журналів SMART. Поле абсолютного значення атрибуту Raw Valueмістить загальну кількість перепризначених секторів. Нормалізоване значення Valueвідбиває відсоток допустимої кількості дефектних блоків. При вичерпанні резервної області перепризначення стає неможливим і диск підлягає заміні. Навіть некритичне, але велике значення цього поля, може призвести до зниження швидкості обміну даними, оскільки накопичувач виконує додаткові операції встановлення головок доріжки резервної області, яка зазвичай знаходиться в кінці робочої поверхні диска.

007 (7h) Seek Error Rate- частота появи помилок позиціонування блоку магнітних головок (БМГ). Дискові накопичувачі контролює правильність встановлення головок на необхідну доріжку поверхні. У випадку, коли установка неправильна, фіксується помилка і операція повторюється. На практиці, велика кількість помилок позиціонування може бути спричинена не лише проблемами обладнання, а й впливом зовнішніх факторів – не відповідним температурним режимом чи вібрацією.

008 (8h) Seek Time Performance

009 (09h) Power-On Hours (POH)Кількість робочих годин - кількість годин, коли диск перебував у включеному стані протягом усього терміну з виробництва, як цілочисленного значення годинах. Іноді зустрічаються моделі накопичувачів, у яких внутрішнє значення даного атрибута зберігається як кількості робочих хвилин чи секунд, а чи не годин. Досягнення порогового значення даного атрибута означає вироблення ресурсу, заданого виробником ( MTBF - Mean Time Between Failures

010 (0Ah) Spin Retry Count- Кількість повторних спроб старту шпинделя. Після включення живлення накопичувач розкручує диски і контролює досягнення робочої швидкості обертання, заданої виробником для даної моделі. Якщо за відведений контрольний час робочої швидкості не досягнуто, збільшується значення даного атрибуту і виконується повторне розкручування двигуна.

011 (0B) Recalibration Retries- атрибут відображає кількість повторних рекалібровок, якщо перша спроба була невдалою. Якщо значення атрибута збільшується, то велика ймовірність проблем із механічною частиною накопичувача. Крім того, збільшення абсолютного значення даного атрибуту може бути спричинене тим, що процедура рекалібрування використовується внутрішньою мікропрограмою накопичувача для корекції інших типів помилок.

012 (0Ch) Device Power Cycle Count- абсолютне значення Raw Value вказує на кількість циклів увімкнення/вимкнення живлення накопичувача за весь період експлуатації. Нормалізоване значення Value звичайно змінюється і дорівнює 100.

013 (0Dh) - Soft Read Error Rate- Кількість програмних збоїв – сукупна кількість програмних збоїв. Нормалізоване значення: починаючи зі 100, відображає відсоток допустимої наростаючої кількості програмних збоїв.

100 (64h) Erase/Program Cycles- кількість циклів стирання –записи пам'яті, що перепрограмується (flash) для SSD-дисків. Кількість таких циклів обмежена і залежить від мікросхем постійної пам'яті, що перезаписується, що використовуються в даній моделі SSD.

103 (67h) Translation Table Rebuild- кількість подій, пов'язаних із руйнуванням внутрішніх таблиць транслятора та його перебудовою.

170 (AAh)Reserved Block Count- кількість доступних резервних блоків для переназначення збійних секторів (див. атрибут E8h).

171 (ABh) Program Fail Count- помилки запису в пам'ять SSD, що перепрограмується.

172 (ACh) Erase Fail Count– помилки стирання flash-пам'яті SSD. Процес запису в постійну пам'ять, що перезаписується, складається з двох частин - стирання і запису. Процедура стирання завжди виконується перед записом даних.

173 (ADh) Wear Leveller Worst Case Erase Count- Максимально допустима кількість операцій стирання одиничного блоку SSD-диска.

174 (AEh) Unexpected Power Loss- Непередбачене відключення живлення для SSD. Також цей показник називається «Кількість аварійних вимкнень» у термінології жорстких дисків із магнітними носіями. Абсолютне значення Raw Value: сукупна кількість позаштатних вимкнень за весь термін використання пристрою.

175 (AFh) Program Fail Count– цей атрибут використовується в SSD-накопичувачах виробництва Intel та відображає інформацію про збої захисту від вимкнення живлення SSD-дисків. Результати останнього тесту у вигляді кількості мікросекунд до розряду конденсатора фіксуються на максимальному значенні. Також записується кількість хвилин після останнього тесту та загальна кількість тестів за весь термін використання пристрою. Необроблене значення Raw Value: Байти 0-1: Результати останнього тесту у вигляді кількості мікросекунд до розряду конденсатора фіксується на максимальному значенні. Результат тесту повинен бути в діапазоні 25 - 5000000, нижче значення вказує на певний код помилки. Байти 2-3: кількість хвилин після останнього тексту фіксується на максимальному значенні. Байти 4-5: кількість тестів за весь термін використання пристрою, що не збільшується при циклах включення та відключення, фіксується на максимальному значенні. Значення Value встановлюється рівним 1 при збою тесту, або 11 при тестуванні конденсатора у неприпустимих температурних умовах; в іншому випадку встановлюється рівним 100.

183 (B7h) SATA Downshifts- Кількість зниження швидкості SATA Необроблене значення: кількість випадків, коли через помилки для інтерфейсу SATA була обрана знижена швидкість передачі даних (з 6 Гб/с до 3 Гб/с або 1,5 Гб/с або з 3 Гб/с. До 1.5 Гб / С. Дуже часто цей атрибут характеризує недостатню якість електроживлення, окислення контактів інтерфейсного кабелю або його несправність.

184 (B8h) Завершити-відновити errorКількість виявлених наскрізних помилок кеш-пам'яті (Disk Cache). Абсолютне значення: кількість виявлених та виправлених обладнанням наскрізних помилок.

187 (BBh) Reported Uncorrectable ErrorsКількість невідновних помилок. Необроблене значення Raw Value: кількість помилок, які не вдалося виправити за допомогою внутрішніх підпрограм накопичувача.

188 (BCh) Command Timeout- кількість команд, перерваних по таймауту.

189 (BDh) High Fly Writes- кількість подій, пов'язаних з помилками, зафіксованими монітором контролю висоти польоту Fly Height Monitor, коли головки запису знаходяться в положенні, що не гарантує виконання операції. Якщо висота польоту головки над магнітною поверхнею, навіть на короткий час перевищить оптимальну, записані нею дані, надалі, можуть не прочитатися. Сучасні накопичувачі використовують спеціально розроблену технологію контролю висоти польоту головок, що дозволяє виконувати запис даних при неоптимальній висоті. До лічильника даного атрибута додається одиниця, а запис виконується після встановлення нормальної висоти польоту. Підвищене значення даного атрибуту може бути викликане зовнішніми ударами чи вібраціями, ненормальною температурою, погіршенням характеристик магнітної поверхні чи головки.

190 (BEh) Airflow TemperatureТемпература повітряного потоку (корпус). Значення Raw Value: статистичні дані щодо температури корпусу. Байти 0-1: поточна температура корпусу в градусах за Цельсієм; байт 2: нещодавня мінімальна температура корпусу в градусах за Цельсієм; байт 3: нещодавня максимальна температура корпусу в градусах за Цельсієм; байти 4-5: лічильник перевищень температури. Кількість випадків коли зафіксована температура перевищувала максимальну допустиму робочу температуру накопичувача.

191 (BFh) G-sense error rate- кількість помилок, що виникають внаслідок ударних навантажень. Атрибут зберігає показання вбудованого акселерометра, який фіксує всі удари, поштовхи, падіння та навіть неакуратне встановлення диска в корпус комп'ютера. Зазвичай досить точно характеризує умови експлуатації ноутбуків - велике значення атрибуту говорить про різкі поштовхи та падіння при роботі пристрою.

192 (C0h) Emergency Retract Cycle CountКількість аварійних вимкнень (кількість позаштатних вимкнень) – сукупна кількість подій аварійного (нештатного) відключення живлення за весь термін використання пристрою. Для дисків SSD під «нештатним вимкненням» розуміється відключення живлення пристрою без попередньої видачі команди STANDBY IMMEDIATE.

194 (C2h) HDA Temperature- Температура самого накопичувача (HDA - Hard Disk Assembly). У даному атрибуті зберігаються показання вбудованого температурного датчика, яким зазвичай є одна з магнітних головок (як правило - нижня). У дисків SSD термодатчик розміщується всередині корпусу на друкованій платі. Дані, записані в полях атрибута, відображають поточну, мінімальну та максимальну температуру. Поле Worst показує найгіршу, досягнуту за час роботи накопичувача, температуру (можна встановити факт перегріву та його ступінь), Raw Value – поточну температуру. Деякі моделі накопичувачів можуть підтримувати атрибут 205 (CDh) Thermal asperity rate (TAR), який фіксує кількість небезпечних перепадів температури.

195 (C3h) Hardware ECC Recovered- кількість помилок зчитування, виправлених обладнанням накопичувача із застосуванням коду корекції помилок. Подібні помилки не вимагають повторного зчитування сектора, і не призводять до втрати швидкості обміну даними, але їх велика кількість говорить про погіршення параметрів тракту зчитування.

196 (C4h) Reallocation Event Count raw value

Поле raw valueцього атрибуту показує загальну кількість секторів, які накопичувач зараз вважає кандидатами на перепризначення в резервну область. Якщо надалі якийсь із цих секторів буде прочитаний успішно, то він виключається зі списку кандидатів. Якщо ж читання сектора супроводжуватиметься помилками, то накопичувач спробує відновити дані і перенести в резервну область, а сам сектор позначити як переназначений (remapped).

198 (C6) Невідповідний Sector Count- Лічильник помилок, що не коректуються, тобто лічильник помилок, які не були виправлені внутрішніми засобами корекції обладнання накопичувача. Це означає, що такі помилки виявляються як класичні збійні блоки файлової системи (Bad Block). Причиною подібних збоїв диска може бути несправність окремих елементів або відсутність вільних секторів у резервній області диска, коли виникла необхідність перепризначення.

199 (C7h) UltraDMA CRC Error Rate- Кількість помилок під час передачі даних у режимі прямого доступу до пам'яті, виявлених засобами циклічного надлишкового коду (Cyclic redundancy check, CRC). Апаратні засоби контролю передачі з накопичувача в оперативну пам'ять виявили помилку контрольної суми і виправили її “на льоту”, якщо помилка виправна. У разі алгоритм нормальної роботи диска не змінюється. У разі невиправної помилки процедура її обробки виконується системою. Зазвичай цей атрибут містить лічильник будь-яких видів помилок CRC. Нерідко цей тип помилки пов'язаний не стільки з обладнанням накопичувача, скільки з несправним інтерфейсним кабелем, контактами, що окислюються, неякісним електроживленням, розгоном частоти шини PCI, перегрівом мікросхем чіпсету материнської плати і т.п.

200 (C8h) Write Error Rate (Multi Zone Error Rate)- Помилки запису даних.

232 (E8h) Total Count of Write SectorsДля SSD-дисків – кількість записаних секторів. Значення Raw Value збільшується на 1 на кожні 65536 секторів (32 МБ), що записуються системою. Для SSD Intel - Intel SSD Available Reserved Space- Відсоток доступної резервної області, яка використовується для перепризначення дефектних блоків.

233 (E9h) Power-On Hours- час роботи накопичувача. Для SSD-дисків цей атрибут інтерпретується як Remaining Life- Покажчик зносу носія. Кількість циклів носія NAND. Лінійно знижується від 100 до 1 зі збільшенням середньої кількості циклів стирання від 0 до максимального. Нормалізоване значення перестане зменшуватися після досягнення 1, але, ймовірно, пристрій витримає значне додаткове зношування.

241 (F1h) Total LBAs Written- загальна кількість записаних секторів LBA. Значення Raw Value: сукупна кількість секторів, записаних системою. Значення збільшується на 1 на кожні 65536 секторів (32 МБ), що записуються системою.

242 (F2h) Total LBAs Read- загальна кількість прочитаних секторів LBA. Значення Raw Value збільшується на 1 на кожні 65536 секторів (32 МБ), що прочитуються системою.

254 (FEh) безкоштовний fall Event Count- кількість подій прискорення вільного падіння диска під час експлуатації (кілька разів диск падав).

Оцінка технічного стану жорсткого диска за даними S.M.A.R.T

Набір атрибутів, що підтримуються конкретною моделлю жорсткого диска, навіть якщо він мінімальний, дозволяє з високою достовірністю визначити технічний стан та перспективи експлуатації пристрою. Можна визначити час перебування у включеному стані за значенням атрибуту 9 , а разом із значенням атрибута 12 - кількість включень/вимикань електроживлення, а отже – цілодобовий або періодичний режим експлуатації. Інтенсивність використання, температурний режим, негативні зовнішні впливи – усі ці факти легко відслідковуються за абсолютними значеннями відповідних атрибутів. Подібним чином можна оцінити і рівень зносу обладнання, якість поверхні і тракту запису/читання.

Мінімально інформативний контроль за станом дисків може виконуватися навіть на рівні BIOS. У разі досягнення критичного значення будь-якого атрибуту, що характеризує працездатність, при включеному моніторингу стану S.M.A.R.T в налаштуваннях BIOS, завантаження операційної системи припиняється і на екран виводиться повідомлення:

Primary Master Hard Disk: S.M.A.R.T Status BAD!, Backup and Replace.
Press F1 to Resume

Таким чином, без встановлення або запуску додаткового програмного забезпечення, можна вчасно визначити факт критичного стану накопичувача засобами Базової Системи Введення-Виведення (BIOS) при включенні комп'ютера.

Технічний стан жорсткого диска, що не досяг критичного порога, характеризується абсолютним значенням атрибутів, що відображають лічильники збоїв, виявлених та виправлених обладнанням накопичувача.

001 (1) Raw Read Error Rate- Абсолютне значення помилок зчитування. Існує деякі відмінності у формуванні значення атрибуту різними виробниками. На практиці накопичувачі Seagate можуть мати гігантське значення RAW цього атрибуту, реально будучи в хорошому стані, а накопичувачі Western Digital можуть мати його нульовим, маючи критичні показники за іншими характеристиками. Деякі моделі взагалі можуть не підтримувати цей атрибут.

005 (5) Reallocated Sector Count- кількість перепризначених секторів. Ненульове значення даного лічильника свідчить, що було виявлено дефектні блоки, дані яких перенесено у резервну область.

196 (C4) Місцезнаходження Event Count- Число подій перепризначення збійних секторів. В полі raw valueданого атрибута зберігається загальна кількість спроб перенесення даних із нестабільних секторів у резервну область. Враховуються як успішні, і неуспішні спроби.

197 (C5) Current Pending Sector Count- Поточна кількість нестабільних секторів. Поле raw valueцього атрибуту показує загальну кількість секторів, які накопичувач зараз вважає кандидатами на перепризначення в резервну область (remap). Якщо надалі якийсь із цих секторів буде прочитаний успішно, то він виключається зі списку кандидатів. Якщо ж читання сектора супроводжуватиметься помилками, то накопичувач спробує відновити дані і перенести в резервну область, а сам сектор позначити як переназначений (remapped). Якщо значення атрибутів 5,196,197 збільшується за короткий проміжок часу (дні, або навіть годинник), то це є ознакою, що насторожує – або погіршуються технічні параметри самого накопичувача, або позначається вплив зовнішніх впливів.

007 (07h) Seek Error Rate- частота появи помилок позиціонування блоку магнітних головок (БМГ). Велике значення говорить про проблеми механізму позиціонування, хоча може бути викликано і зовнішніми факторами, такими як перегрівання або підвищена вібрація.

008 (08h) Seek Time Performance- Середня швидкість позиціонування магнітних головок. Якщо значення атрибуту зменшується (уповільнення позиціонування), то велика ймовірність проблем із механічною частиною приводу головок.

199 (C7) UltraDMA CRC Error Count- Лічильник помилок, що виникли під час передачі даних у режимі UltraDMA. Зростання абсолютного значення вказує на проблеми під час передачі даних контролером диска в оперативну пам'ять. Найчастіше викликано поганим кабелем і нестабільним електроживленням.

Зміна абсолютних значень атрибутів слід розглядати у динаміці, й у логічного взаємозв'язку друг з одним.

Виконання вбудованих тестів S.M.A.R.T

Набір вбудованих тестів S.M.A.R.T визначається виробником і може відрізнятися для різних моделей жорстких дисків. В основному, вбудовані тести SMART представлені короткими тестами (short self-test) та довгими (extended sels-test). Короткі тести виконують сканування невеликої частини дискової поверхні, визначеної виробником, і виконуються в середньому близько 1 хвилини. Довгі тести виконують сканування всієї робочої поверхні диска і можуть виконуватись, залежно від швидкодії та об'єму диска, навіть кілька годин. Також, для сучасних дисків можна виконувати селективні тести (selective self-test), параметри яких задаються користувачем і тести після транспортування пристрою (conveyance self-test). Виконання тестів можна перервати, якщо не встановлено режим захоплення накопичувача (captive) і накопичувач підтримує команду скасування тесту. Щодо режиму захоплення накопичувача при виконанні тестів captive, то скористатися ним потрібно обережно, якщо диск використовується системою.

Приклади:

smartctl --test=short /dev/sdb- Запустити короткий тест. У відповідь на команду буде виведена інформація:

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Short self-test routine immediately in off-line mode". Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful. Testing has begun (попередній test aborted). Please wait 1 хвилини для тесту до повного. Test will complete after Fri Dec 5 16:08:09 2014 За допомогою smartctl -X до abort test.

Що означає, що диску відправлено команду на виконання короткого тесту, диск її сприйняв успішно, тест триватиме 1 хвилину, і для примусового його припинення можна скористатися командою smartctl –X.

Результат виконання тесту можна перевірити, переглянувши журнал тестів командою smartctl –l selftest. У відповідь буде отримано інформацію журналу selftest:

=== START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Завершено без 00% 831 -

Колонки журналу: Num- номер запису.
Test_Description- Опис тесту.
Status- статус завершення (виконаний без помилок)
Remaining- відсоток часу, що залишився до завершення тесту, якщо він ще не завершений (00%)
LifeTime(hours)- час роботи накопичувача з початку експлуатації.
LBA_of_first_error- номер логічного блоку LBA, де виявлена перша помилка при виконанні тесту. У цьому прикладі помилок немає.

Для запуску довгого тесту використовується команда:

smartctl --test=long /dev/sdb

У відповідь на команду виводиться інформація про початок тесту:

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Extended self-test routine immediately in off-line mode". Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 70 хвилин для тесту до повного. Test will complete after Fri Dec 5 17:15:44 2014

Як видно, довгий тест для цієї моделі накопичувача виконуватиметься 70 хвилин.

Результат виконання можна перевірити командою smartctl –l selftest /dev/sda

Список команд ATA для роботи з S.M.A.R.T

SMART_READ_VALUES 0xd0 SMART_READ_THRESHOLDS 0xd1 SMART_AUTOSAVE 0xd2 SMART_SAVE 0xd3 SMART_IMMEDIATE_OFFLINE 0xd4 SMART_READ_LOG_SECTOR 0xd5 SMART_WRITE_LOG DISABLE 0xd9 SMART_STATUS 0xda SMART_AUTO_OFFLINE 0xdb

Додатково на тему обладнання в Linux: