MĄDRY - S.M.A.R.T.

SMART ( Self-Monitoring, Analysis and Reporting Technology ; często pisany jako SMART ) to system monitorowania zawarty w dyskach twardych komputera (HDD), dyskach półprzewodnikowych (SSD) i dyskach eMMC . Jego podstawową funkcją jest wykrywanie i raportowanie różnych wskaźników niezawodności dysku z zamiarem przewidywania nieuchronnych awarii sprzętu.

Gdy dane SMART wskazują na możliwą nieuchronną awarię dysku, oprogramowanie działające w systemie hosta może powiadomić użytkownika, aby można było podjąć działania zapobiegawcze, aby zapobiec utracie danych, a uszkodzony dysk można wymienić i zachować integralność danych.

Tło

Dysk twardy i inne dyski do przechowywania danych podlegają awariom (patrz awaria dysku twardego ), które można podzielić na dwie podstawowe klasy:

  • Przewidywalne awarie, które wynikają z powolnych procesów, takich jak zużycie mechaniczne i stopniowa degradacja powierzchni magazynowych. Monitorowanie może określić, kiedy takie awarie stają się bardziej prawdopodobne.
  • Nieprzewidywalne awarie, które pojawiają się bez ostrzeżenia z powodu czegokolwiek, od uszkodzenia elementów elektronicznych po nagłą awarię mechaniczną, w tym awarie związane z niewłaściwą obsługą.

Awarie mechaniczne stanowią około 60% wszystkich awarii napędów. Chociaż ostateczna awaria może być katastrofalna, większość awarii mechanicznych wynika ze stopniowego zużycia i zwykle istnieją pewne oznaki, że awaria jest nieuchronna. Mogą to być: zwiększona moc cieplna, zwiększony poziom hałasu, problemy z odczytem i zapisem danych, czy zwiększenie liczby uszkodzonych sektorów dysku.

Strona PCTechGuide na temat SMART (2003) komentuje, że technologia przeszła przez trzy fazy:

W swoim pierwotnym wcieleniu SMART zapewniał przewidywanie awarii poprzez monitorowanie niektórych działań na dysku twardym online.

Kolejna wersja standardu poprawiła przewidywanie awarii poprzez dodanie automatycznego skanowania odczytu offline w celu monitorowania dodatkowych operacji. atrybuty online są zawsze aktualizowane, podczas gdy atrybuty offline są aktualizowane, gdy dysk twardy nie działa. Jeśli istnieje natychmiastowa potrzeba aktualizacji atrybutów offline, dysk twardy zwalnia, a atrybuty offline są aktualizowane. Najnowsza technologia „SMART” nie tylko monitoruje aktywność dysku twardego, ale także dodaje zapobieganie awariom, próbując wykryć i naprawić błędy sektorów.

Ponadto, podczas gdy wcześniejsze wersje technologii monitorowały aktywność dysku twardego tylko pod kątem danych pobranych przez system operacyjny, najnowszy SMART testuje wszystkie dane i wszystkie sektory dysku, wykorzystując „zbieranie danych offline”, aby potwierdzić stan dysku podczas okresy bezczynności.

Precyzja

Badanie terenowe przeprowadzone przez Google obejmujące ponad 100 000 dysków klasy konsumenckiej od grudnia 2005 do sierpnia 2006 wykazało korelacje między niektórymi informacjami SMART a rocznymi wskaźnikami awarii:

  • W ciągu 60 dni po pierwszym niepoprawnym błędzie na dysku ( atrybut SMART 0xC6 lub 198) wykrytym w wyniku skanowania offline, dysk był średnio 39 razy bardziej narażony na awarię niż podobny dysk, dla którego nie ma takiego błędu wystąpił.
  • Pierwsze błędy w realokacjach, realokacjach offline ( atrybuty SMART 0xC4 i 0x05 lub 196 i 5) oraz liczenia próbne ( atrybut SMART 0xC5 lub 197) były również silnie skorelowane z wyższym prawdopodobieństwem niepowodzenia.
  • Odwrotnie, stwierdzono niewielką korelację ze wzrostem temperatury i brak korelacji z poziomem użytkowania. Jednak badania wykazały, że duża część (56%) uszkodzonych dysków uległa awarii, nie rejestrując żadnej liczby w „czterech silnych ostrzeżeniach SMART” zidentyfikowanych jako błędy skanowania, liczba realokacji, realokacja offline i liczba próbna.
  • Co więcej, 36% uszkodzonych dysków zrobiło to bez rejestrowania żadnego błędu SMART, z wyjątkiem temperatury, co oznacza, że ​​same dane SMART miały ograniczoną użyteczność w przewidywaniu awarii.

Historia i poprzednicy

Wczesna technologia monitorowania dysków twardych została wprowadzona przez IBM w 1992 roku w swoich macierzach dyskowych IBM 9337 dla serwerów AS/400 wykorzystujących dyski IBM 0662 SCSI-2. Później nazwano ją technologią Predictive Failure Analysis (PFA). Mierzył kilka kluczowych parametrów kondycji urządzenia i oceniał je w oprogramowaniu układowym dysku. Komunikacja między jednostką fizyczną a oprogramowaniem monitorującym była ograniczona do wyniku binarnego: a mianowicie „urządzenie jest sprawne” lub „napęd prawdopodobnie wkrótce ulegnie awarii”.

Później inny wariant, nazwany IntelliSafe, został stworzony przez producenta komputerów Compaq i producentów dysków Seagate , Quantum i Conner . Napędy dysków mierzyłyby „parametry kondycji” dysku, a wartości byłyby przesyłane do systemu operacyjnego i oprogramowania do monitorowania przestrzeni użytkownika. Każdy dostawca dysków twardych mógł swobodnie decydować, które parametry mają być uwzględnione w monitorowaniu i jakie powinny być ich progi. Ujednolicenie odbyło się na poziomie protokołu z gospodarzem.

Compaq zgłosił IntelliSafe do komitetu Small Form Factor (SFF) w celu standaryzacji na początku 1995 roku. Został on wsparty przez IBM, partnerów programistycznych Compaqa Seagate, Quantum i Conner oraz Western Digital , które nie posiadało systemu przewidywania awarii na czas. Komitet wybrał podejście IntelliSafe, ponieważ zapewniało ono większą elastyczność. Compaq umieścił IntelliSafe w domenie publicznej w dniu 12 maja 1995 r. Powstały wspólnie opracowany standard został nazwany SMART.

Ten standard SFF opisał protokół komunikacyjny dla hosta ATA do używania i kontrolowania monitorowania i analizy na dysku twardym, ale nie określał żadnych konkretnych metryk ani metod analizy. Później zaczęto rozumieć „SMART” (choć bez żadnej formalnej specyfikacji) w odniesieniu do różnych konkretnych metryk i metod oraz w odniesieniu do protokołów niezwiązanych z usługą ATA do komunikowania tego samego rodzaju rzeczy.

Podane informacje

Dokumentacja techniczna SMART jest w standardzie AT Attachment (ATA). Wprowadzony po raz pierwszy w 1994 roku standard ATA przeszedł wiele zmian. Niektóre części oryginalnej specyfikacji SMART opracowanej przez Komitet Small Form Factor (SFF) zostały dodane do ATA-3, opublikowanej w 1997 r. W 1998 r. ATA-4 zrezygnowała z wymogu utrzymywania przez dyski wewnętrznej tabeli atrybutów i zamiast tego była wymagana tylko dla „ OK" lub "NIE OK" wartość do zwrócenia. Jednak producenci zachowali możliwość pobierania wartości atrybutów. Najnowszy standard ATA, ATA-8, został opublikowany w 2004 roku. Poddawany był regularnym zmianom, ostatnia miała miejsce w 2011 roku. odnoszą się również do tych podobnych funkcji w SMART.

Najbardziej podstawową informacją, jaką dostarcza SMART, jest status SMART. Podaje tylko dwie wartości: „próg nie przekroczony” i „próg przekroczony”. Często są one reprezentowane odpowiednio jako „napęd OK” lub „napęd awaria”. Wartość „próg przekroczenia” ma wskazywać, że istnieje stosunkowo duże prawdopodobieństwo, że dysk nie będzie w stanie przestrzegać swojej specyfikacji w przyszłości: oznacza to, że dysk „niedługo ulegnie awarii”. Przewidywana awaria może być katastrofalna lub może być czymś tak subtelnym, jak brak możliwości zapisu do niektórych sektorów lub być może niższa wydajność niż deklarowane przez producenta minimum.

Stan SMART niekoniecznie wskazuje na przeszłą lub obecną niezawodność dysku. Jeśli dysk uległ już katastrofalnej awarii, status SMART może być niedostępny. Alternatywnie, jeśli dysk miał problemy w przeszłości, ale czujniki nie wykrywają już takich problemów, stan SMART może, w zależności od oprogramowania producenta, sugerować, że dysk jest teraz sprawny.

Niemożność odczytania niektórych sektorów nie zawsze oznacza, że ​​dysk niedługo ulegnie awarii. Jednym ze sposobów tworzenia nieczytelnych sektorów, nawet gdy dysk działa zgodnie ze specyfikacją, jest nagła awaria zasilania podczas zapisu dysku. Ponadto, nawet jeśli dysk fizyczny jest uszkodzony w jednym miejscu, tak że pewien sektor jest nieczytelny, dysk może wykorzystać wolne miejsce do zastąpienia uszkodzonego obszaru, aby sektor mógł zostać nadpisany.

Więcej szczegółów na temat stanu dysku można uzyskać, badając atrybuty SMART. Atrybuty SMART zostały uwzględnione w niektórych wersjach roboczych standardu ATA, ale zostały usunięte, zanim standard stał się ostateczny. Znaczenie i interpretacja atrybutów różni się w zależności od producenta i czasami są uważane za tajemnicę handlową dla jednego lub drugiego producenta. Atrybuty są szczegółowo omówione poniżej.

Dyski ze SMART mogą opcjonalnie prowadzić pewną liczbę „dzienników”. W dzienniku błędów zapisywane są informacje o najnowszych błędach zgłoszonych przez dysk do komputera hosta. Przejrzenie tego dziennika może pomóc w ustaleniu, czy problemy z komputerem są związane z dyskiem lub spowodowane przez coś innego (sygnatury czasowe dziennika błędów mogą się „zawinąć” po 2 32 ms = 49,71 dni)

Napęd, w którym zaimplementowano SMART, może opcjonalnie zaimplementować szereg procedur autotestu lub konserwacji, a wyniki testów są przechowywane w dzienniku autotestów . Procedury autotestu mogą być użyte do wykrycia wszelkich nieczytelnych sektorów na dysku, tak aby można je było przywrócić z kopii zapasowych (na przykład z innych dysków w macierzy RAID ). Pomaga to zmniejszyć ryzyko poniesienia trwałej utraty danych.

Standardy i implementacja

Brak wspólnej interpretacji

Wiele płyt głównych wyświetla komunikat ostrzegawczy, gdy dysk zbliża się do awarii. Chociaż wśród większości głównych producentów dysków twardych istnieje standard branżowy, problemy pozostają spowodowane atrybutami celowo pozostawionymi nieudokumentowanymi publicznie w celu rozróżnienia modeli między producentami. Z prawnego punktu widzenia termin „SMART” odnosi się tylko do metody sygnalizacji między czujnikami elektromechanicznymi wewnętrznego dysku twardego a komputerem hosta. Z tego powodu specyfikacje SMART są całkowicie specyficzne dla dostawcy i chociaż wiele z tych atrybutów zostało ustandaryzowanych między dostawcami napędów, inne pozostają zależne od dostawcy. Implementacje SMART wciąż się różnią i w niektórych przypadkach mogą brakować „wspólnych” lub oczekiwanych funkcji, takich jak czujnik temperatury, lub zawierać tylko kilka wybranych atrybutów, jednocześnie umożliwiając producentowi reklamowanie produktu jako „zgodnego z SMART”.

Widoczność dla systemów hosta

W zależności od typu używanego interfejsu, niektóre płyty główne z obsługą SMART i powiązane oprogramowanie mogą nie komunikować się z niektórymi dyskami obsługującymi SMART. Na przykład kilka dysków zewnętrznych podłączonych przez USB i FireWire prawidłowo wysyła dane SMART przez te interfejsy. Przy tak wielu sposobach podłączenia dysku twardego ( SCSI , Fibre Channel , ATA , SATA , SAS , SSA , NVMe i tak dalej) trudno przewidzieć, czy raporty SMART będą działać poprawnie w danym systemie.

Nawet w przypadku dysku twardego i interfejsu, który implementuje specyfikację, system operacyjny komputera może nie widzieć informacji SMART, ponieważ dysk i interfejs są umieszczone w niższej warstwie. Na przykład mogą być częścią podsystemu RAID, w którym kontroler RAID widzi dysk z obsługą SMART, ale komputer hosta widzi tylko wolumin logiczny wygenerowany przez kontroler RAID.

Na platformie Windows wiele programów przeznaczonych do monitorowania i raportowania informacji SMART będzie działać tylko z kontem administratora .

System BIOS i Windows ( Windows Vista i nowsze) mogą wykrywać stan SMART dysków twardych i dysków półprzewodnikowych oraz wyświetlać komunikat, jeśli stan SMART jest zły.

Dostęp

Aby zapoznać się z listą różnych programów, które umożliwiają odczytywanie danych SMART, zobacz Porównanie narzędzi SMART .

Atrybuty ATA SMART

Każdy producent napędu definiuje zestaw atrybutów i ustawia wartości progowe, powyżej których atrybuty nie powinny przejść podczas normalnej pracy. Każdy atrybut ma surową wartość, która może być wartością dziesiętną lub szesnastkową, której znaczenie zależy wyłącznie od producenta dysku (ale często odpowiada liczbie lub jednostce fizycznej, takiej jak stopnie Celsjusza lub sekundy), wartość znormalizowaną , której zakres od 1 do 253 (przy czym 1 reprezentuje najgorszy przypadek, a 253 reprezentuje najlepszy) i najgorszą wartość , która reprezentuje najniższą zarejestrowaną wartość znormalizowaną. Początkowa wartość domyślna atrybutów to 100, ale może się różnić w zależności od producenta.

Producenci, którzy zaimplementowali co najmniej jeden atrybut SMART w różnych produktach, to między innymi Samsung , Seagate , IBM ( Hitachi ), Fujitsu , Maxtor , Toshiba , Intel , sTec, Inc. , Western Digital i ExcelStor Technology .

Znane atrybuty ATA SMART

Poniższa tabela przedstawia niektóre atrybuty SMART i typowe znaczenie ich nieprzetworzonych wartości. Znormalizowane wartości są zwykle mapowane, aby wyższe wartości były lepsze (wyjątki obejmują temperaturę napędu, liczbę cykli ładowania/rozładowania głowicy), ale wyższe wartości atrybutów surowych mogą być lepsze lub gorsze w zależności od atrybutu i producenta. Na przykład znormalizowana wartość atrybutu „ Liczba ponownie przydzielonych sektorów ” zmniejsza się wraz ze wzrostem liczby ponownie przydzielonych sektorów . W takim przypadku surowa wartość atrybutu często wskazuje rzeczywistą liczbę sektorów, które zostały ponownie przydzielone, chociaż dostawcy nie są w żaden sposób zobowiązani do przestrzegania tej konwencji.

Ponieważ producenci niekoniecznie zgadzają się co do dokładnych definicji atrybutów i jednostek miary, poniższa lista atrybutów jest jedynie ogólnym przewodnikiem.

Dyski nie obsługują wszystkich kodów atrybutów (czasami skracanych jako „ID” dla „identyfikatora” w tabelach). Niektóre kody są specyficzne dla poszczególnych typów dysków (talerz magnetyczny, flash, SSD). Napędy mogą używać różnych kodów dla tego samego parametru, np. patrz kody 193 i 225.

Legenda
NS 193
0xC1
Kod atrybutu w
notacji dziesiętnej i szesnastkowej
Ideał
Wyższy
Wysoka
Wyższa surowa wartość jest lepsza
Niski
Niżej
Niższa surowa wartość jest lepsza
!
(Krytyczny)
Krytyczny
Oznacza atrybut krytyczny .
Określone wartości mogą przewidywać awarię dysku
NS Nazwa atrybutu Ideał ! Opis
01
0x01
Wskaźnik błędów odczytu
Niski
Niżej
(Wartość surowa specyficzna dla dostawcy.) Przechowuje dane związane z częstotliwością sprzętowych błędów odczytu, które wystąpiły podczas odczytu danych z powierzchni dysku. Surowa wartość ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy.
02
0x02
Wydajność przepustowa
Wyższy
Wysoka
Ogólna (ogólna) przepustowość dysku twardego. Jeśli wartość tego atrybutu maleje, istnieje duże prawdopodobieństwo, że wystąpił problem z dyskiem.
03
0x03
Czas rozkręcania
Niski
Niżej
Średni czas rozkręcania się wrzeciona (od zera RPM do pełnej sprawności [milisekundy]).
04
0x04
Licznik start/stop Zliczanie cykli start/stop wrzeciona. Wrzeciono włącza się, a zatem liczba jest zwiększana, zarówno gdy dysk twardy jest włączony po wcześniejszym całkowitym wyłączeniu (odłączony od źródła zasilania), jak i gdy dysk twardy powraca z poprzedniego trybu uśpienia.
05
0x05
Liczba przeniesionych sektorów
Niski
Niżej

Krytyczny
Liczba realokowanych sektorów. Surowa wartość reprezentuje liczbę uszkodzonych sektorów , które zostały znalezione i zmapowane. Dlatego im wyższa wartość atrybutu, tym więcej sektorów dysk musiał ponownie przydzielić. Ta wartość jest używana przede wszystkim jako miara oczekiwanej długości życia dysku; dysk, który w ogóle miał jakiekolwiek realokacje, jest znacznie bardziej podatny na awarię w najbliższych miesiącach.
06
0x06
Przeczytaj margines kanału Margines kanału podczas odczytu danych. Funkcja tego atrybutu nie jest określona.
07
0x07
Szukaj współczynnika błędów Różne (Wartość surowa specyficzna dla dostawcy.) Szybkość wyszukiwania błędów głowic magnetycznych. Jeśli wystąpi częściowa awaria mechanicznego systemu pozycjonowania, pojawią się błędy wyszukiwania. Taka awaria może być spowodowana wieloma czynnikami, takimi jak uszkodzenie serwomechanizmu lub rozszerzenie termiczne dysku twardego. Surowa wartość ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy.
08
0x08
Poszukuj wydajności czasu
Wyższy
Wysoka
Średnia wydajność operacji wyszukiwania głowic magnetycznych. Jeśli ten atrybut maleje, jest to oznaka problemów w podsystemie mechanicznym.
09
0x09
Godziny włączenia Liczba godzin w stanie włączonym. Surowa wartość tego atrybutu pokazuje całkowitą liczbę godzin (lub minut lub sekund, w zależności od producenta) w stanie włączonym.

„Domyślnie, całkowity oczekiwany czas życia dysku twardego w idealnym stanie jest definiowany jako 5 lat (działający codziennie i w nocy przez wszystkie dni). Odpowiada to 1825 dniom w trybie 24/7 lub 43800 godzinom”.

Na niektórych dyskach sprzed 2005 r. ta wartość surowa może rosnąć nieregularnie i/lub „zawijać” (okresowo resetować do zera).

10
0x0A
Liczba ponownych prób kręcenia
Niski
Niżej

Krytyczny
Liczba ponownych prób rozpoczęcia spinu. Atrybut ten przechowuje całkowitą liczbę prób rozpoczęcia spinu w celu osiągnięcia pełnej prędkości operacyjnej (pod warunkiem, że pierwsza próba zakończyła się niepowodzeniem). Wzrost wartości tego atrybutu jest oznaką problemów w podsystemie mechanicznym dysku twardego.
11
0x0B
Próby ponownej kalibracji lub liczba prób kalibracji
Niski
Niżej
Atrybut ten wskazuje liczbę żądań ponownej kalibracji (pod warunkiem, że pierwsza próba zakończyła się niepowodzeniem). Wzrost wartości tego atrybutu jest oznaką problemów w podsystemie mechanicznym dysku twardego.
12
0x0C
Liczba cykli zasilania Ten atrybut wskazuje liczbę pełnych cykli włączania/wyłączania dysku twardego.
13
0x0D
Wskaźnik błędów miękkiego odczytu
Niski
Niżej
Niepoprawione błędy odczytu zgłoszone do systemu operacyjnego.
22
0x16
Aktualny poziom helu
Wyższy
Wysoka
Specyficzne dla napędów He8 firmy HGST. Ta wartość mierzy hel wewnątrz napędu specyficznego dla tego producenta. Jest to atrybut przed awarią, który uruchamia się, gdy dysk wykryje, że środowisko wewnętrzne jest niezgodne ze specyfikacją.
170
0xAA
Dostępne zarezerwowane miejsce Zobacz atrybut E8.
171
0xAB
Liczba błędów programu SSD (Kingston) Łączna liczba niepowodzeń działania programu flash od czasu wdrożenia dysku. Identyczny z atrybutem 181.
172
0xAC
Liczba niepowodzeń kasowania dysku SSD (Kingston) Zlicza liczbę niepowodzeń wymazywania pamięci flash. Ten atrybut zwraca całkowitą liczbę niepowodzeń operacji wymazywania pamięci Flash od czasu wdrożenia dysku. Ten atrybut jest identyczny z atrybutem 182.
173
0xAD
Liczba wyrównywania zużycia dysków SSD Oblicza maksymalną liczbę najgorszych wymazań w dowolnym bloku.
174
0xAE
Nieoczekiwana liczba strat mocy Znany również jako „Licznik wycofań po wyłączeniu” zgodnie z konwencjonalną terminologią dotyczącą dysków twardych. Wartość surowa podaje liczbę nieczystych zamknięć, skumulowaną w całym okresie eksploatacji dysku SSD, gdzie „nieczyste zamknięcie” to odłączenie zasilania bez STANDBY IMMEDIATE jako ostatniego polecenia (niezależnie od aktywności PLI wykorzystującej moc kondensatora). Znormalizowana wartość to zawsze 100.
175
0xAF
Awaria ochrony przed utratą zasilania Ostatni wynik testu w mikrosekundach do rozładowania nasadki, nasycony do maksymalnej wartości. Rejestruje również minuty od ostatniego testu i liczbę testów w okresie istnienia. Wartość surowa zawiera następujące dane:
  • Bajty 0-1: ostatni wynik testu w mikrosekundach do rozładowania limitu, nasycenie przy maksymalnej wartości. Wynik testu oczekiwany w zakresie 25 <= wynik <= 5000000, niższy oznacza określony kod błędu.
  • Bajty 2-3: minuty od ostatniego testu, nasycenie przy maksymalnej wartości.
  • Bajty 4-5: Żywotna liczba testów, nie zwiększana w cyklu zasilania, nasyca się przy maksymalnej wartości.

Znormalizowana wartość jest ustawiana na jeden w przypadku niepowodzenia testu lub 11, jeśli kondensator był testowany w warunkach nadmiernej temperatury, w przeciwnym razie 100.

176
0xB0
Licznik niepowodzeń kasowania Parametr SMART wskazuje na liczbę niepowodzeń poleceń kasowania błysku.
177
0xB1
Różnica zakresu zużycia Różnica między najbardziej i najrzadziej używanymi blokami Flash. Opisuje, jak dobrze / źle działa wyrównywanie zużycia dysku SSD w bardziej techniczny sposób.
178
0xB2
Używana zarezerwowana liczba bloków Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung.
179
0xB3
Używana zarezerwowana całkowita liczba bloków Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung.
180
0xB4
Całkowita liczba niewykorzystanych zarezerwowanych bloków Atrybut „Pre-Fail” używany przynajmniej w urządzeniach HP.
181
0xB5
Całkowita liczba niepowodzeń programu lub liczba dopasowanych dostępów innych niż 4K
Niski
Niżej
Całkowita liczba niepowodzeń działania programu Flash od czasu wdrożenia dysku.
Liczba dostępów do danych użytkownika (zarówno odczyty, jak i zapisy), w których LBA nie są wyrównane 4 KiB (LBA % 8 != 0) lub gdy rozmiar nie jest modułem 4 KiB (liczba bloków != 8), przy założeniu logicznego rozmiaru bloku (LBS) = 512 B.
182
0xB6
Licznik niepowodzeń kasowania Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung.
183
0xB7
Liczba błędów redukcji biegów SATA lub nieprawidłowy blok w czasie wykonywania
Niski
Niżej
Atrybut Western Digital, Samsung lub Seagate: albo liczba redukcji szybkości łącza (np. z 6Gbit/s do 3Gbit/s) albo całkowita liczba bloków danych z wykrytymi, niemożliwymi do naprawienia błędami napotkanymi podczas normalnej pracy. Chociaż degradacja tego parametru może być wskaźnikiem starzenia się napędu i/lub potencjalnych problemów elektromechanicznych, nie wskazuje bezpośrednio na zbliżającą się awarię napędu.
184
0xB8
Błąd kompleksowy / IOEDC
Niski
Niżej

Krytyczny
Ten atrybut jest częścią technologii SMART IV firmy Hewlett-Packard , a także częścią schematów wykrywania i korekcji błędów we/wy innych dostawców i zawiera liczbę błędów parzystości, które występują w ścieżce danych do nośnika za pośrednictwem pamięć podręczna pamięci RAM.
185
0xB9
Stabilność głowy Atrybut Western Digital.
186
0xBA
Wykrywanie wibracji indukowanych Op Atrybut Western Digital.
187
0xBB
Zgłoszone błędy nie do naprawienia
Niski
Niżej

Krytyczny
Liczba błędów, których nie można było naprawić za pomocą sprzętowego ECC (patrz atrybut 195).
188
0xBC
Limit czasu polecenia
Niski
Niżej

Krytyczny
Liczba operacji przerwanych z powodu przekroczenia limitu czasu HDD. Normalnie ta wartość atrybutu powinna być równa zero.
189
0xBD
High Fly pisze
Niski
Niżej
Producenci dysków twardych wdrażają czujnik wysokości lotu , który stara się zapewnić dodatkowe zabezpieczenia operacji zapisu, wykrywając, kiedy głowica zapisująca znajduje się poza swoim normalnym zakresem roboczym. W przypadku napotkania niebezpiecznego warunku wysokości lotu, proces zapisu jest zatrzymywany, a informacje są ponownie zapisywane lub przenoszone do bezpiecznego regionu dysku twardego. Ten atrybut wskazuje liczbę tych błędów wykrytych w okresie eksploatacji dysku.

Ta funkcja jest zaimplementowana w większości nowoczesnych dysków Seagate i niektórych dysków Western Digital, począwszy od dysków twardych WD Enterprise WDE18300 i WDE9180 Ultra2 SCSI, i będzie dostępna we wszystkich przyszłych produktach WD Enterprise.

190
0xBE
Różnica temperatur lub temperatura przepływu powietrza Różne Wartość jest równa (100-temp. °C), pozwalając producentowi na ustawienie minimalnego progu, który odpowiada maksymalnej temperaturze. Jest to również zgodne z konwencją, w której 100 jest najlepszym przypadkiem, a niższe wartości są niepożądane. Jednak niektóre starsze dyski mogą zamiast tego zgłaszać surową Temperaturę (identyczną z 0xC2) lub Temperaturę minus 50 tutaj.
191
0xBF
Wskaźnik błędów G-sense
Niski
Niżej
Liczba błędów wynikających z zewnętrznych wstrząsów i wibracji.
192
0xC0
Power-off Retract hrabiego , awaryjne Retract Cykl Hrabia (Fujitsu) lub niebezpieczne Shutdown Hrabia
Niski
Niżej
Liczba cykli wyłączania lub wycofywania awaryjnego.
193
0xC1
Liczba cykli ładowania lub Liczba cykli ładowania/rozładowywania (Fujitsu)
Niski
Niżej
Liczba cykli załadunku/rozładunku do pozycji strefy lądowania czołowego. Niektóre dyski używają zamiast tego 225 (0xE1) do licznika cykli obciążenia.

Western Digital ocenia swoje dyski VelociRaptor na 600 000 cykli ładowania/rozładowywania, a dyski WD Green na 300 000 cykli; te ostatnie są przeznaczone do częstego rozładowywania głowic w celu oszczędzania energii. Z drugiej strony, WD3000GLFS (dysk do komputerów stacjonarnych) jest przeznaczony tylko do 50 000 cykli ładowania/rozładowywania.

Niektóre dyski do laptopów i dyski do komputerów stacjonarnych „zielonej energii” są zaprogramowane tak, aby rozładowywały głowice, gdy przez krótki czas nie było żadnej aktywności, w celu oszczędzania energii. Systemy operacyjne często uzyskują dostęp do systemu plików kilka razy na minutę w tle, powodując 100 lub więcej cykli ładowania na godzinę, jeśli głowice są rozładowywane: ocena cyklu ładowania może zostać przekroczona w mniej niż rok. Istnieją programy dla większości systemów operacyjnych, które wyłączają funkcje zaawansowanego zarządzania energią (APM) i automatycznego zarządzania akustycznego (AAM), powodując częste cykle ładowania.

194
0xC2
Temperatura lub temperatura Celsjusza
Niski
Niżej
Wskazuje temperaturę urządzenia, jeśli jest zamontowany odpowiedni czujnik. Najniższy bajt nieprzetworzonej wartości zawiera dokładną wartość temperatury (stopnie Celsjusza).
195
0xC3
Odzyskano ECC sprzętu Różne (Wartość surowa specyficzna dla dostawcy.) Wartość surowa ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy.
196
0xC4
Liczba zdarzeń realokacji
Niski
Niżej

Krytyczny
Liczba operacji remapowania. Nieprzetworzona wartość tego atrybutu pokazuje całkowitą liczbę prób przesłania danych z ponownie przydzielonych sektorów do wolnego obszaru. Liczone są zarówno udane, jak i nieudane próby.
197
0xC5
Aktualna liczba oczekujących sektorów
Niski
Niżej

Krytyczny
Liczba sektorów „niestabilnych” (oczekujących na ponowne odwzorowanie z powodu nieodwracalnych błędów odczytu). Jeśli niestabilny sektor zostanie następnie pomyślnie odczytany, sektor jest ponownie mapowany, a wartość ta jest zmniejszana. Błędy odczytu w sektorze nie spowodują natychmiastowego przemapowania sektora (ponieważ poprawna wartość nie może być odczytana, a więc wartość do przemapowania nie jest znana, a także może stać się czytelna później); zamiast tego oprogramowanie układowe dysku pamięta, że ​​sektor musi zostać ponownie zmapowany, i zmapuje go przy następnym zapisie.

Jednak niektóre dyski nie będą od razu remapować takich sektorów po zapisaniu; zamiast tego dysk najpierw spróbuje zapisać w problematycznym sektorze, a jeśli operacja zapisu się powiedzie, sektor zostanie oznaczony jako dobry (w tym przypadku „Liczba zdarzeń realokacji” (0xC4) nie zostanie zwiększona). Jest to poważna wada, ponieważ jeśli taki dysk zawiera marginalne sektory, które konsekwentnie zawodzą dopiero po pewnym czasie od pomyślnej operacji zapisu, dysk nigdy nie zmieni mapowania tych problematycznych sektorów.

198
0xC6
(Offline) Liczba sektorów, których nie można naprawić
Niski
Niżej

Krytyczny
Całkowita liczba niepoprawnych błędów podczas odczytu/zapisu sektora. Wzrost wartości tego atrybutu wskazuje na wady powierzchni dysku i/lub problemy w podsystemie mechanicznym.
199
0xC7
Liczba błędów UltraDMA CRC
Niski
Niżej
Liczba błędów w przesyłaniu danych przez kabel interfejsu określona przez ICRC (Interface Cyclic Redundancy Check).
200
0xC8
Częstość błędów w wielu strefach
Niski
Niżej
Liczba błędów znalezionych podczas zapisywania sektora. Im wyższa wartość, tym gorszy stan mechaniczny dysku.
200
0xC8
Współczynnik błędów zapisu (Fujitsu)
Niski
Niżej
Całkowita liczba błędów podczas zapisywania sektora.
201
0xC9
Wykryto wskaźnik błędów miękkiego odczytu lub
licznik TA
Niski
Niżej

Krytyczny
Liczba wskazuje liczbę niepoprawnych błędów odczytu oprogramowania.
202
0xCA
Błędy oznaczenia adresu danych lub
zwiększenie licznika TA
Niski
Niżej
Liczba błędów znacznika adresu danych (lub specyficznych dla dostawcy).
203
0xCB
Zabrakło Anuluj
Niski
Niżej
Liczba błędów spowodowanych nieprawidłową sumą kontrolną podczas korekcji błędów.
204
0xCC
Miękka korekcja ECC
Niski
Niżej
Liczba błędów skorygowanych przez wewnętrzne oprogramowanie do korekcji błędów.
205
0xCD
Współczynnik chropowatości termicznej
Niski
Niżej
Liczba błędów spowodowanych wysoką temperaturą.
206
0xCE
Latająca wysokość Wysokość głowic nad powierzchnią dysku. Jeśli jest zbyt nisko, bardziej prawdopodobny jest wypadek głowy; jeśli jest zbyt wysoki, bardziej prawdopodobne są błędy odczytu/zapisu.
207
0xCF
Wiruj wysoki prąd
Niski
Niżej
Wielkość prądu udarowego użytego do rozkręcenia napędu.
208
0xD0
Zakręć Buzz Liczba brzęczących procedur potrzebnych do rozkręcenia dysku z powodu niewystarczającej mocy.
209
0xD1
Szukaj wyników offline Dysk szuka wydajności podczas testów wewnętrznych.
210
0xD2
Wibracje podczas zapisu Znajduje się na dyskach Maxtor 6B200M0 200 GB i Maxtor 2R015H1 15 GB.
211
0xD3
Wibracje podczas zapisu Nagranie drgań napotkanych podczas operacji zapisu.
212
0xD4
Szok podczas zapisu Nagranie wstrząsu napotkanego podczas operacji zapisu.
220
0xDC
Przesunięcie dysku
Niski
Niżej
Odległość, o którą przesunęła się tarcza względem wrzeciona (zwykle z powodu wstrząsu lub temperatury). Jednostka miary jest nieznana.
221
0xDD
Wskaźnik błędów G-Sense
Niski
Niżej
Liczba błędów wynikających z zewnętrznych wstrząsów i wibracji. Bardziej typowo zgłaszane na 0xBF.
222
0xDE
Załadowane godziny Czas spędzony na pracy pod obciążeniem danych (ruch magnetycznej zwory głowicy).
223
0xDF
Liczba ponownych prób załadowania/rozładowania Zliczanie zmian pozycji głowy.
224
0xE0
Tarcie obciążenia
Niski
Niżej
Opór spowodowany tarciem w częściach mechanicznych podczas pracy.
225
0xE1
Liczba cykli ładowania/rozładowywania
Niski
Niżej
Całkowita liczba cykli obciążenia Niektóre dyski używają zamiast tego liczby 193 (0xC1) do liczby cykli obciążenia. Zobacz opis 193, aby poznać znaczenie tej liczby.
226
0xE2
Wczytaj „w czasie” Całkowity czas ładowania siłownika głowic magnetycznych (czas nie spędzony na parkingu).
227
0xE3
Liczba wzmocnienia momentu obrotowego
Niski
Niżej
Liczba prób kompensacji wahań prędkości talerza.
228
0xE4
Cykl wycofania przy wyłączonym zasilaniu
Niski
Niżej
Liczba cykli wyłączania, które są liczone, gdy występuje „zdarzenie cofania” i głowice są ładowane z nośnika, na przykład gdy urządzenie jest wyłączone, uśpione lub bezczynne.
230
0xE6
Amplituda głowicy GMR (dyski magnetyczne), stan ochrony dysku (SSD) Amplituda „miotania” (powtarzalne ruchy głowy pomiędzy operacjami).

W przypadku dysków półprzewodnikowych wskazuje, czy trajektoria użytkowania przekracza oczekiwaną krzywą żywotności

231
0xE7
Pozostała żywotność (dyski SSD) lub temperatura Wskazuje przybliżony pozostały czas eksploatacji dysku SSD pod względem cykli programu/kasowania lub dostępnych zarezerwowanych bloków. Znormalizowana wartość 100 oznacza nowy dysk, a wartość progowa 10 oznacza konieczność wymiany. Wartość 0 może oznaczać, że dysk działa w trybie tylko do odczytu, aby umożliwić odzyskanie danych.

Wcześniej (przed 2010 r.) sporadycznie używany do pomiaru temperatury przemiennika (częściej zgłaszany przy 0xC2).

232
0xE8
Pozostała wytrzymałość lub dostępna zarezerwowana przestrzeń Liczba fizycznych cykli wymazywania wykonanych na dysku SSD wyrażona jako procent maksymalnej liczby fizycznych cykli wymazywania, jakie ma wytrzymać dysk.

Dyski Intel SSD zgłaszają dostępne zarezerwowane miejsce jako procent początkowej zarezerwowanej przestrzeni.

233
0xE9
Wskaźnik zużycia nośnika (SSD) lub godziny włączenia Dyski Intel SSD zgłaszają znormalizowaną wartość od 100, nowy dysk, do minimum 1. Zmniejsza się, podczas gdy cykle kasowania NAND wzrastają od 0 do maksymalnych cykli.

Wcześniej (przed 2010 r.) sporadycznie używany do godzin włączenia zasilania (częściej zgłaszany w 0x09).

234
0xEA
Średnia liczba kasowań ORAZ maksymalna liczba kasowanych Dekodowany jako: bajt 0-1-2 = średnia liczba kasowań (big endian) i bajt 3-4-5 = maksymalna ilość kasowań (big endian).
235
0xEB
Dobra liczba bloków ORAZ systemowa (bezpłatna) liczba bloków Dekodowany jako: bajt 0-1-2 = dobra liczba bloków (big endian) i bajt 3-4 = systemowa (wolna) liczba bloków.
240
0xF0
Godziny lotu głową lub „ Współczynnik błędów transferu” (Fujitsu) Czas spędzony podczas pozycjonowania głowic napędowych. Niektóre dyski Fujitsu zgłaszają liczbę resetów łącza podczas przesyłania danych.
241
0xF1
Całkowita liczba napisanych LBA Całkowita liczba napisanych LBA.
242
0xF2
Łączny odczyt LBA Całkowita liczba odczytanych LBA.
Niektóre narzędzia SMART zgłaszają liczbę ujemną dla surowej wartości, ponieważ w rzeczywistości ma ona 48 bitów zamiast 32.
243
0xF3
Łączna liczba napisanych LBA po rozwinięciu Górne 5 bajtów z 12-bajtowej łącznej liczby LBA zapisanych w urządzeniu. Mniejsza wartość 7 bajtów znajduje się w atrybucie 0xF1.
244
0xF4
Łączna liczba rozszerzonych odczytów LBA Górne 5 bajtów z 12-bajtowej łącznej liczby LBA odczytanych z urządzenia. Mniejsza wartość 7 bajtów znajduje się w atrybucie 0xF2.
249
0xF9
Zapisy NAND (1GiB) Całkowita liczba zapisów NAND. Wartość surowa podaje liczbę zapisów do NAND w przyrostach o 1 GB.
250
0xFA
Częstotliwość ponownych prób odczytu
Niski
Niżej
Liczba błędów podczas odczytu z dysku.
251
0xFB
Pozostała minimalna ilość części zamiennych Atrybut Minimum Spares Remaining wskazuje liczbę pozostałych zapasowych bloków jako procent całkowitej liczby dostępnych zapasowych bloków.
252
0xFC
Nowo dodany zły blok Flash Atrybut „Newly Added Bad Flash Block” wskazuje całkowitą liczbę uszkodzonych bloków pamięci flash wykrytych przez dysk od momentu jego pierwszej inicjalizacji w produkcji.
254
0xFE
Ochrona przed upadkiem
Niski
Niżej
Liczba wykrytych „zdarzeń swobodnego spadania”.

Próg przekracza warunek

Threshold Exceeds Condition (TEC) to szacowana data, w której krytyczny atrybut statystyki dysku osiągnie swoją wartość progową. Gdy oprogramowanie Drive Health zgłasza „Najbliższy TEC”, należy to traktować jako „Datę awarii”. Czasami nie podaje się daty i można oczekiwać, że dysk będzie działał bezbłędnie.

Aby przewidzieć datę, dysk śledzi tempo zmian atrybutu. Należy zauważyć, że daty TEC są tylko szacunkowe; Dyski twarde mogą i zawodzą znacznie wcześniej lub znacznie później niż data TEC.

Autotesty

Dyski SMART mogą oferować szereg autotestów:

Niski
Sprawdza wydajność elektryczną i mechaniczną, a także wydajność odczytu dysku. Testy elektryczne mogą obejmować test pamięci RAM bufora, test obwodów odczytu/zapisu lub test elementów głowicy odczytu/zapisu. Test mechaniczny obejmuje wyszukiwanie i serwo na ścieżkach danych. Skanuje małe części powierzchni dysku (obszar zależy od dostawcy, a test jest ograniczony czasowo). Sprawdza listę oczekujących sektorów, które mogą zawierać błędy odczytu i zwykle zajmuje to mniej niż dwie minuty.
Długie/przedłużone
Dłuższa i bardziej dokładna wersja krótkiego autotestu, skanująca całą powierzchnię dysku bez ograniczeń czasowych. Ten test trwa zwykle kilka godzin, w zależności od szybkości odczytu/zapisu dysku i jego rozmiaru.
Przewóz
Przeznaczony do szybkiego testu identyfikującego uszkodzenia powstałe podczas transportu urządzenia od producenta napędu do producenta komputera. Dostępne tylko na dyskach ATA i zwykle zajmuje kilka minut.
Selektywny
Niektóre napędy umożliwiają selektywne autotesty tylko części powierzchni.

Dzienniki autotestu dla dysków SCSI i ATA są nieco inne. Możliwe jest, że test długi przejdzie, nawet jeśli test krótki zakończy się niepowodzeniem.

Dziennik autotestu dysku może zawierać do 21 wpisów tylko do odczytu. Po zapełnieniu dziennika stare wpisy są usuwane.

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki