Lär dig vad ett SMART-test är och när du ska göra det på en NAS-server

Hårddiskar och solid-state-enheter är en väsentlig del av en NAS-server. På hårddisken kommer vi att lagra informationen, normalt redundant med olika nivåer av RAID såsom RAID 1, RAID 5 som är en av de mest använda, och även RAID 6 och till och med RAID 10. Dessutom kommer vi också att använda SSD:n som SSD-cache för att påskynda läsning och skrivning av extremt slumpmässiga data, både från nätverket till NAS:en (skrivcache), såväl som från NAS:en till den anslutna utrustningen (läscachen), kommer naturligtvis dessa SSD:er också att konfigureras med olika RAID-nivåer för att skydda informationsintegriteten i händelse av fysiskt fel på en eller flera SSD:er. Lagringspooler skulle dock också kunna konfigureras med endast SSD, med syftet att lagra information som vi har nästan kontinuerlig tillgång till här. Om du till exempel använder virtuella maskiner på din NAS-server,
Med tiden är mekaniska hårddiskar och SSD:er benägna att misslyckas, om vi inte är försiktiga kan vi bli rädda och tappa en eller flera hårddiskar på kort tid. Av denna anledning finns det SMART-tester som gör att vi kan få mycket värdefull information om diskarnas tillstånd, och vi kommer att kunna ersätta dem innan de misslyckas.
Det är inte exklusivt för NAS-servrar, en PC eller bärbar dator kan också dra nytta av det. All utrustning som innehåller en hårddisk eller SSD kan vi utföra ett SMART-test för att kontrollera diskens tillstånd, om det finns en skadad sektor där vi inte kan skriva, eller om det finns en annan typ av problem, för att förutse en hårdvarufel på själva disken.
Vad är SMART och varför är det så viktigt?
De teknologi SMART betyder att Självövervakningsanalys och rapporteringsteknik eller översatt som ” Självövervakningsanalys och rapporteringsteknik “. Syftet med SMART-tekniken är att kontrollera hårddiskar och SSD:er för att upptäcka eventuella fel före dessa, för att förutse ett eventuellt hårdvarufel och att byta ut disken innan man förlorar oåterställbar data.
Tidig upptäckt av diskfel kan tillåta användaren att göra en säkerhetskopia av dess innehåll, eller ersätta disken med en annan om vi har en NAS-server med en RAID-nivå som tillåter det utan att förlora data. På så sätt undviker vi oåterkallelig dataförlust. Man bör komma ihåg att en RAID inte är en säkerhetskopia, du måste göra säkerhetskopior enligt 3-2-1-systemet, göra 3 säkerhetskopior, på 2 olika media, och att 1 kopia är offline.
Om vi vill använda denna SMART-teknik måste två villkor vara uppfyllda:
- Om datorns BIOS/UEFI har detta alternativ aktiverat.
- Att operativsystemet stöder denna funktion (för närvarande stöder alla operativsystem det).
- Själva hårddisken eller SSD:n är kompatibel med den.
För närvarande är det här alternativet aktiverat som standard på datorer och som regel stöder hårddiskar det också. Bland de viktigaste parametrarna som den kontrollerar har vi:
- Diskens temperatur.
- Dataläshastighet.
- Omfördelad sektorräknare: det här är de som har misslyckats, och beroende på antalet kan detta vara ett symptom på att enheten kan krascha när som helst.
- Error Correction Code (ECC) användning och felräkning.
När det gäller värdena för SMART-attribut sträcker de sig från siffran 1 till 253, där 1 skulle vara det sämsta värdet. I denna mening är normala värden mellan 100 och 200. Genom att utföra SMART-tester på våra hårddiskar och SSD:er kan vi därför få mycket information om deras hälsa.
Hur man visar diskhälsostatus i Windows
Innan vi dyker in i hur du ser SMART-status på QNAP NAS-server, kommer vi att lära dig hur du ser diskhälsa med Windows OS, du kan också kontrollera det om du använder Windows-server. Den ger oss viktig information och tack vare den kan vi vidta lämpliga åtgärder:
- Gör ingenting om skicket är bra.
- Gör en säkerhetskopia och byt ut hårddisken om skicket är dåligt.
För att utföra denna uppgift behöver vi programvara som visar oss information om statusen på våra diskar. I det här fallet kommer vi att börja använda Crystal Disk Info som du kan ladda ner här . Vi valde den vanliga ZIP-utgåvan som inte kräver installation. Om vi har en hårddisk i gott skick kommer den att visa oss denna information:
Det betyder att just denna hårddisk fungerar bra och inte kräver någon speciell uppmärksamhet. Hälsotillståndet är bra och är i blått. Men när dessa resultat visas börjar problemen:
När tillståndet är “i riskzonen” bör vi börja oroa oss, det är dags att börja fundera på att göra en säkerhetskopia av all data och fortsätta med att byta hårddisk. När den är röd är situationen vanligtvis kritisk och du kanske inte kan undvika dataförlust.
Hur man utför ett SMART-test på min NAS-server
I vårt testlabb har vi en QNAP TS-1277 NAS-server, som har totalt 8 x 3,5” enhetsfack, 4 x 2,5” enhet eller SSD-fack och två M.2 SATA3-platser. För att se tillståndet för diskarna måste vi gå till » Lagring och ögonblicksbilder “, och på vänster sida kommer vi att gå in” Lagring / Diskar / VJBOD “. Väl här kommer vi att välja disken och klicka på ” diskstatus följande kommer att visas:
I “Disk Status” kan vi se HDD- eller SSD-modellen, kapacitet, temperatur, starttid och annan information. Den viktiga informationen finns i avsnittet “SMART Information”, där vi kan se var och en av parametrarna som denna viktiga funktion kan mäta. QNAP tillåter oss att utföra ett snabbtest eller ett fullständigt test när som helst, gå bara till avsnittet “Test” och välj ett av de två alternativen.
Det mest intressanta är i avsnittet “Konfiguration”, och det är här vi kan konfigurera högtemperaturvarningen, och vi kan också schemalägga de snabba och kompletta SMART-testerna när vi vill. Detta är viktigt för att utföra ett SMART-test proaktivt, för att förutse eventuella fel på en hårddisk eller SSD.
När det gäller SSD:er kommer vi också att ha SMART-information, dessutom kan vi se en uppskattning av livslängden för SSD:n, och naturligtvis kan vi se temperaturen, avancerade SMART-parametrar, utföra ett snabbt och komplett test vid behov, och schemalägg till och med SMART-tester så att de körs automatiskt.
I avsnittet “Globala inställningar” kan vi ha andra mycket intressanta alternativ relaterade till SMART. Den första är att vi kan aktivera en SMART prediktiv migrering för att migrera all data innan en av diskarna misslyckas, och vi kan ha dataförlust, detta kan göras på hårddiskar och SSD:er. Tack vare denna funktion kommer operativsystemet automatiskt att förutse ett eventuellt diskfel innan det inträffar.
Ett annat alternativ är SMART polling tid, för att polla disken då och då efter SMART-fel. En viktig punkt är att kontroll för ofta kan försämra diskarnas prestanda något, så det skulle vara tillrådligt att göra det varje timme eftersom det är det högsta tillåtna av QNAP.
Om vi använder ett operativsystem som XigmaNAS som är specifikt orienterat mot NAS-servrar, kommer vi också att ha mycket SMART information att visualisera och fatta beslut. Om vi klickar på ” Diagnostik / Information / SMART » vi kan se det aktuella SMART-tillståndet för alla diskar vi har, dessutom kommer det med varje attribut att markera ett visst värde, och även en beskrivning av vad vart och ett av dessa attribut betyder.
Längst ner kan vi se inspelningen av de olika utförda SMART-tester, både korta (snabb) och utökade (fullständiga), i följande skärmdump kan du se hur det är ett läsfel, blocklogiken påverkad (LBA) och även liv på hårddisken.
Om vi tittar på statusen för en annan av diskarna kan vi se hur samma test slutfördes utan fel, drifttiden är betydligt lägre och vi har inga LBA-fel. Det vill säga att den tidigare disken är lite “påverkad” och den bör bytas ut så snart som möjligt, dock är denna felfria disk helt okej.
Självklart kan XigmaNAS operativsystem SMART också konfigureras för att utföra dessa tester på begäran eller schemalagda när så önskas.
Hur ofta ska du göra ett SMART-test
Det är mycket viktigt att programmera operativsystemet på NAS-servern för att periodvis utföra snabba SMART-tester, samt att programmera kompletta SMART-tester på de olika diskarna som vi har på servern. När vi kör SMART-tester på en NAS måste vi ta en rad överväganden:
- Vi rekommenderar att du inte gör säkerhetskopior just nu.
- Försök att lämna servern med liten eller ingen arbetsbelastning.
Ett snabbt SMART-test kan ta mindre än 2 minuter att utföra, under denna tid kan läs- och skrivprestandan för diskar där vi gör det påverkas. I fallet med fullständiga SMART-tester kan de ta timmar att utföra, därför är det tillrådligt att utföra denna uppgift i gryningen när det normalt inte kommer att vara för mycket aktivitet, men kom ihåg att inte utföra säkerhetskopior just nu eftersom prestandan blir lägre .
Beroende på användningen av NAS-servern, och om den alltid är på eller inte, kommer det att vara tillrådligt att schemalägga SMART-testerna mer utspridda i tid eller mer regelbundet. Till exempel kan ett snabbt SMART-test en gång i veckan vara en bra början, eftersom vi kommer att fånga stora fel som kan finnas i enheten. Ett fullständigt SMART-test bör utföras en gång i månaden, helst tidigt på morgonen eller på helger när ingen arbetar med NAS:en. Eftersom vi kan programmera den att köras automatiskt behöver vi inte vara närvarande medan den körs, utan vi måste vara uppmärksamma när den är klar i händelse av ett fel.