Zachraňujeme disky

Záchrana dat si cestu do naučných slovníků zřejmě teprve najde, ale v denní praxi správců i uživatelů se již pevně zabydlela.

Techniky a metody záchrany dat se totiž používají nejen v případech skutečné ztráty, na kterou je náš seriál zaměřen, ale rovněž při řešení případů zapomenutých přístupových hesel, havárií atypických řadičů, které se již nedají koupit, selhání mechaniky pro neobvyklé médium apod. Ve třech dílech seriálu se podíváme na závady pevných disků, diskových polí a nakonec na jiná zajímavá média.

Disky odcházejí

Obrázek ukazuje aktuální rozdělení různých typů ztráty dat podle příčiny, která k ní vedla. Rozdělení odpovídá počtu jednotlivých zakázek a pochází z celosvětové interní dokumentace společnosti Ontrack. Jednou zakázkou se rozumí jeden přijatý pevný disk, a to i v případě, že záchranu dat nebylo možné provést ani částečně (cca 7-10 %) nebo ji zákazník odmítl z důvodu nalezení použitelné zálohy nebo ceny práce, která neodpovídala hodnotě dat. Poruchy pevných disků stále tvoří nadpoloviční většinu zakázek, což je zčásti způsobeno jejich masovým rozšířením i do oblastí, kde nemají po celý rok zajištěny předepsané provozní podmínky (teplo, vlhko, prach, cigaretový kouř, otřesy) a z části tím, že mechanické díly prostě podléhají opotřebení. U pevných disků je podobně jako u letadel nejrizikovějším okamžikem start nebo přistání hlaviček, které se před dosažením jmenovitých otáček dotýkají média. Proto například vypínání disků z důvodu úspory energie nemusí být tak výhodné, jak by se na první pohled zdálo.

Ztráty dat

Selhání pevných disků lze klasifikovat podle povahy nebo podle příčiny na 7 různých typů. V následujících odstavcích jsou řazeny podle četnosti výskytu - tentokrát je rozdělení provedeno podle tuzemské statistiky, ale konzultace s kolegy z jiných laboratoří ukazují, že rozdíly mezi jednotlivými zeměmi jsou v řádu jednotek procent.

Poškozená elektronika

(střední obtížnost záchrany)

K poškození elektroniky disku dochází nejčastěji poruchou napájecího zdroje, případně jeho průrazem například při výskytu atmosférického přepětí. Ve většině případů je vadná i elektronika uvnitř disku, integrovaná na svazku hlav. Takto poškozený disk po připojení napájení většinou vůbec nepracuje, nebo se silně hřeje, zapáchá po spálenině a někdy jsou vidět i roztržené integrované obvody na jeho elektronice. Průvodním jevem může být, že se disk roztočí a pouze cvaká hlavami o mechanické dorazy. V některých případech zablokuje (přetíží) nebo zničí i dobrý zdroj. Pevné disky mají typicky dvě elektroniky – viditelnou elektroniku s napájecím a datovým konektorem podle typu disku a vnitřní elektroniku, která je obvykle integrovaná přímo na svazku hlav, a to jak z důvodu rychlosti přenosu dat a z toho plynoucích problémů s rušením, tak z důvodu datových vodičů, neboť tato elektronika pracuje vždy jen s jednou, adresovanou hlavou. Zajímavé je, že na rozdíl od dřívějších dob jsou konstrukce IDE a SCSI disků totožné, liší se pouze elektronikou. Pro IDE elektroniku nadále platí že je schopna vykonávat pouze jednu operaci v témže čase, SCSI elektronika může vykonávat více operací v témže čase a rovněž formát povelů je efektivnější.

Záchrana dat obvykle vyžaduje výměnu obou elektronik. Prostá výměna vnější elektroniky vyžaduje pouze nástroje TORX a totožnou náhradní elektroniku, což znamená nejen stejný layout ale i stejnou verzi firmware. Výměna obvodu s firmware disku, kterou provádíme, se bez profesionálních nástrojů neobejde, jde o odpájení a připájení obvodu v SMD montáži s mnoha vývody. Výměna vnitřní elektroniky je zejména kvůli riziku poškození hlaviček nebo povrchů velmi obtížná. Nejsou zde žádné rozdíly ve stylu firmware vnější elektroniky a někdy je výhodnější vyměnit celý svazek hlaviček.

Ochrana před tímto typem závady je UPS s přepěťovou ochranou a kvalitní zdroj s dostatečným výkonem a ideálně PFC řízením.

Poškozené povrchy disků

(vysoká obtížnost záchrany)

Poškození povrchu disku hlavičkami se projevuje nejčastěji cvakáním disku, nebo jeho nečitelností. Závada zpočátku vede ke vzniku vadných sektorů, které rychle přibývají. V tuto chvíli je obtížné určit, zda jde o nečitelnost způsobenou poškozením povrchu nebo logické poškození struktury dat. Takto poškozený disk je BIOSem detekován, ale dále se s ním částečně nebo úplně nedá pracovat. V pokročilé fázi poškození se již neidentifikuje v BIOSu a vydává pravidelné cvakavé nebo chrčivé zvuky – není schopen provést tzv. rekalibraci nebo ani nedosáhne jmenovitých otáček. Pokud disk v tomto stavu poběží delší dobu, dojde k celkové destrukci povrchů (úplnému obroušení magnetické vrstvy) a data jsou v tom případě definitivně ztracena. Proto je nesmírně důležité disk při prvních příznacích vypnout a už ho vůbec nezapínat. Někdy je i jedna minuta rozhodující.

Záchrana dat vyžaduje speciální vybavení, protože hlavičky znečištěné kontaktem s datovou oblastí plotny disku jsou obaleny magnetickým materiálem, takže není dodržena vzdálenost mezi hlavičkou a plotnou. Dochází tak k opětovným kontaktům způsobujícím další „obalování“, až dojde ke zmíněnému odfrézování aktivní vrstvy. Prosté nasazení nových hlav obvykle přes svou obtížnost nestačí, protože mohou narazit na „pohoří“ vytvořená na plotně předchozím kontaktem s hlavičkou. Ke slovu obvykle kromě jemné mechaniky přichází i optika a chemie.

Ochrana před tímto typem závady spočívá zejména v ochraně disku před otřesy, zvýšenou teplotou, cigaretovým kouřem, vlhkostí (pozor na prudké změny teplot), častým zapínáním a vypínáním. Například u SCSI disků je dobrou investicí jejich umístění do externího case s vlastním zdrojem a trvalý běh i při vypnutí, zapnutí nebo dokonce upgrade počítače.

Nefunkční čtecí hlavy

(mechanicky obtížné, ale vynikající výsledky)

Tato závada se projeví náhle a disk začne pravidelně cvakat. Bez odborné diagnostiky v laboratoři je téměř nemožné odlišit od případu poškození povrchů. Závada se může projevit i pouze na jedné z celého svazku hlav.

Záchrana dat spočívá v nasazení funkčního svazku hlav, ale vzhledem k možnosti poškození povrchů je nutná pečlivá analýza. Samotná obnova bývá 100% úspěšná.

Zvláštní ochrana před touto závadou neexistuje, jde o typické selhání předvídatelné s určitou pravděpodobností.

U pevných disků je nejrizikovějším okamžikem start nebo přistání hlaviček

Mechanické závady

(technicky velmi náročné)

Nejčastěji dochází k zadření ložisek hlavního motoru, který otáčí svazkem ploten. V takovém případě se disk vůbec netočí, ale ozývají se z něj tiché nebo hlasitější zvuky. Lze je výstižně popsat jako tiché pravidelné „pokníkávání“. Pokud je disk delší dobu zapojen, například přes noc, zpravidla dojde navíc ke zničení elektroniky vlivem přetížení.

Druhou nejčastější závadou je poškození dorazu parkovací polohy hlaviček, při němž dojde k utržení všech hlaviček z ramene. Disk začne cvakat a zbytky závěsů a volné hlavičky způsobují poškození povrchů.

Záchrana dat bývá v popsaných případech úspěšná, ale technicky velmi náročná. Není možné ji provést bez speciálních nástrojů, protože ložiska moderních disků jsou obvykle fluidní, lisovaná a lepená zároveň.

Ani zde zvláštní ochrana neexistuje vyjma dodržení předepsané provozní teploty a zásahu při výskytu prvních obtíží – delšího času potřebného pro start disku.

Přepsání řídicí oblasti využívané firmware disku

(záleží na typu, obvykle velmi náročné)

Poškození řídicí oblasti, kde jsou uloženy informace pro elektroniku a kam by se teoreticky nemělo nikdy nic zapisovat. Obvyklým projevem je detekce zcela nesmyslného jména disku BIOSem, případně žádná detekce. Někdy ale může být detekce zcela v pořádku, disk ovšem nelze číst, na všechny povely vrací status not ready. K poškození může dojít například silným otřesem při zápisu, který sice nezpůsobí kontakt hlavičky s povrchem disku ale přesunutí o několik stop „vedle“ a přepsání míst, nad kterými se v takové situaci hlavy pohybují, než elektronika záznamový proud vypne. Další zapínání a vypínání již rozsah poškození nezvětšuje.

Záchrana je velmi obtížná, záleží na konkrétním typu disku a způsobu, jakým je řídicí oblast implementována. Oprava vyžaduje interní znalosti výrobce disku.

Ochrana před podobným poškozením spočívá zejména v ochraně před otřesy, jiné příčiny ale nelze zcela vyloučit.

Elektromagnetické poškození záznamu na povrchu disku

(velmi náročné)

Poškození způsobí částečný nebo úplný přepis povrchu disku při výpadku zdroje, poruše elektroniky nebo po mechanickém otřesu. Projevy jsou velmi podobné jako v případě poškození povrchů disku - vadné sektory, disk začne cvakat, případně dojde pouze k detekci v BIOSu, ale data nelze číst. Odlišit tuto závadu od poškození povrchů je v mnoha případech složité i pro odbornou firmu

Záchrana je velmi obtížná i pro data v nepoškozené oblasti. Data v poškozené oblasti nelze běžným způsobem číst vůbec. (Partnerská firma řeší podobné problémy analogovým čtením a následnou analýzou na počítači CRAY. Takto lze přečíst i několikrát přepsaná data, ale služba je velmi nákladná, cca 100 000 USD za disk).

Ochrana před touto závadou je stejná jako v případě poškozeného povrchu disku.

Ostatní závady

Sem patří řada příčin - od relativně častých záplav přes úmyslná poškození až po naprosté kuriozity, jako je například zapečení disku v troubě. Pro disk, který byl byť jen na chvíli ve vodě, je nutné volit naprosto jiný postup při záchraně než u disku, který spadl na zem. Pro uživatele ale v obou případech platí zásada nepokoušet se disk zapnout „na zkoušku“ a u zaplavení i vzhledem k chemické agresivitě vody vyhledat pomoc co nejdříve. Jen pro ilustraci - při posledních velkých povodních v roce 2002 se podařilo zachránit z disků, které někdo na zkoušku zapínal, pouze přibližně 20 %, ale z disků, s nimiž se neexperimentovalo, až 80 %. Důležité je si uvědomit, že přes všeobecně rozšířené pověry žádné pevné disky nejsou hermeticky uzavřené.

Záchrana dat v těchto případech znamená maximální tvořivé využití zkušeností a znalostí pro nalezení použitelné cesty ke ztraceným datům.

Neděste se

Přes všechny popsané možné závady jsou současné pevné disky velmi spolehlivé a zejména při dodržení provozních podmínek bez problémů dosahují plánované doby životnosti. Základním způsobem ochrany před možným selháním disku je ovšem také uspořádání více disků do tzv. diskového pole označovaného zkratkou RAID. Diskovým polím bude věnován celý příští díl našeho seriálu.

CONNECT! - Seriál o záchraně dat, 1.díl | Stáhnout ve formátu PDF