Što je Raid 5? Vrste RAID-a i njihove karakteristike

I tako dalje, tako dalje, tako dalje, tako dalje. Dakle, danas ćemo razgovarati o RAID nizovi temeljeni na njima.

Kao što znate, ovi isti tvrdih diskova Također imaju određenu sigurnosnu granicu nakon koje otkazuju, kao i karakteristike koje utječu na performanse.

Kao rezultat toga, vjerojatno su mnogi od vas, na ovaj ili onaj način, jednom čuli za određene raid nizove koji se mogu napraviti od običnih tvrdi diskovi kako bi se ubrzao rad tih istih diskova i računala u cjelini ili kako bi se osigurala povećana pouzdanost pohrane podataka.

Sigurno također znate (a ako ne znate, nema veze) da ti nizovi imaju različite serijski brojevi (0, 1, 2, 3, 4 itd.), a također rade prilično dobro razne funkcije. Ovaj fenomen se zapravo događa u prirodi i, kao što ste već pogodili, radi se upravo o tim istim RAID nizovi su ono što vam želim reći u ovom članku. Točnije, već vam govorim ;)

Ići.

Što je RAID i zašto je potreban?

RAID- ovo je niz diskova (tj. kompleks ili, ako želite, skup) nekoliko uređaja - tvrdih diskova. Kao što sam rekao gore, ovaj niz služi za povećanje pouzdanosti pohrane podataka i/ili za povećanje brzine čitanja/pisanja informacija (ili oboje).

Zapravo, što točno ova hrpa diskova radi, odnosno ubrzava rad ili povećava sigurnost podataka, ovisi o vama, odnosno o vašem izboru trenutna konfiguracija racija(i). Različiti tipovi ove konfiguracije su upravo ono što je zabilježeno različite brojeve: 1, 2, 3, 4 te prema tome obavljaju različite funkcije.

Jednostavno, na primjer, u slučaju izgradnje 0 -th verzija (opis varijacija 0, 1, 2, 3 itd. - pročitajte u nastavku) Dobit ćete zamjetno povećanje produktivnosti. I općenito HDD upravo sad uski kanal u performansama sustava.

Zašto se to uopće dogodilo?

Tvrdi diskovi samo rastu u volumenu zbog brzine rotacije njihovih glava (s izuzetkom rijetkih modela kao Raptor"ov) je zamrznut već duže vrijeme 7200 , ni predmemorija baš i ne raste, arhitektura ostaje gotovo ista.

Općenito, što se tiče performansi, diskovi stagniraju (situaciju mogu spasiti samo oni u razvoju), ali igraju značajnu ulogu u radu sustava, a ponegdje i punopravnih aplikacija.

U slučaju izgradnje jedne cjeline (u smislu broja 1 ) raid, malo ćete izgubiti u performansama, ali ćete dobiti neko opipljivo jamstvo sigurnosti svojih podataka, jer će biti u potpunosti duplicirani i, zapravo, čak i ako jedan disk zakaže, sve će se u potpunosti nalaziti na drugom bez ikakvog gubitka.

Općenito, ponavljam, racije će biti korisne svima. Čak bih rekao da su obavezni :)

Što je RAID u fizičkom smislu?

Tjelesno RAID-niz predstavlja iz dva prije n-broj povezanih tvrdih diskova koji podržavaju mogućnost stvaranja RAID(ili na odgovarajući kontroler, što je rjeđe jer su skupi za prosječnog korisnika (kontroleri se obično koriste na poslužiteljima zbog povećane pouzdanosti i performansi)), tj. Na oko se ništa ne mijenja unutar sistemske jedinice, jednostavno nema nepotrebnih veza ili povezivanja diskova međusobno ili s bilo čim drugim.

Općenito, u hardveru je sve gotovo isto kao i uvijek, a mijenja se samo softverski pristup koji, zapravo, odabirom vrste raida postavlja kako točno povezani diskovi trebaju raditi.

Programski, u sustavu se, nakon kreiranja racije, također ne pojavljuju nikakve posebne zafrkancije. Zapravo, jedina razlika u radu s napadom je malo dotjerivanje, koji zapravo organizira raciju (vidi dolje) i koristi upravljački program. Inače, SVE je apsolutno isto - u "Mom računalu" isto C, D i drugi diskovi, sve iste mape, datoteke... Općenito i softverski, na oko, potpuno su identični.

Instalacija polja nije teška: samo uzimamo matičnu ploču koja podržava tehnologiju RAID, uzimamo dva potpuno identična, - to je važno!, - kako prema karakteristikama (veličina, cache, sučelje itd.) tako i prema proizvođaču i modelu diska i spojiti ih na ovu matičnu ploču. Dalje, samo uključite računalo, idite na BIOS i postavite parametar SATA konfiguracija: RAID.

Nakon toga, tijekom procesa pokretanja računala (obično prije pokretanja Windows) pojavljuje se ploča koja prikazuje informacije o disku u napadu i izvan njega, gdje zapravo trebate kliknuti CTR-I konfigurirati raid (dodati mu diskove, izbrisati, itd., itd.). Zapravo, to je sve. Onda su tu druge životne radosti, odnosno opet je sve kao i uvijek.

Važna napomena koju treba zapamtiti

Prilikom stvaranja ili brisanja napada ( 1 Čini se da se to ne odnosi na th raid, ali nije činjenica) sve se informacije neizbježno brišu s diskova i stoga očito nije vrijedno samo provoditi eksperiment, stvarati i brisati razne konfiguracije. Stoga, prije stvaranja racije, prvo spremite sve potrebne informacije(ako postoji), pa eksperimentirati.

Što se tiče konfiguracija.. Kao što sam već rekao, RAID Postoji nekoliko vrsta nizova (barem od glavne baze - ovo je RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Za početak ću govoriti o dva najrazumljivija i najpopularnija među običnim korisnicima:

  • RAID 0- niz diskova za povećanje brzine snimanja.
  • RAID 1- zrcalno diskovno polje.

A na kraju članka ću brzo proći kroz ostale.

RAID 0 - što je to i čemu služi?

Tako.. RAID 0(aka, striping) - koristi dva do četiri (više, rjeđe) tvrda diska koji zajednički obrađuju informacije, što povećava produktivnost. Da pojasnimo, nošenje torbi za jednu osobu traje duže i teže je nego za četiri osobe (iako torbe ostaju iste u svojim fizičkim svojstvima, mijenjaju se samo moći koje s njima djeluju). Programski, informacije o napadu ove vrste podijeljene su u podatkovne blokove i zapisane na oba/nekoliko diskova redom.

Jedan blok podataka na jednom disku, drugi blok podataka na drugom, i tako dalje. To značajno povećava performanse (broj diskova određuje višestrukost povećanja performansi, tj. 4 diska će raditi brže od dva), ali trpi sigurnost podataka na cijelom nizu. Ako bilo koja od komponenti uključenih u takav RAID tvrdi diskovi (tj. tvrdi diskovi), sve informacije su gotovo potpuno i nepovratno izgubljene.

Zašto? Činjenica je da se svaka datoteka sastoji od određenog broja bajtova... od kojih svaki nosi informaciju. Ali u RAID 0 U nizu, bajtovi jedne datoteke mogu se nalaziti na nekoliko diskova. Sukladno tome, ako jedan od diskova "umre", proizvoljan broj bajtova datoteke bit će izgubljen i jednostavno ga neće biti moguće oporaviti. Ali postoji više od jedne datoteke.

Općenito, pri korištenju takvog raid niza, toplo se preporuča trajno napraviti vrijedne informacije o vanjski mediji. Raid stvarno pruža primjetnu brzinu - ovo vam govorim u vlastito iskustvo, jer je takva sreća već godinama ugrađena u moj dom.

RAID 1 - što je to i čemu služi?

Što je s RAID-om 1?(Zrcaljenje - "ogledalo"). Zapravo, počet ću s nedostatkom. Za razliku od RAID 0 ispada da kao da "gubite" volumen drugo teško disk (koristi se za pisanje na njega potpune (bajt po bajt) kopije prvog tvrdi disk dok je RAID 0 ovaj prostor potpuno dostupan).

Prednost je, kao što ste već shvatili, što ima visoku pouzdanost, tj. sve radi (i svi podaci postoje u prirodi, i ne nestaju kad neki od uređaja zakaže) dokle god radi barem jedan disk, tj. Čak i ako grubo uništite jedan disk, nećete izgubiti niti jedan bajt informacija, jer drugi je čista kopija prvog i zamjenjuje ga kada zakaže. Ova vrsta raida često se koristi na poslužiteljima zbog nevjerojatne održivosti podataka, što je važno.

Ovakvim pristupom performanse su žrtvovane i, prema osobnom dojmu, čak manje nego kada se koristi jedan disk bez ikakvih napada. Međutim, za neke je pouzdanost puno važnija od izvedbe.

RAID 2, 3, 4, 5, 6 - što su i za što se koriste?

Opis ovih nizova je ovdje koliko god je to moguće, tj. čisto za referencu, pa čak i tada u komprimiranom obliku (zapravo je opisan samo drugi). Zašto je to? Barem zbog niske popularnosti ovih nizova među prosječnim (i, općenito, bilo kojim drugim) korisnikom i, kao posljedica toga, mog malog iskustva u njihovom korištenju.

RAID 2 rezervirano za nizove koji koriste nekakav Hammingov kod (nije me zanimalo što je to pa vam neću reći). Princip rada je otprilike sljedeći: podaci se snimaju na odgovarajućim uređajima na isti način kao u RAID 0, odnosno podijeljeni su u male blokove na svim diskovima koji sudjeluju u pohranjivanju informacija.

Preostali diskovi (posebno dodijeljeni za ovu svrhu) pohranjuju kodove za ispravljanje pogrešaka, koji se mogu koristiti za vraćanje informacija u slučaju kvara bilo kojeg tvrdog diska. Dakle, u nizovima ove vrste diskovi su podijeljeni u dvije skupine - za podatke i za kodove za ispravljanje pogrešaka

Na primjer, imate dva diska koji osiguravaju prostor za sustav i datoteke, a još dva će biti potpuno posvećena ispravljanju podataka u slučaju da prva dva diska zakažu. U biti, ovo je nešto poput nulte racije, samo uz mogućnost da se barem nekako sačuvaju informacije u slučaju kvara jednog od tvrdih diskova. Rijetko skupo - četiri diska umjesto dva s vrlo kontroverznim povećanjem sigurnosti.

RAID 3, 4, 5, 6.. O njima, koliko god čudno zvučalo na stranicama ove stranice, pokušajte pročitati o njima na Wikipediji. Činjenica je da sam se u životu vrlo rijetko susreo s ovim nizovima (osim što mi je peti dolazio pri ruci češće od ostalih) i ne mogu pristupačnim riječima opisati principe njihovog rada i apsolutno ne želim ponovno tiskati članak iz gore predloženog izvora, barem zbog prisutnosti bijesnih formulacija u njima, koje čak i ja jedva mogu razumjeti.

Koji RAID izabrati?

Ako igrate igre, često kopirate glazbu, filmove, instalirate programe koji zahtijevaju velike resurse, onda će vam to sigurno biti korisno RAID 0. Ali pazite kada teško birajući diskove - u ovom slučaju njihova je kvaliteta posebno važna - ili svakako napravite sigurnosne kopije na vanjski medij.

Ako radite sa vrijedne informacije, što je jednako smrti izgubiti, onda vam svakako treba RAID 1- izuzetno je teško izgubiti informacije s njim.

ponavljam to Vrlo preporučljivo je da diskovi instalirani u RAID niz je bio rodno identičan. Veličina, marka, serija, veličina predmemorije - sve bi po mogućnosti trebalo biti isto.

Pogovor

Tako stvari stoje.

Usput, napisao sam kako sastaviti ovo čudo u članku: " Kako stvoriti RAID niz standardne metode ", i o par parametara u materijalu " RAID 0 od dva SSD-a, - praktični testovi s Read Ahead i Read Cache". Koristite pretraživanje.

Iskreno se nadam da će vam ovaj članak biti od koristi i da ćete si sigurno napraviti raciju ove ili one vrste. Vjerujte mi, isplati se.

Za pitanja o njihovoj izradi i konfiguraciji, općenito, možete me kontaktirati u komentarima - pokušat ću vam pomoći (ako postoje upute za vašu matičnu ploču na mreži). Bit će mi drago i za svaki dodatak, želju, razmišljanje i sve te stvari.

Prije nekoliko godina upozorio sam da će RAID 5 prestati raditi 2009. Naravno, dobavljači mrežna pohrana ne preporučuju RAID 5. Trenutno preporučuju RAID 6, koji štiti od kvarova dva pogona u polju. Ali u 2019. čak ni RAID 6 neće zaštititi vaše podatke. Zato.

RAID 6 = (RAID 5) 2

Napisao sam da će RAID 6 također imati ograničen vijek trajanja:

…RAID 6 za nekoliko godina neće vam pružiti ništa više zaštite nego RAID 5 danas. Za to nije kriv RAID 6. Naprotiv, to je zbog povećanja kapaciteta diska i stalnog broja fatalnih pogrešaka čitanja.

Još u prosincu 2009. SUN-ov inženjer, flash arhitekt i ZFS developer Adam Leventhal napravio je analizu očekivanog vijeka trajanja RAID-a 6 kao pouzdane strategije zaštite podataka. Objavio ga je u časopisu ACM-a “Triple Parity RAID and Beyond,” iz kojeg koristim izvatke u ovom članku.

Dobre vijesti: Leventhal je otkrio da će razina zaštite RAID-a 6 do 2019. biti jednako dobra kao što je bio RAID 5.

Loša vijest: Leventhal je pretpostavio da su diskovi pouzdaniji nego što zapravo jesu. Dakle, vrijeme bi moglo biti čak i kraće ako se proizvođači diskova ne uključe u igru. I još jedan dobre vijesti: jedna od kompanija već ima takav disk - i reći ću vam tko je to.

Suština problema

RAID niz je kontroler (ili program) koji spaja grupu diskova u jedan veliki disk pomoću matematičke formule. Kontroler dodaje na diskove dodatni blokovi kontrolni zbrojevi, tako da gubitak jednog ili dva diska ne dovodi do gubitka informacija (u daljnjem tekstu govorimo o RAID 5 i 6 nizovima, a ne o RAID 0, 1 ili 10). Kontrolne sume vam omogućuju vraćanje podataka s diskova koji su ispali iz niza, a prilikom zamjene diska možete rekonstruirati njegov sadržaj.

Problem s RAID 5 je taj što tvrdi diskovi imaju greške u čitanju. U SATA pogoni Specifikacija dopušta neispravljivu stopu pogreške čitanja (URE) od 10 14 . To znači da jednom na 10 14 bita disk jednostavno neće moći pročitati podatke.

10 14 bitova = 100000000000000/8/512 sektora = 24 414 062 500 sektora

stvarna veličina diska od 2TB = 3.907.029.168 sektora

Kada ste u RAID 5 polju od 7 SATA pogoni 2 TB, jedan tvrdi disk pokvari, ostaje vam 6 diskova od 2 TB. I dok RAID kontroler radi ponovnu izgradnju, vrlo je vjerojatno da će se pojaviti greška čitanja (URE). Nakon ove pogreške, rekonstrukcija RAID polja postaje nemoguća.

Vjerojatnost da će ponovna izgradnja uspješno završiti: (1 – 1 /(24,414,062,500)) ^ (6*3,907,029,168) ≈ 0,38

Ukupno postoji 62% šanse za gubitak podataka zbog greške čitanja koja se ne može ispraviti u RAID5 nizu od sedam SATA pogona s jednim pokvarenim pogonom.

RAID 6

RAID 6 rješava ovaj problem stvaranjem drugog kontrolnog zbroja. Možete izgubiti jedan disk, uhvatiti grešku čitanja URE i svejedno uspješno dovršiti ponovnu izgradnju.

Vjerojatnost da će ponovna izgradnja RAID6 na 7 SATA diskova biti uspješna: ((1 – 1 /(24,414,062,500)) ^ (6*3,907,029,168))+(1-(1 – 1 /(24,414,062,500) )) ^ (6*3,907,029,168)) *((1 – 1 /(24 414 062 500)) ^ (5*3 907 029 168)) ≈ 0,66

U čemu je problem?

Postoji nekoliko problema:

  • Dugo vrijeme obnove niza. Kako se kapacitet tvrdih diskova povećava, povećava se i vrijeme obnove. Podatkovni disk od 7200 okretaja u minuti zapisuje prosječno oko 115 MB/s - a brzina pisanja opada kako se disk puni - što rezultira minimalnim oko 5 sati za oporavak loš disk. Ali većina nizova ne može dopustiti ponovnu izgradnju maksimalnom mogućom brzinom oporavka, tako da ponovna izgradnja obično traje 2-5 puta dulje.
  • Više skrivenih grešaka. Enterprise nizovi koriste pozadinske rutine ribanja diska za pronalaženje i popravak moguće greške disk prije nego što se obznane. No, kako se volumen diskova povećava, ribanje diska traje dulje. U veliki masiv disk se možda neće provjeriti mjesecima, što znači više grešaka prilikom ponovne izgradnje niza.
  • Ovisnost između kvarova diskova. Zagovornici RAID-a pretpostavljali su da su kvarovi diskova neovisni događaji. Ali godine iskustva pokazale su da to nije slučaj: kvar jednog pogona u nizu čini kvar drugog pogona puno vjerojatnijim.

Pojednostavimo: velike felge= duža ponovna izgradnja + više skrivenih grešaka -> više šanse za kvar RAID 6.

Leventhalovo predviđanje relativne pouzdanosti RAID-a s jednim i dvostrukim paritetom

Do 2019. RAID 6 neće biti ništa pouzdaniji nego što je RAID 5 danas.

zaključke

Za poslovne korisnike ovaj će izlaz biti korisna informacija. Iako će trostruki paritet u nizovima riješiti problem zaštite podataka, bit će značajnih kompromisa.

Razmotrite niz od 21 diska. Samo za ponovnu izgradnju polja potrebno je tjedan dana, tako da u prosjeku polje uvijek radi ograničen način rada oporavak (način degradirane obnove). Potpuni prijelaz na 2.5″ diskovima? Funkcionalna zastarjelost trenutnih nizova od milijun dolara?

Redoviti korisnici mogu se opustiti. Kućni RAID je inherentno loša ideja, bolje ga činite češće sigurnosne kopije s diska na disk i koristite mrežne usluge sigurnosne kopije za vrijedne podatke.

I posljednja točka, Leventhal je u svojim izračunima koristio stopu pogreške diska od 10^16. Ovo vrijedi za male, brze i skupe tvrde diskove za poduzeća, ali većina običnih SATA2 diskova ima red veličine nižu stopu URE pogreške od 10^14. Uz jednu iznimku: model diska serije WD20EADS Caviar Green iz tvrtke Western Digital Prema specifikaciji ima URE koeficijent 10^15.

Razina 5 je niz neovisnih diskova s ​​distribuiranom pohranom kontrolnih zbrojeva.

Blokovi podataka i kontrolni zbrojevi zapisuju se kružno na sve diskove niza, tako da nema asimetrije u konfiguraciji diska. Ova shema ne zahtijeva posebno namjenski disk za pohranu informacija o kontrolnim zbrojevima.

Volumen disk niz RAID5 se izračunava pomoću formule (n-1)*V.hdd, gdje je n broj diskova u nizu, a V.hdd je veličina najmanjeg diska. Stoga, ako je izgrađen RAID 5, svi diskovi u nizu moraju imati istu veličinu. pri čemu rezultirajući kapacitet diskovni podsustav dostupan za pisanje postaje točno jedan disk manji. Na primjer, ako je pet diskova veličine 10 GB, tada je stvarna veličina niza 40 GB jer je 10 GB dodijeljeno kontrolnim informacijama.

RAID 5, kao i RAID 4, ima neovisnu arhitekturu pristupa. U usporedbi s RAID 3, pruža velika veličina logički blokovi za pohranu informacija. Stoga, kao iu slučaju RAID-a 4, takav niz daje glavnu korist pri obradi nekoliko zahtjeva istovremeno. Da rezimiramo prednosti, možemo reći sljedeće: u RAID 5 dodatni računalni resursi troše se na snimanje informacija i, kao rezultat toga, performanse padaju. Ali kada čitate (u usporedbi s odvojenim HDD disk) postoji dobitak performansi jer se tokovi podataka s nekoliko diskova niza obrađuju paralelno.

Među nedostacima treba napomenuti da RAID performanse ova je razina smanjena za 10-25% u usporedbi s RAID 1 na operacijama tipa Random Write (piše nasumičnim redoslijedom), budući da zahtijeva više operacija diska jer je svaka operacija pisanja poslužitelja zamijenjena na RAID kontroleru s tri - jedna operacija čitanja i dvije operacije pisanja operacije.

Ako jedan od diskova pokvari, pouzdanost niza katastrofalno pada na razinu RAID 0 (kada se podaci uzastopno zapisuju na nekoliko diskova s ​​nultom redundancijom). Štoviše, što je veći broj diskova u nizu, to je niža pouzdanost; smanjuje se kao višestruki broj diskova. U ovom trenutku sustav je u kritičnom načinu jer sve operacije čitanja i pisanja popraćene su dodatnim manipulacijama. Ako 2. disk zakaže ili jednostavna greškačitanje - niz će biti uništen i podaci se ne mogu vratiti tradicionalnim metodama.

Također treba uzeti u obzir da proces oporavka podataka nakon kvara bilo kojeg diska u nizu uzrokuje intenzivno opterećenje čitanja s diskova tijekom dugog vremenskog razdoblja. To može dovesti do kvara jednog od diskova tijekom ovog najosjetljivijeg razdoblja rada RAID-a, a također može razotkriti prethodno neotkrivene greške čitanja u podatkovnim nizovima niske aktivnosti, što povećava rizik od kvara prilikom vraćanja integriteta podataka.

Minimalan broj diskova za organiziranje RAID5 je 3


Suočeni smo s problemom da većina poslužitelja koje kupe korisnici naših programa dolazi s diskovnim poljem konfiguriranim na RAID 5. Naknadno administratori sustava ne žele gubiti vrijeme na ponovno konfiguriranje ili se jednostavno boje promijeniti nešto na već konfiguriranom i radnom računalu. Kao rezultat toga, performanse rada s bazom podataka instaliranom na takvom poslužitelju ispadaju manje nego na starom, koji je u poduzeću radio 3-4 godine. Vjerojatno se želja dobavljača da konfiguriraju diskovno polje u RAID razini 5 može objasniti željom da iznenadi klijenta svojom ogromnom veličinom prostor na disku. Administratori sustava, zauzvrat, često jednostavno nemaju dovoljno znanja o tome kako radi RAID polje jedne ili druge razine. Svrha ovog članka je odgovoriti na dva pitanja:

Zašto ne mogu koristiti RAID 5 za poslužitelj baze podataka?

Kako optimalno konfigurirati RAID kontroler za host baze podataka poslužitelja Firebird?

Napravimo odmah rezervu da se zaključci izvučeni u ovom članku ne odnose na one rijetke slučajeve kada se baza podataka koristi isključivo (ili uglavnom) u svrhe samo za čitanje.

Kako radi RAID 5?

Pogledajmo pojednostavljeni dijagram kako radi niz od četiri diska. Jedan od diskova je dodijeljen za pohranu kontrolne sume. Tri su dostupna za smještaj podataka. Na donjoj slici pogoni s korisnim sadržajem nazivaju se A, B i C. Pogon D pohranjuje kontrolne zbrojeve.

Naziva se minimalna količina informacija koju kontroler čita ili upisuje na jedan disk traka(traka). Parametri većine regulatora s kojima smo se susreli ne pokazuju veličinu trake, već veličinu pruga(stripe) – blok informacija koji je raspoređen po svim diskovima niza. Na donjoj slici jedna pruga je istaknuta tamnijom bojom:


Veličina trake jednaka je veličini trake pomnoženoj s brojem diskova u nizu. Oni. u slučaju četiri diska i veličine trake od 64 K, minimalna količina informacija koju kontroler može napisati ili pročitati s diska je 64 / 4 = 16 K.

Kontrolni zbroj koji ide na disk D izračunava se pomoću sljedeće formule:

D = A x ili B x ili C

Zahvaljujući tranzitivnosti xor operacije Ako jedan od diskova s ​​korisnim informacijama pokvari, može se vratiti xoriranjem podataka preostalih diskova, uključujući disk s kontrolnim zbrojem. Na primjer, pogon B nije uspio.


Kada zatraži blok informacija s diska B, kontroler će ga vratiti pomoću formule:

B = A x ili C x ili D

Firebird poslužitelj komunicira sa diskovni podsustav podatkovne stranice. Optimalna veličina stranica u većini slučajeva je 8K, što je puno manje od veličine trake, au većini slučajeva čak i manje od veličine trake. Situacije kada se uzastopne stranice zapisuju na disk također su prilično rijetke. Stoga, ako se u našem primjeru informacije zapisuju na disk A, tada će kontroler morati izvršiti sljedeće operacije:

  1. Čitajte podatke trake s pogona B i C. Dvije operacije čitanja.
  2. Izračunajte novi kontrolni zbroj. Dvije xor operacije.
  3. Zapišite informacije na disk A i kontrolni zbroj na disk D. Dvije operacije pisanja.

Ukupno, dva čitanja, dva pisanja i dvije xor operacije. Bilo bi iznenađujuće da uz toliki obim posla ukupna izvedba nije pao. Sada postaje očito zašto RAID 5 nije prikladan za smještaj datoteke baze podataka.

Važno RAID značajka 5 je značajan pad performansi kada jedan od diskova u nizu zakaže. Uostalom, sada, da bi se povratile informacije s ovog diska, potrebno je pročitati i ponovno sortirati podatke sa svih ostalih diskova.

No, kao i svako pravilo, i naše ima svoju iznimku. Performanse RAID 5 diskovnog niza neće biti smanjene ako je veličina postojane predmemorije kontrolera usporediva s veličinom datoteke baze podataka. Na primjer, s veličinom predmemorije od 512 MB, sasvim je moguće koristiti RAID polje pete razine za baze podataka do 1-1,5 GB. Pod uvjetom da je poslužitelj namijenjen samo za rad s bazom podataka i ne obavlja druge poslove.

Vrijedno je napomenuti da je gornja shema rada RAID 5 iz metodoloških razloga. ozbiljno pojednostavljeno. U stvarnosti, kontroler ciklički distribuira trake po svim diskovima niza, tako da ne postoji namjenski disk za pohranu kontrolnih zbrojeva. Svi diskovi pohranjuju i podatke i kontrolne zbrojeve različitih pruga, što vam omogućuje izjednačavanje opterećenja na njima.

Koju razinu RAID-a odabrati?

Ako RAID 5 nije prikladan, koju bih razinu trebao odabrati za hostiranje datoteke baze podataka? Ako je broj diskova manji od četiri, jedina opcija je zrcalo (RAID 1). Ako niz ima četiri ili više diskova, tada je RAID 10 optimalan u pogledu performansi i pouzdanosti - kombinirajući (RAID 0) nekoliko zrcala ( RAID 1). Ponekad ga možete vidjeti napisano kao RAID 1+0. Donja slika prikazuje RAID polje 10 od četiri diska. Podaci jedne pruge istaknuti su tamnim tonom. Sjenčanje prikazuje duplikat te trake.

Imajte na umu također da ako RAID 5 polje može preživjeti gubitak samo jednog diska, tada će RAID 10 od m zrcala s dva diska preživjeti gubitak od jednog do m diskova, pod uvjetom da ne pokvari više od jednog diska u svakom zrcalu.

Pokušajmo kvantitativno usporediti RAID 5 i RAID 10 nizove, od kojih svaki ima n diskova. n je višekratnik dva. Uzmimo da je veličina podatkovnog bloka za čitanje/pisanje jednaka veličini trake. Donja tablica prikazuje potreban broj operacija čitanja/pisanja podataka i xoringa.


Jasno se vidi da RAID 10 niz ne samo da ima više visoke performanse prilikom snimanja, ali također ne dopušta opće smanjenje performansi kada jedan disk zakaže.

Kako konfigurirati RAID kontroler?

Veličina predmemorije

Što veće, to bolje. Glavno je da kontroler ima bateriju (akumulator) za spremanje sadržaja memorije u slučaju nestanka struje. Za mnoge kontrolere baterija nije standardno uključena i mora se naručiti zasebno. Bez baterije, predmemorija pisanja bit će onemogućena.

RAID razina

RAID 10. Ako je broj diskova manji od četiri, tada je RAID 1 (mirror). Zašto? Pročitajte članak od samog početka.

Veličina pruge

Veličina stranice baze podataka pomnožena s brojem zrcala u nizu. Na primjer, ako niz ima 8 diskova, kombiniranih u četiri zrcala od po dva diska, a veličina stranice baze podataka je 8K, tada bi veličinu trake trebalo postaviti na 8 * 4 = 32K.

Pročitajte unaprijed

Budući da je sekvencijalni pristup stranicama baze podataka vrlo rijedak, a kao rezultat fragmentacije one same mogu biti u razna mjesta disk, treba onemogućiti čitanje unaprijed ili koristiti adaptivni način rada (čitanje unaprijed u slučaju sekvencijalnog pristupa dvjema uzastopnim stranicama).

Pravila predmemorije pisanja

Odaberite način povratnog pisanja. Podaci će se pohraniti u predmemoriju i zatim zapisati na disk. Operacija pisanja smatrat će se završenom čim se podaci stave u predmemoriju.

Rezervni disk

Ako mogućnosti kontrolera dopuštaju, preporuča se uključiti u polje rezervni disk. Takav disk normalni mod rad je u stanju pripravnosti. Ako jedan od ispravnih tvrdih diskova pokvari, rezervni disk se automatski dodaje nizu.

© Andrey Egorov, 2005, 2006. Grupa tvrtki TIM.

Posjetitelji foruma postavljaju nam pitanje: “Koja je razina RAID-a najpouzdanija?” Svi znaju da je najčešća razina RAID5, ali nije bez ozbiljnih nedostataka koji nisu očiti nestručnjacima.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 ili što su RAID razine?

U ovom ću članku pokušati opisati najpopularnije razine RAID-a, a zatim formulirati preporuke za korištenje tih razina. Kako bih ilustrirao članak, napravio sam dijagram u kojem sam te razine smjestio u trodimenzionalni prostor pouzdanosti, performansi i isplativosti.

JBOD(Just a Bunch of Disks) jednostavno je spajanje tvrdih diskova, što formalno nije RAID razina. JBOD volumen može biti niz jednog diska ili skup više diskova. RAID kontroler Za rad s takvim volumenom nisu potrebni izračuni. U našem dijagramu, JBOD pogon služi kao "pojedinačna" ili početna točka - njegova pouzdanost, izvedba i cijene jednaki su onima jednog tvrdog diska.

RAID 0(“Striping”) nema redundancije i distribuira informacije odmah po svim diskovima uključenim u polje u obliku malih blokova (“stripes”). Zbog toga se performanse značajno povećavaju, ali pouzdanost pati. Kao i kod JBOD-a, za naš novac dobivamo 100% kapaciteta diska.

Dopustite mi da objasnim zašto se smanjuje pouzdanost pohrane podataka na bilo kojem kompozitnom volumenu - budući da ako bilo koji od tvrdih diskova uključenih u njega otkaže, sve informacije su potpuno i nepovratno izgubljene. U skladu s teorijom vjerojatnosti, matematički, pouzdanost RAID0 volumena jednaka je umnošku pouzdanosti njegovih sastavnih diskova, od kojih je svaki manji od jedan, tako da je ukupna pouzdanost očito niža od pouzdanosti bilo kojeg diska.

Dobar nivo - RAID 1(“Zrcaljenje”, “ogledalo”). Ima zaštitu od kvara polovice raspoloživog hardvera (u općem slučaju jednog od dva tvrda diska), omogućuje prihvatljivu brzinu pisanja i dobiva na brzini čitanja zbog paralelizacije zahtjeva. Nedostatak je što morate platiti cijenu dva tvrda diska da biste dobili iskoristivi kapacitet jednog tvrdog diska.

U početku se pretpostavlja da je tvrdi disk pouzdana stvar. Prema tome, vjerojatnost kvara dvaju diskova odjednom jednaka je (prema formuli) umnošku vjerojatnosti, tj. reda veličine niže! Nažalost, stvaran život- nije teorija! Dva tvrda diska se uzimaju iz iste serije i rade pod istim uvjetima, a ako jedan od diskova pokvari, povećava se opterećenje ostatka, pa se u praksi, ako jedan od diskova pokvari, moraju hitno poduzeti mjere za vraćanje u pogon. zalihost. Da biste to učinili, preporučuje se korištenje vrućih rezervnih diskova s ​​bilo kojom razinom RAID-a (osim nulte) HotSpare. Prednost ovog pristupa je održavanje stalna pouzdanost. Nedostatak su još veći troškovi (tj. trošak 3 tvrda diska za pohranu volumena jednog diska).

Mirror na mnogim diskovima je razina RAID 10. Kada koristite ovu razinu, zrcalni parovi diskova raspoređeni su u "lanac", tako da rezultirajući volumen može premašiti kapacitet jednog tvrdog diska. Prednosti i nedostaci su isti kao i za razinu RAID1. Kao iu drugim slučajevima, preporuča se uključiti HotSpare hot spare diskove u polje po stopi jedan rezervni za svakih pet radnika.

RAID 5, doista, najpopularniji među razinama - prvenstveno zbog svoje učinkovitosti. Žrtvovanjem kapaciteta samo jednog diska iz niza za redundanciju, dobivamo zaštitu od kvara bilo kojeg tvrdog diska jedinice. Zapisivanje informacija na RAID5 jedinicu košta dodatna sredstva, budući da su potrebni dodatni izračuni, ali kod čitanja (u usporedbi s zasebnim tvrdim diskom), postoji dobitak, jer su tokovi podataka iz nekoliko pogona polja paralelizirani.

Nedostaci RAID5 pojavljuju se kada jedan od diskova ne uspije - cijeli volumen prelazi u kritični način rada, sve operacije pisanja i čitanja popraćene su dodatnim manipulacijama, performanse naglo padaju, a diskovi se počinju zagrijavati. Ako se odmah ne poduzme radnja, možete izgubiti cijeli volumen. Stoga (vidi gore) svakako trebate koristiti Hot Spare disk s RAID5 volumenom.

Pored osnovnog RAID razine 0 - RAID5 opisan u standardu, postoje kombinirane razine RAID10, RAID30, RAID50, RAID15, koje raznih proizvođača Svaki to drugačije tumači.

Suština takvih kombinacija je ukratko sljedeća. RAID10 je kombinacija jedan i nula (vidi gore). RAID50 je kombinacija “0” volumena razine 5. RAID15 je "ogledalo" "petice". I tako dalje.

Stoga kombinirane razine nasljeđuju prednosti (i nedostatke) svojih "roditelja". Dakle, pojava "nule" u razini RAID 50 ne dodaje nikakvu pouzdanost, ali ima pozitivan učinak na performanse. Razina RAID 15, vjerojatno vrlo pouzdan, ali nije najbrži i, štoviše, krajnje neekonomičan (korisni kapacitet volumena manji je od polovice veličine izvornog diskovnog polja).

RAID 6 razlikuje se od RAID 5 po tome što u svakom redu podataka (na engleskom pruga) nema niti jednu, nego dva blok kontrolne sume. Kontrolne sume su "višedimenzionalne", tj. neovisni jedan o drugome, tako da čak i kvar dvaju diskova u nizu omogućuje spremanje izvornih podataka. Izračunavanje kontrolnih zbrojeva pomoću Reed-Solomonove metode zahtijeva intenzivnije izračune u usporedbi s RAID5, tako da se prethodno šesta razina praktički nije koristila. Sada ga podržavaju mnogi proizvodi, jer su počeli instalirati specijalizirane mikro krugove koji izvode sve potrebne matematičke operacije.

Prema nekim studijama, vraćanje integriteta nakon kvara jednog diska na RAID5 volumenu koji se sastoji od velikih SATA diskova (400 i 500 gigabajta) završava gubitkom podataka u 5% slučajeva. Drugim riječima, u jednom od dvadeset slučajeva, tijekom regeneracije RAID5 polja u Hot Spare disk, drugi disk može otkazati... Otuda preporuke najboljih RAID diskova: 1) Stalno napraviti sigurnosne kopije; 2) korištenje RAID6!

Nedavno su se pojavile nove razine RAID1E, RAID5E, RAID5EE. Slovo “E” u nazivu znači Poboljšano.

RAID level-1 Enhanced (RAID level-1E) kombinira zrcaljenje i pruganje podataka. Ova mješavina razina 0 i 1 raspoređena je na sljedeći način. Podaci u redu distribuiraju se točno kao u RAID 0. To jest, red podataka nema redundancije. Sljedeći red blokova podataka kopira prethodni s pomakom od jednog bloka. Na ovaj način, kao u standardni način rada RAID 1, svaki podatkovni blok ima zrcalnu kopiju na jednom od diskova, tako da je korisni volumen niza jednak polovici ukupnog volumena uključenog u niz tvrdih diskovi. RAID 1E za rad zahtijeva kombinaciju tri ili više diskova.

Jako mi se sviđa RAID1E razina. Za moćnu grafiku radna stanica ili čak za kućno računalooptimalan izbor! Ima sve prednosti nulte i prve razine - izvrsna brzina i visoka pouzdanost.

Prijeđimo sada na razinu RAID level-5 Enhanced (RAID level-5E). Ovo je isto što i RAID5, samo sa diskom za sigurnosne kopije ugrađenim u polje rezervni pogon. Ova se integracija provodi na sljedeći način: na svim diskovima niza ostaje slobodan 1/N dio prostora koji se koristi kao vruća rezerva ako jedan od diskova zakaže. Zbog toga, RAID5E pokazuje, uz pouzdanost, bolje performanse, budući da se čitanje/pisanje izvodi paralelno s veći broj diskova u isto vrijeme, a rezervni disk nije u stanju mirovanja, kao u RAID5. Očito, rezervni disk uključen u jedinicu ne može se dijeliti s drugim jedinicama (namjenski u odnosu na dijeljenu). RAID 5E volumen izgrađen je na najmanje četiri fizički diskovi. Korisni volumen logičkog volumena izračunava se pomoću formule N-2.

RAID level-5E Enhanced (RAID level-5EE) sličan RAID razini-5E, ali ima učinkovitiju dodjelu rezervnog pogona i, kao rezultat toga, brže vrijeme oporavka. Kao i razina RAID5E, ova razina RAID raspoređuje blokove podataka i kontrolne zbrojeve u retke. Ali također distribuira slobodne blokove rezervnog pogona, a ne samo rezervira dio prostora na disku za te svrhe. Ovo smanjuje vrijeme potrebno za rekonstrukciju integriteta RAID5EE volumena. Sigurnosni disk uključen u volumen ne može se dijeliti s drugim volumenima - kao u prethodnom slučaju. RAID 5EE volumen izgrađen je na najmanje četiri fizička diska. Korisni volumen logičkog volumena izračunava se pomoću formule N-2.

Začudo, ne spominje se razina RAID 6E Nisam ga mogao pronaći na internetu - do sada ovu razinu nije ponudio niti je najavio niti jedan proizvođač. No, razina RAID6E (ili RAID6EE?) može se ponuditi prema istom principu kao i prethodna. Disk HotSpare Obavezno mora pratiti svaki RAID volumen, uključujući RAID 6. Naravno, nećemo izgubiti informacije ako jedan ili dva diska zataje, ali je izuzetno važno započeti s regeneracijom integriteta niza što je ranije moguće kako bi se sustav brzo izveo iz pogona "kritičnog" načina rada. Budući da je potreba za Hot Spare diskom za nas nedvojbena, bilo bi logično ići dalje i "rasprostrijeti" ga po volumenu kao što je to učinjeno u RAID 5EE kako bismo dobili prednosti korištenja više količine diskovi ( najbolja brzinačitaj-piši i više brz oporavak integritet).

RAID razine u “brojevima”.

Neke od njih sam sakupio u tablici važni parametri gotovo sve RAID razine, tako da ih možete međusobno usporediti i bolje razumjeti njihovu bit.

Razina
~~~~~~~

Kolibe-
točno
nost
~~~~~~~

Koristiti
Kapacitet diska
~~~~~~~

Proizvodnja
ditel-
nost
čitanje

~~~~~~~

Proizvodnja
ditel-
nost
zapisa

~~~~~~~

Ugrađeni
disk
pričuva

~~~~~~~

Min. broj diskova
~~~~~~~

Maks. broj diskova

~~~~~~~

exc.

exc.

exc.

exc.

Sve "mirror" razine su RAID 1, 1+0, 10, 1E, 1E0.

Pokušajmo ponovno temeljito razumjeti kako se te razine razlikuju?

RAID 1.
Ovo je klasično "ogledalo". Dva (i samo dva!) tvrdi diskovi raditi kao jedno, biti potpuna kopija jedna druge. Kvar bilo kojeg od ova dva pogona ne dovodi do gubitka vaših podataka, budući da kontroler nastavlja raditi na preostalom pogonu. RAID1 u brojkama: 2x redundantnost, 2x pouzdanost, 2x trošak. Performanse pisanja jednake su performansama jednog tvrdog diska. Performanse čitanja su veće jer kontroler može distribuirati operacije čitanja između dva diska.

RAID 10.
Bit ove razine je da se diskovi niza kombiniraju u parovima u "ogledala" (RAID 1), a zatim se svi ti parovi zrcala, zauzvrat, kombiniraju u zajednički prugasti niz (RAID 0). Zbog toga se ponekad naziva RAID 1+0. Važna točka– RAID 10 može kombinirati samo paran broj diskova (minimalno 4, maksimalno 16). Prednosti: pouzdanost je naslijeđena od "ogledala", performanse za čitanje i pisanje naslijeđene su od "nule".

RAID 1E.
Slovo "E" u nazivu znači "Poboljšano", tj. "poboljšan". Načelo ovog poboljšanja je sljedeće: podaci se "skidaju" u blokovima po svim diskovima niza, a zatim se ponovno "skidaju" s pomakom na jedan disk. RAID 1E može kombinirati od tri do 16 diskova. Pouzdanost odgovara pokazateljima "deset", a performanse postaju malo bolje zbog veće "izmjene".

RAID 1E0.
Ova se razina implementira ovako: iz RAID1E polja stvaramo "null" polje. Dakle, ukupan broj diskova mora biti višekratnik tri: najmanje tri, a najviše šezdeset! U ovom slučaju malo je vjerojatno da ćemo dobiti prednost u brzini, a složenost implementacije može nepovoljno utjecati na pouzdanost. Glavna prednost je mogućnost kombiniranja vrlo velikog (do 60) broja diskova u jedan niz.

Sličnost svih razina RAID 1X leži u njihovim pokazateljima redundantnosti: radi pouzdanosti žrtvuje se točno 50% ukupnog kapaciteta diskova polja.