Raid 5 mikä se on. RAID-tyypit ja niiden ominaisuudet

Ja tavaraa, tavaraa, tavaraa, tavaraa. Joten tänään puhumme RAID niihin perustuvia taulukoita.

Kuten tiedät, nämä kovalevyt niillä on myös tietty turvallisuusmarginaali, jonka jälkeen ne epäonnistuvat, sekä suorituskykyyn vaikuttavat ominaisuudet.

Tämän seurauksena varmasti monet teistä, tavalla tai toisella, ovat kerran kuulleet joistakin raid-taulukoista, jotka voidaan tehdä tavallisista Kovalevyt parantaakseen juuri näiden levyjen ja koko tietokoneen toimintaa tai varmistaakseen tiedon tallennuksen luotettavuuden.

Tiedät todennäköisesti myös (ja jos et tiedä, sillä ei ole väliä), että näillä taulukoilla on erilaisia järjestysnumerot (0, 1, 2, 3, 4 jne.) ja toimivat myös melko hyvin erilaisia ​​toimintoja. Tämä ilmiö todella tapahtuu luonnossa ja, kuten olet ehkä arvannut, juuri näitä RAID taulukot, haluan kertoa sinulle tässä artikkelissa. Puhun jo siitä ;)

Mennä.

Mikä on RAID ja miksi sitä tarvitaan?

RAID- tämä on useiden laitteiden levyryhmä (eli monimutkainen tai halutessasi nippu), - kiintolevyt. Kuten edellä sanoin, tämä ryhmä lisää tietojen tallennuksen luotettavuutta ja/tai lisää tiedon luku-/kirjoitusnopeutta (tai molempia).

Itse asiassa, mitä tämä levypaketti tarkalleen tekee, eli nopeuttaa työtä tai lisää tietoturvaa, riippuu sinusta tai pikemminkin valinnastasi nykyinen kokoonpano raide(t). eri tyyppejä nämä kokoonpanot on vain merkitty eri numerot: 1, 2, 3, 4 ja siksi suorittavat erilaisia ​​toimintoja.

Yksinkertaisesti esimerkiksi rakentamisen tapauksessa 0 -voi-versio (muunnelmien kuvaus 0, 1, 2, 3 jne. - lue alla) Saat huomattavan suorituskyvyn lisäyksen. Ja ylipäätään HDD tänään ihan sama kapea kanava järjestelmän nopeudessa.

Miksi ylipäätään tapahtui

Kiintolevyt sen sijaan kasvavat vain volyymiltaan niiden pään pyörimisnopeuden vuoksi (poikkeuksena harvinaiset mallit, kuten esim. Raptor"ov) on jäätynyt melko pitkään merkin sisään 7200 , välimuisti ei myöskään kasva, arkkitehtuuri pysyy lähes samana.

Yleensä suorituskyvyn suhteen levyt seisovat paikallaan (vain kehittyvät voivat pelastaa tilanteen), mutta niillä on merkittävä rooli järjestelmän ja paikoin täysimittaisten sovellusten toiminnassa.

Kun kyseessä on yksikön rakentaminen (luvun merkityksessä 1 ). toinen ilman tappiota.

Yleensä toistan, että raidit ovat hyödyllisiä kaikille. Sanoisin jopa, että niitä tarvitaan :)

Mikä on RAID fyysisessä mielessä

Fyysisesti RAID-taulukko edustaa alkaen kaksi ennen n-:s määrä liitettyjä kiintolevyjä, jotka tukevat luomiskykyä RAID(tai vastaavaan ohjaimeen, mikä on harvinaisempaa, koska nämä ovat kalliita keskimääräiselle käyttäjälle (ohjaimia käytetään yleensä palvelimilla lisääntyneen luotettavuuden ja suorituskyvyn vuoksi)), ts. mikään ei muutu järjestelmäyksikön sisällä silmällä, ei yksinkertaisesti ole ylimääräisiä yhteyksiä tai yhteyksiä levyjen välillä tai johonkin muuhun.

Yleisesti ottaen laitteisto-osassa kaikki on melkein sama kuin aina, ja vain ohjelmistolähestymistapa muuttuu, mikä itse asiassa asettaa raidin tyypin valitsemalla tarkalleen kuinka kytkettyjen asemien tulisi toimia.

Ohjelmallisesti järjestelmässä raidin luomisen jälkeen ei myöskään ole erityisiä otuksia. Itse asiassa koko ero raidin kanssa työskentelyssä on vain pieni asetus, joka itse asiassa järjestää raidin (katso alla) ja kuljettajan käytössä. Muuten KAIKKI on täsmälleen sama - "Omassa tietokoneessani" sama C, D ja muut levyt, kaikki samat kansiot, tiedostot .. Yleensä ja ohjelmallisesti, silmän perusteella, täydellinen identiteetti.

Taulukon asentaminen ei ole mitään monimutkaista: ota vain emolevy, joka tukee tekniikkaa RAID, otamme kaksi täysin identtistä, - on tärkeää!, - sekä ominaisuuksien (koko, välimuisti, käyttöliittymä jne.) että levyn valmistajan ja mallin suhteen ja liitä ne tähän emolevyyn. Seuraavaksi käynnistä tietokone ja siirry kohtaan BIOS ja aseta parametri SATA-kokoonpano: RAID.

Sen jälkeen tietokoneen käynnistysprosessin aikana (yleensä ennen käynnistystä Windows) ilmestyy paneeli, joka näyttää tiedot levystä raidissa ja sen ulkopuolella, jossa itse asiassa sinun on napsautettava CTR-I määritä raid (lisää siihen levyjä, poista se jne.). Itse asiassa siinä kaikki. Sitten on muita elämän iloja, eli taas kaikki on kuten aina.

Tärkeä huomautus muistaa

Kun luot tai poistat raidin ( 1 -th raid ei näytä pätevän, mutta ei tosiasia) kaikki tiedot poistetaan väistämättä levyiltä, ​​ja siksi ei selvästikään kannata tehdä vain kokeilua luomalla ja poistamalla erilaisia ​​​​kokoonpanoja. Siksi ennen raidin luomista tallenna ensin kaikki tarvittavat tiedot(jos sellainen on) ja kokeile sitten.

Mitä tulee kokoonpanoihin... Kuten sanoin, RAID Tauluja on useita tyyppejä (ainakin pääpohjalta, tämä on RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Aluksi puhun kahdesta, tavallisimmista ja tavallisimmista käyttäjien keskuudessa:

  • RAID 0- levyryhmä nopeuden\record lisäämiseksi.
  • RAID 1- peililevyjärjestelmä.

Ja artikkelin lopussa käyn nopeasti läpi muut.

RAID 0 - mitä se on ja minkä kanssa sitä syödään?

Niin.. RAID 0(alias, raita ("Striping")) - käytetään kahdesta neljään (useammin - harvemmin) kiintolevyä, jotka käsittelevät yhdessä tietoja, mikä lisää suorituskykyä. Selvyyden vuoksi todettakoon, että yhdelle henkilölle on pidempi ja vaikeampi kantaa laukkuja kuin neljä (vaikka laukut pysyvät fyysisiltä ominaisuuksiltaan samoina, vain niiden kanssa vuorovaikutuksessa olevat voimat muuttuvat). Ohjelmallisesti tämän tyyppisen raidin tiedot jaetaan tietolohkoihin ja kirjoitetaan molemmille / useille levyille vuorotellen.

Yksi tietolohko yhdellä levyllä, toinen tietolohko toisella ja niin edelleen. Siten suorituskyky kasvaa merkittävästi (suorituskyvyn kasvun moninkertaisuus riippuu levyjen määrästä, eli 4. levyt toimivat nopeammin kuin kaksi), mutta koko taulukon tietoturva kärsii. Jos jokin niihin sisältyvistä epäonnistuu RAID kiintolevyt (eli kiintolevyt) menettivät kaiken tiedon lähes kokonaan ja peruuttamattomasti.

Miksi? Tosiasia on, että jokainen tiedosto koostuu tietystä määrästä tavuja .. joista jokainen kuljettaa tietoa. Mutta sisään RAID 0 yhden tiedoston tavumatriisi voi sijaita useilla levyillä. Näin ollen, jos yksi levyistä "kuolee", mielivaltainen määrä tavuja tiedostosta katoaa, ja sen palauttaminen on yksinkertaisesti mahdotonta. Mutta tiedosto ei ole yksin.

Yleensä, kun käytetään tällaista raid-taulukkoa, on erittäin suositeltavaa tehdä pysyvää arvokasta tietoa ulkoinen media. Raid tarjoaa todella konkreettista nopeutta - kerron tämän sinulle oma kokemus, koska sellainen onnellisuus on ollut kotonani jo vuosia.

RAID 1 - mikä se on ja minkä kanssa sitä syödään?

Entä RAID 1(Peilaus - "peili").. Itse asiassa aloitan haitasta. Toisin kuin RAID 0 näyttää siltä, ​​että "menetät" äänenvoimakkuutta toinen kova levy (sitä käytetään kirjoittamaan sille täysi (tavu tavulta) kopio ensimmäisestä kovalevy kun RAID 0 on täysin käytettävissä).

Etuna, kuten jo ymmärsit, on, että sillä on korkea luotettavuus, eli kaikki toimii (ja kaikki tiedot ovat luonnossa, eivätkä katoa yhden laitteen vikaantuessa) niin kauan kuin vähintään yksi levy toimii ts. vaikka yksi levy olisi töykeästi poistettu käytöstä, et menetä yhtään tavua tietoa, koska toinen on puhdas kopio ensimmäisestä ja korvaa sen, kun se epäonnistuu. Tällaista raidetta käytetään usein palvelimissa tietojen järjettömän elinvoimaisuuden vuoksi, mikä on tärkeää.

Tällä lähestymistavalla suorituskyvystä uhrataan ja henkilökohtaisten tunteiden mukaan se on jopa vähemmän kuin käytettäessä yhtä levyä ilman raideita. Joillekin luotettavuus on kuitenkin paljon tärkeämpää kuin suorituskyky.

RAID 2, 3, 4, 5, 6 - mikä se on ja minkä kanssa he syövät?

Näiden taulukoiden kuvaus on tässä yhtä paljon kuin ts. puhtaasti viitteeksi ja silloinkin pakattuna (itse asiassa vain toinen on kuvattu) muodossa. Miksi niin? Ainakin johtuen näiden taulukoiden alhaisesta suosiosta keskimääräisen (ja yleensä kaikkien muiden) käyttäjien keskuudessa ja sen seurauksena minulla on vähän kokemusta niiden käytöstä.

RAID 2 varattu taulukoille, jotka käyttävät tiettyä Hamming-koodia (en ollut kiinnostunut siitä, mikä se on, joten en kerro). Toimintaperiaate on suunnilleen tämä: tiedot kirjoitetaan vastaaviin laitteisiin samalla tavalla kuin kohdassa RAID 0 eli ne on jaettu pieniin lohkoihin kaikille levyille, jotka ovat mukana tietojen tallentamisessa.

Loput (erityisesti sille varatut) levyt tallentavat virheenkorjauskoodeja, joiden mukaan tiedot voidaan palauttaa kiintolevyn vian sattuessa. Tobish tämän tyyppisissä taulukoissa levyt on jaettu kahteen ryhmään - dataa ja virheenkorjauskoodeja varten

Sinulla on esimerkiksi kaksi levyä, jotka ovat paikka järjestelmälle ja tiedostoille, ja kaksi muuta on varattu kokonaan korjaustiedoille siltä varalta, että kaksi ensimmäistä levyä epäonnistuvat. Itse asiassa tämä on jotain nollaraidin kaltaista, vain kyvyllä jotenkin tallentaa tietoja, jos jokin kiintolevyistä vioittuu. Harvinaisen kallis - neljä levyä kahden sijasta erittäin kiistanalaisen tietoturvan parannuksella.

RAID 3, 4, 5, 6.. Heistä, vaikka se kuulostaakin oudolta tämän sivuston sivuilla, yritä lukea Wikipediasta. Tosiasia on, että elämäni aikana törmäsin näihin taulukoihin erittäin harvoin (paitsi että viides tuli käsille useammin kuin muut) enkä osaa kuvailla niiden työskentelyn periaatteita saavutettavin sanoin, mutta en todellakaan halua tulostaa artikkeli uudelleen yllä ehdotetusta resurssista, ainakin näiden raivostuneiden formulaatioiden läsnäolon vuoksi, jonka jopa minä ymmärrän narisemalla.

Mikä RAID kannattaa valita?

Jos pelaat pelejä, kopioit usein musiikkia, elokuvia, asennat tilavia resursseja kuluttavia ohjelmia, olet varmasti hyödyllinen RAID 0. Mutta ole varovainen kun valita kovaa levyt - tässä tapauksessa niiden laatu on erityisen tärkeää - tai muista tehdä varmuuskopiot ulkoisille tallennusvälineille.

Jos työskentelet arvokasta tietoa, jonka menettäminen merkitsee kuolemaa, niin tarvitset ehdottomasti RAID 1- on äärimmäisen vaikeaa menettää tietoja hänen kanssaan.

Toistan sen Erittäin on toivottavaa, että levyt on asennettu RAID ryhmä oli sukupuoli identtinen. Koko, yritys, sarja, välimuistin koko - kaiken tulisi mieluiten olla sama.

Jälkisana

Tässä ovat asiat.

Muuten, kirjoitin artikkelissa, kuinka tämä ihme kootaan: " Kuinka luoda RAID-ryhmä tavallisia menetelmiä ", mutta noin pari parametria materiaalissa" RAID 0 kahdesta SSD-levystä - käytännön testit Read Ahead- ja Read-välimuistin kanssa Käytä hakua.

Toivon vilpittömästi, että tämä artikkeli on hyödyllinen sinulle ja teet ehdottomasti itsellesi yhden tai toisen tyypin. Usko minua, se on sen arvoista.

Jos sinulla on kysymyksiä niiden luomisesta ja määrittämisestä, voit yleensä ottaa minuun yhteyttä kommenteissa - yritän auttaa (jos verkossa on ohjeita emolevyllesi). Olen myös iloinen kaikista lisäyksistä, toiveista, ajatuksista ja kaikesta muusta.

Muutama vuosi sitten varoitin, että RAID 5 lakkaa toimimasta vuonna 2009. Tietenkin palveluntarjoajat verkon tallennus eivät suosittele RAID 5:tä. He suosittelevat tällä hetkellä RAID 6:ta, joka suojaa kahdelta aseman häiriöltä ryhmässä. Mutta vuonna 2019 edes RAID 6 ei suojaa tietojasi. Siksi.

RAID 6 = (RAID 5) 2

Kirjoitin, että RAID 6:lla on myös rajoitettu käyttöikä:

…RAID 6 ei anna sinulle enempää suojaa muutamassa vuodessa kuin RAID 5 nykyään. Tämä ei ole RAID 6:n vika. Päinvastoin, se johtuu levykapasiteetin kasvusta ja kohtalokkaiden lukuvirheiden jatkuvasta määrästä.

Joulukuussa 2009 SUN-insinööri, flash-arkkitehti ja ZFS-kehittäjä Adam Leventhal teki analyysin RAID 6:n elinajanodoteesta toteuttamiskelpoisena tietosuojastrategiana. Hän julkaisi sen ACM-lehdessä artikkelissa "RAID Triple Parity and Beyond", joita käytän tässä artikkelissa.

Hyvä uutinen: Leventhal havaitsi, että RAID 6:n suojaustaso on yhtä hyvä vuoden 2019 aikana kuin RAID 5:n ennen.

Huono uutinen: Loewenthal oletti, että levyt olivat luotettavampia kuin ne todellisuudessa ovat. Joten aika voi olla jopa lyhyempi, jos levyvalmistajat eivät hyppää mukaan. Ja toinen hyviä uutisia: yhdellä yrityksistä on jo tällainen levy - ja minä kerron sinulle, kuka se on.

Ongelman ydin

RAID-ryhmä on ohjain (tai ohjelma), joka yhdistää ryhmän levyjä yhdeksi iso levy käyttämällä matemaattiset kaavat. Ohjain lisää asemiin lisälohkoja tarkistussummat, jotta yhden tai kahden levyn katoaminen ei johda tietojen katoamiseen (tästä lähtien puhumme RAID 5 ja 6 -ryhmistä, ei RAID 0, 1 tai 10). Tarkistussummien avulla voit palauttaa tietoja levyltä, jotka ovat pudonneet taulukosta, ja kun vaihdat levyn, rekonstruoida sen sisältö.

RAID 5:n ongelma on, että kiintolevyillä on lukuvirheitä. SISÄÄN SATA-asemat spesifikaatio sallii korjaamattoman lukuvirhesuhteen (URE) 10 14 . Tämä tarkoittaa, että kerran 10 14 bittiä kohden asema ei yksinkertaisesti pysty lukemaan tietoja.

10 14 bittiä = 100000000000000/8/512 sektoria = 24414062500 sektoria

2 Tt:n levyn todellinen koko = 3 907 029 168 sektoria

Kun RAID 5 -ryhmässä on 7 SATA-asemat 2 Tt yksi kiintolevy epäonnistuu, joten sinulla on 6 2 Tt kiintolevyä. Ja kun RAID-ohjain suorittaa uudelleenmuodostusta, on erittäin todennäköistä, että tapahtuu lukuvirhe (URE). Tämän virheen jälkeen RAID-ryhmän uudelleen rakentaminen on mahdotonta.

Todennäköisyys, että uudelleenrakennus päättyy onnistuneesti: (1 - 1 / (24 414 062 500)) ^ (6 * 3 907 029 168) ≈ 0,38

Yhteensä seitsemän SATA-aseman RAID5-ryhmässä, jossa on yksi viallinen asema, on 62 %:n todennäköisyys tietojen menettämiseen kohtalokkaan lukuvirheen vuoksi.

RAID 6

RAID 6 ratkaisee tämän ongelman luomalla toisen tarkistussumman. Voit menettää yhden aseman, havaita URE-lukuvirheen ja silti rakentaa uudelleen onnistuneesti.

Todennäköisyys, että RAID6-uudelleenrakennus 7 SATA-asemassa onnistuu: ((1 – 1 /(24 414 062 500)) ^ (6*3 907 029 168))+(1-(1 – 1 /(24 414 062 500) )) ^ (6*3 907 029 168))*((1 – 1 /(24 414 062 500)) ^ (5*3 907 029 168)) ≈ 0,66

Mikä on ongelma?

Ongelmia on useita:

  • Pitkä sarjan uudelleenrakennusaika. Kun kiintolevyjen kapasiteetti kasvaa, niin myös uudelleenrakennusaika kasvaa. 7200 RPM:n data-aseman keskinopeus on noin 115 Mt/s - ja kirjoitusnopeus laskee aseman täyttyessä - palautumiseen menee vähintään 5 tuntia huono ajo. Mutta useimmilla matriiseilla ei ole varaa rakentaa uudelleen nopeimmalla mahdollisella uudelleenrakennusnopeudella, joten uudelleen rakentaminen kestää yleensä 2-5 kertaa kauemmin.
  • Lisää piilotettuja bugeja. Yritystaulukot käyttävät taustalevyn puhdistamista löytääkseen ja korjatakseen mahdollisia virheitä levyä ennen kuin ne tuntevat itsensä. Mutta kun levytila ​​lisääntyy, levyn puhdistaminen kestää kauemmin. SISÄÄN suuri joukko levyä ei ehkä tarkisteta kuukausiin, mikä tarkoittaa lisää bugeja kun rakennetaan uudelleen taulukkoa.
  • Levyjen vikojen välinen suhde. RAID:n kannattajat olettivat, että asemahäiriöt olivat itsenäisiä tapahtumia. Mutta vuosien kokemus on osoittanut, että näin ei ole: yhden aseman epäonnistuminen taulukossa tekee toisen aseman epäonnistumisesta paljon todennäköisemmin.

Yksinkertaistaminen: isot ajot= pidempi uudelleenrakennus + enemmän piilotettuja virheitä -> suurempi mahdollisuus RAID 6:n epäonnistumiseen.

Leventhalin ennuste RAIDin suhteellisesta luotettavuudesta yksi- ja kaksoispariteetilla

Vuoteen 2019 mennessä RAID 6 ei ole enää luotettavampi kuin RAID 5 nykyään.

johtopäätöksiä

Yrityskäyttäjille tämä tulos on hyödyllistä tietoa. Vaikka kolmoispariteetti taulukoissa ratkaisee tietoturvaongelman, on tehtävä merkittäviä kompromisseja.

Harkitse 21 levyn ryhmää. Pelkästään taulukon uudelleen rakentamiseen menee viikko, joten keskimäärin taulukko toimii aina rajoitettu tila palautus (heikentynyt uudelleenrakennustila). Täysi siirtymä 2,5" vanteilla? Miljoonien dollareiden arvoisten nykyisten taulukoiden toiminnallinen vanhentuminen?

Tavalliset käyttäjät voivat rentoutua. Home RAID on ensinnäkin huono idea, tee se useammin varmuuskopiot levyltä levylle ja käytä online-varmuuskopiointipalveluita arvokkaiden tietojen saamiseksi.

Ja viimeinen kohta, Leventhal käytti laskelmissaan levyn virheprosenttia 10 ^ 16. Tämä koskee pieniä, nopeita ja kalliita yrityskiintolevyjä, mutta useimmissa tavallisissa SATA2-asemissa on URE:t, jotka ovat suuruusluokkaa pienempiä 10^14. Yhtä poikkeusta lukuun ottamatta: yrityksen WD20EADS Caviar Green -pyörämalli länsimainen digitaalinen spesifikaation mukaan sen URE-kerroin on 10^15.

Taso 5 on joukko itsenäisiä levyjä, joissa on hajautettu tarkistussummamuisti.

Tietolohkot ja tarkistussummat kirjoitetaan ympyrään kaikille taulukon levyille, joten levykokoonpanossa ei ole epäsymmetriaa. Tällainen järjestelmä ei vaadi erillistä levyä tarkistussummatietojen tallentamiseen.

Äänenvoimakkuus levyryhmä RAID5 lasketaan kaavalla (n-1)*V.hdd , jossa n on taulukossa olevien asemien lukumäärä ja V.hdd on pienimmän aseman koko. Siksi RAID 5:n rakentamisen tapauksessa kaikkien ryhmän levyjen on oltava samankokoisia. Jossa tuloksena olevaa kapasitanssia kirjoitettavan levyn alijärjestelmää pienennetään tasan yhdellä levyllä. Esimerkiksi, jos viisi levyä on 10 Gt, taulukon todellinen koko on 40 Gt, koska 10 Gt on varattu pariteettitiedoille.

RAID 5:llä, kuten RAID 4:llä, on itsenäinen pääsyarkkitehtuuri. RAID 3:een verrattuna se tarjoaa iso koko loogiset lohkot tiedon tallentamiseen. Siksi, kuten RAID 4:n tapauksessa, tällainen ryhmä tarjoaa suurimman hyödyn, kun käsitellään useita pyyntöjä samanaikaisesti. Yhteenvetona eduista voidaan sanoa seuraavaa - RAID 5:ssä ylimääräisiä laskentaresursseja käytetään tietojen tallentamiseen ja sen seurauksena suorituskyky laskee. Mutta kun luet (verrattuna erilliseen HDD-asema) on suorituskykyetu, koska useilta taulukon levyiltä peräisin olevia tietovirtoja käsitellään rinnakkain.

Puutteista se on syytä huomata RAID-suorituskyky Tämä taso pienenee 10-25 % verrattuna RAID 1:een satunnaisessa kirjoituksessa (kirjoittaa satunnaisessa järjestyksessä), koska se vaatii enemmän levytoimintoja, koska jokainen palvelimen kirjoitustoiminto korvataan RAID-ohjaimessa kolmella - yhdellä lukutoiminnolla ja kahdella kirjoittaa operaatioita.

Jos jokin levyistä epäonnistuu, taulukon luotettavuus putoaa katastrofaalisesti RAID 0 -tasolle (kun tiedot kirjoitetaan peräkkäin useille levyille ilman redundanssia). Samaan aikaan, mitä suurempi määrä levyjä on taulukossa, sitä pienempi luotettavuus, se pienenee levyjen lukumäärän kerrannaisina. Tällä hetkellä järjestelmä on kriittisessä tilassa. kaikkiin luku- ja kirjoitustoimintoihin liittyy lisäkäsittelyjä. Jos 2. levy epäonnistuu tai yksinkertainen virhe lukeminen - matriisi tuhoutuu eikä tietoja voida palauttaa perinteisillä menetelmillä.

On myös otettava huomioon, että tietojen palautusprosessi minkä tahansa taulukon levyn vian jälkeen aiheuttaa intensiivisen lukukuorman levyiltä pitkään. Tämä voi aiheuttaa sen, että yksi asemista epäonnistuu tämän haavoittuvimman RAID-toiminnan aikana, sekä paljastaa aiemmin havaitsemattomia lukuvirheitä hitaissa tietoryhmissä, mikä lisää epäonnistumisen riskiä tietojen eheyden palautuksen aikana.

RAID5:n järjestämiseen tarkoitettujen levyjen vähimmäismäärä on 3


Olemme kohdanneet sellaisen ongelman, että useimmissa ohjelmiemme käyttäjien ostamissa palvelimissa on RAID 5:ssä määritetty levyryhmä. järjestelmänvalvojat eivät halua tuhlata aikaa konfigurointiin tai pelkäävät yksinkertaisesti muuttaa jotain jo määritetyssä ja toimivassa tietokoneessa. Tämän seurauksena tällaiselle palvelimelle asennetun tietokannan kanssa työskentelyn suorituskyky osoittautuu heikommaksi kuin vanhalla, joka työskenteli yrityksessä 3-4 vuotta. Todennäköisesti myyjien halu määrittää levyryhmä viidennen tason RAIDissa voidaan selittää halulla yllättää asiakas valtavalla koolla. levytila. Järjestelmänvalvojat puolestaan ​​eivät usein yksinkertaisesti tiedä, miten yhden tai toisen tason RAID-ryhmä toimii. Tämän artikkelin tarkoitus on vastata kahteen kysymykseen:

Miksi RAID 5:tä ei voida käyttää tietokantapalvelimena?

Mikä on paras tapa määrittää RAID-ohjain isännöimään Firebird-palvelintietokantaa?

Tehdään heti varaus, että tässä artikkelissa tehdyt johtopäätökset eivät päde niissä harvoissa tapauksissa, joissa tietokantaa käytetään yksinomaan (tai pääasiassa) lukemiseen.

Miten RAID 5 toimii?

Tarkastellaan yksinkertaistettua kaaviota neljän levyn joukon toiminnasta. Yksi levyistä on varattu tallentamaan tarkistussumma. Kolme on käytettävissä tietojen sijoittamiseen. Alla olevassa kuvassa hyötykuorma-asemat on nimetty A, B ja C. Asema D tallentaa tarkistussummat.

Kutsutaan vähimmäismäärää tietoa, jonka ohjain lukee yhdeltä levyltä tai kirjoittaa sille nauhat(nauha). Useimpien kohtaamiemme säätimien parametrit eivät osoita nauhan kokoa, vaan kokoa raita(raita) - tietolohko, joka jaetaan kaikille taulukon levyille. Alla olevassa kuvassa yksi raita on korostettu tummemmalla värillä:


Raidan koko on yhtä suuri kuin raidan koko kerrottuna taulukossa olevien levyjen lukumäärällä. Nuo. kun kyseessä on neljä levyä ja raitakoko 64K, pienin tietomäärä, jonka ohjain pystyy kirjoittamaan tai lukemaan levyltä, on 64/4 = 16K.

Asemaan D menevä tarkistussumma lasketaan seuraavalla kaavalla:

D = Axor Bxor C

Transitiivisuuden ansiosta xor-toiminnot jos jokin hyödyllisiä tietoja sisältävä levy epäonnistuu, se voidaan palauttaa xor-amalla jäljellä olevien levyjen tiedot, mukaan lukien levy, jossa on tarkistussumma. Esimerkiksi levy B epäonnistui.


Kun ohjain pyytää tietolohkoa levyltä B, ohjain palauttaa sen seuraavan kaavan mukaan:

B = Axor Cxor D

Firebird-palvelin kommunikoi levyn alijärjestelmä tietosivut. Optimaalinen koko Sivun koko on useimmissa tapauksissa 8K, mikä on paljon pienempi kuin raidan koko ja useimmissa tapauksissa jopa pienempi kuin nauhan koko. Myös tilanteet, joissa peräkkäisiä sivuja kirjoitetaan levylle, ovat melko harvinaisia. Jos siis esimerkissämme tiedot kirjoitetaan levylle A, ohjaimen on suoritettava seuraavat toiminnot:

  1. Lue liuskatiedot asemista B ja C. Kaksi lukutoimintoa.
  2. Laske uusi tarkistussumma. Kaksi xor-operaatiota.
  3. Kirjoita tiedot asemaan A ja tarkistussumma asemaan D. Kaksi kirjoitusoperaatiota.

Yhteensä, kaksi lukua, kaksi kirjoitusta ja kaksi xor-operaatiota. Olisi yllättävää, jos näin työmäärän vuoksi yleinen suoritus ei pudonnut. Nyt käy selväksi, miksi RAID 5 ei sovellu tietokantatiedoston isännöintiin.

tärkeä RAID-ominaisuus 5 on merkittävä suorituskyvyn lasku kun jokin taulukon levyistä epäonnistuu. Loppujen lopuksi nyt tietojen palauttamiseksi tältä levyltä on tarpeen lukea ja tarkistaa tiedot kaikista muista levyistä.

Kuitenkin, kuten kaikilla säännöillä, myös meillä on poikkeuksensa. RAID 5 -levyryhmän suorituskyky ei heikkene, jos ohjaimen haihtumattoman välimuistin koko on verrattavissa tietokantatiedoston kokoon. Esimerkiksi 512 Mt:n välimuistin koolla on täysin mahdollista käyttää viidennen tason RAID-ryhmää 1-1,5 Gt asti. Edellyttäen, että palvelin on tarkoitettu vain työskentelemään tietokannan kanssa eikä suorita muita tehtäviä.

On syytä huomata, että yllä oleva RAID 5:n toimintasuunnitelma metodologisista syistä vakavasti yksinkertaistettuna. Todellisuudessa ohjain jakaa raidat syklisesti kaikille taulukon levyille, joten tarkistussummien tallentamiseen ei ole omistettua levyä. Kaikki levyt tallentavat sekä dataa että eri raitojen tarkistussummia, mikä mahdollistaa niiden kuormituksen tasaamisen.

Mikä RAID-taso valita?

Jos RAID 5 ei sovellu, mikä taso minun pitäisi valita tietokantatiedoston isännöimiseksi? Jos levyjen määrä on alle neljä, ainoa vaihtoehto on peili (peili) - RAID 1. Jos ryhmässä on neljä tai enemmän levyjä, niin RAID 10 on suorituskyvyn ja luotettavuuden kannalta optimaalinen - yhdistämällä (RAID 0) useita peilit (RAID 1). Joskus voit nähdä oikeinkirjoituksen muodossa RAID 1 + 0. Alla oleva kuva näyttää RAID-ryhmä 10 neljästä levystä. Yhden raidan tiedot on korostettu tummalla sävyllä. Viivoitus näyttää tämän raidan kaksoiskappaleen.

Huomaa myös, että jos RAID 5 -ryhmä voi selviytyä vain yhden levyn katoamisesta, kahden levyn m peilin RAID 10 selviää yhdestä m levyyn, edellyttäen, että enintään yksi levy kussakin peilissä epäonnistuu.

Yritetään verrata kvantitatiivisesti RAID 5- ja RAID 10 -ryhmiä, joissa kussakin on n levyä. n on kahden kerrannainen. Otetaan luku/kirjoitustietolohkon koko yhtä suureksi kuin nauhan koko. Alla olevassa taulukossa näkyy tarvittava luku-/kirjoitustoimintojen määrä ja tiedonkeruu.


On selvästi nähtävissä, että RAID 10 -ryhmässä ei ole vain enemmän korkea suorituskyky kirjoitusten aikana, mutta se ei myöskään salli yleistä suorituskyvyn heikkenemistä, jos yksittäinen levy epäonnistuu.

Kuinka asentaa RAID-ohjain?

Välimuistin koko

Mitä isompi sen parempi. Tärkeintä on, että ohjaimessa on paristo (akku), joka tallentaa muistin sisällön hätävirtakatkon aikana. Monissa ohjaimissa akku ei sisälly vakiovarusteisiin ja se on tilattava erikseen. Ilman akkua kirjoitusvälimuisti poistetaan käytöstä.

RAID-taso

RAID 10. Jos levyjen määrä on alle neljä, niin RAID 1 (peili). Miksi? Lue artikkeli alusta alkaen.

Raidan koko

Tietokannan sivun koko kerrottuna taulukon peilien määrällä. Jos taulukossa on esimerkiksi 8 levyä, jotka on yhdistetty neljään kahden levyn peiliin ja tietokannan sivun koko on 8 kt, raidan kooksi tulee asettaa 8 * 4 = 32 kt.

Ennakkoluku

Koska peräkkäinen pääsy tietokantasivuille on erittäin harvinaista, ja ne itse voivat pirstoutumisen seurauksena olla sisään eri paikkoja levylle, eteenpäinluku on poistettava käytöstä tai adaptiivista tilaa tulisi käyttää (ennakkoluu, jos käytetään kahta peräkkäistä sivua peräkkäin).

Kirjoita välimuistikäytäntö

Valitse takaisinkirjoitustila. Tiedot tallennetaan välimuistiin ja kirjoitetaan sitten levylle. Kirjoitustoiminto katsotaan suoritetuksi välittömästi sen jälkeen, kun tiedot on sijoitettu välimuistiin.

Varalevy

Jos ohjaimen ominaisuudet sallivat, on suositeltavaa sisällyttää taulukkoon varmuuskopiolevy. Sellainen levy normaalitila työ on valmiustilassa. Jos jokin toimiva kiintolevy epäonnistuu, varmuuskopiolevy lisätään automaattisesti joukkoon.

© Andrey Egorov, 2005, 2006. TIM-yritysryhmä.

Foorumin vierailijat kysyvät meiltä kysymyksen: "Mikä on luotettavin RAID-taso?" Kaikki tietävät, että RAID5 on yleisin taso, mutta se ei suinkaan ole vailla vakavia puutteita, jotka eivät ole ilmeisiä ei-asiantuntijoille.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 tai mitkä ovat RAID-tasot?

Artikkelissani yritän luonnehtia suosituimpia RAID-tasoja ja muotoilla sitten suosituksia näiden tasojen käytöstä. Tämän artikkelin havainnollistamiseksi olen rakentanut kaavion, joka sijoittaa nämä tasot luotettavuuden, suorituskyvyn ja kustannustehokkuuden kolmiulotteiseen tilaan.

JBOD(Just a Bunch of Disks) on yksinkertainen kiintolevyjen jako, joka ei ole muodollisesti RAID-taso. JBOD-taltio voi olla yhden levyn joukko tai useiden levyjen yhdistelmä. RAID-ohjain Mitään laskelmia ei vaadita toimimaan tällaisella tilavuudella. Kaaviossamme JBOD toimii "tavallisena" tai lähtökohtana - sen luotettavuus, suorituskyky ja kustannusarvot ovat samat kuin yksittäisen kiintolevyn.

RAID 0("Striping") ei ole redundanssia, ja se jakaa tiedot kerralla kaikille taulukkoon sisältyville levyille pienten lohkojen ("raitojen") muodossa. Tämä parantaa huomattavasti suorituskykyä, mutta kärsii luotettavuudesta. Kuten JBOD:n tapauksessa, saamme rahoillamme 100% levykapasiteetista.

Sallikaa minun selittää, miksi minkä tahansa yhdistelmätaltion tietojen tallennuksen luotettavuus heikkenee - koska jos jokin sen sisältämistä kiintolevyistä epäonnistuu, kaikki tiedot menetetään kokonaan ja peruuttamattomasti. Todennäköisyysteorian mukaan RAID0-taltion luotettavuus on matemaattisesti yhtä suuri kuin sen muodostavien levyjen luotettavuuden tulo, joista jokainen on pienempi kuin yksi, joten kokonaisluotettavuus on selvästi pienempi kuin minkä tahansa levyn luotettavuus. .

Hyvä taso - RAID 1("peilaus", "peili"). Sillä on suojaus puolet käytettävissä olevista laitteistoista (yleensä toinen kahdesta kiintolevystä) vikaantumiselta, se tarjoaa hyväksyttävän kirjoitusnopeuden ja lukunopeuden vahvistuksen kyselyn rinnakkaistamisen ansiosta. Haittapuolena on, että joudut maksamaan kahden kiintolevyn kustannukset, jolloin saadaan yhden kiintolevyn käyttökapasiteetti.

Aluksi oletetaan, että kiintolevy on luotettava asia. Näin ollen kahden levyn vian todennäköisyys kerralla on yhtä suuri (kaavan mukaan) todennäköisyyksien tulon kanssa, ts. suuruusluokkaa pienempi! Valitettavasti, oikea elämä- ei teoria! Kaksi kiintolevyä otetaan samasta erästä ja ne toimivat samoissa olosuhteissa, ja jos yksi levyistä epäonnistuu, jäljellä olevan levyn kuormitus kasvaa, joten käytännössä, jos yksi levyistä epäonnistuu, on ryhdyttävä kiireellisiin toimenpiteisiin - redundanssin palauttamiseksi uudelleen. Tätä varten on suositeltavaa käyttää kuumaa varalevyä millä tahansa RAID-tasolla (paitsi nolla). hotspare. Tämän lähestymistavan etuna on säilyttää pysyvä luotettavuus. Haittapuolena ovat vielä suuremmat kustannukset (eli 3 kiintolevyn hinta yhden levyn tallentamiseen).

Peili monissa asemissa on taso RAID 10. Tätä tasoa käytettäessä peilatut levyparit asettuvat "ketjuun", joten tuloksena olevan taltion tilavuus voi ylittää yhden kiintolevyn kapasiteetin. Edut ja haitat ovat samat kuin RAID1-tasolla. Kuten muissakin tapauksissa, on suositeltavaa sisällyttää HotSpare hot varaosat joukkoon siten, että yksi varaosa viidelle työntekijälle.

RAID 5, todellakin suosituin tasoista - pääasiassa sen taloudellisuuden vuoksi. Uhraamalla redundanssin vuoksi vain yhden levyn kapasiteetista ryhmästä, saamme suojan minkä tahansa taltion kiintolevyn vikoja vastaan. Tietojen kirjoittaminen RAID5-taltiolle maksaa lisäresurssit, koska lisälaskelmia tarvitaan, mutta luettaessa (verrattuna erilliseen kiintolevyyn) tulee vahvistusta, koska useiden taulukkoasemien tietovirrat rinnastetaan.

RAID5:n haitat ilmenevät, kun yksi levyistä epäonnistuu - koko asema menee kriittiseen tilaan, kaikkiin kirjoitus- ja lukutoimintoihin liittyy lisäkäsittelyjä, suorituskyky laskee jyrkästi, levyt alkavat lämmetä. Jos et ryhdy kiireellisiin toimiin, voit menettää koko äänenvoimakkuuden. Siksi (katso yllä) Hot Spare -asemaa on käytettävä RAID5-taltion kanssa.

Perusasioiden lisäksi RAID-tasot 0 - RAID5, standardissa kuvattu, on yhdistetty tasoja RAID10, RAID30, RAID50, RAID15, jotka eri valmistajia tulkita jokainen omalla tavallaan.

Tällaisten yhdistelmien olemus lyhyesti on seuraava. RAID10 on yhden ja nollan yhdistelmä (katso yllä). RAID50 on 5. tason "0"-taltioiden ryhmittely. RAID15 on "viiden" "peili". Ja niin edelleen.

Siten yhdistetyt tasot perivät "vanhempiensa" edut (ja haitat). Joten "nollan" esiintyminen tasolla RAID 50 ei lisää siihen luotettavuutta, mutta sillä on positiivinen vaikutus suorituskykyyn. Taso RAID 15, luultavasti erittäin luotettava, mutta se ei ole nopein ja lisäksi erittäin epätaloudellinen (taltion käyttökapasiteetti on alle puolet alkuperäisen levyryhmän koosta).

RAID 6 eroaa RAID 5:stä siinä, että jokainen tietorivi (englanniksi raidat) ei ole yhtä, mutta kaksi tarkistussummalohko. Tarkistussummat ovat "moniulotteisia", ts. toisistaan ​​riippumattomia, joten jopa kahden levyn epäonnistuminen taulukossa antaa sinun tallentaa alkuperäiset tiedot. Reed-Solomon-tarkistussummalaskenta vaatii RAID5:een verrattuna intensiivisempiä laskelmia, joten kuudetta tasoa ei käytännössä käytetty aiemmin. Nyt sitä tukevat monet tuotteet, koska he alkoivat asentaa erikoistuneita mikropiirejä, jotka suorittavat kaikki tarvittavat matemaattiset toiminnot.

Joidenkin tutkimusten mukaan suurista SATA-asemista (400 ja 500 gigatavua) koostuvan RAID5-taltion yhden aseman vian jälkeinen palautuminen päättyy 5 prosentissa tapauksista tietojen menetykseen. Toisin sanoen yhdessä tapauksessa kahdestakymmenestä Hot Spare -levyllä olevan RAID5-ryhmän uudelleenmuodostuksen aikana toinen levy saattaa epäonnistua... Tästä syystä parhaiden RAID-ajurien suositukset: 1) Aina tehdä varmuuskopioita; 2) käyttää RAID6!

Uusia tasoja RAID1E, RAID5E, RAID5EE on ilmestynyt hiljattain. "E" nimessä tarkoittaa Tehostettu.

RAID level-1 Enhanced (RAID level-1E) yhdistää peilaus ja datan raidoitus. Tämä tasojen 0 ja 1 sekoitus on järjestetty seuraavasti. Rivin tiedot jakautuvat täsmälleen kuten RAID 0:ssa. Eli tietorivillä ei ole redundanssia. Seuraava datalohkorivi kopioi edellisen yhden lohkon siirrolla. Siten, kuten vakiotila RAID 1 jokaisessa tietolohkossa on peilikopio jollakin levyllä, joten taulukon käyttökelpoinen koko on yhtä suuri kuin puolet datan kokonaismäärästä. kova joukko levyjä. RAID 1E vaatii kolmen tai useamman aseman yhdistämisen.

Pidän todella RAID1E-tasosta. Tehokas grafiikka työasema tai edes varten kotitietokoneoptimaalinen valinta! Siinä on kaikki nolla- ja ensimmäisen tason edut - erinomainen nopeus ja korkea luotettavuus.

Jatketaan tasolle RAID level-5 Enhanced (RAID level-5E). Tämä on sama kuin RAID5, vain ryhmään sisäänrakennetulla varalevyllä. vara-ajo. Tämä upottaminen suoritetaan seuraavasti: taulukon kaikilla levyillä jätetään 1/N vapaata tilaa, joka, jos jokin levyistä epäonnistuu, käytetään kuumana varaosana. Tämän ansiosta RAID5E osoittaa luotettavuuden ohella Parempi suorituskyky, koska lukeminen / kirjoittaminen tapahtuu rinnakkain lisää asemat samaan aikaan ja varalevy ei ole tyhjäkäynnillä, kuten RAID5:ssä. On selvää, että taltioon sisältyvää varalevyä ei voida jakaa muiden taltioiden kanssa (omistettu vs. jaettu). RAID 5E -taltio on rakennettu vähintään neljälle fyysisiä levyjä. Loogisen tilavuuden käyttökelpoinen koko lasketaan kaavalla N-2.

RAID-taso-5E Enhanced (RAID-taso-5EE) samanlainen kuin RAID level-5E, mutta siinä on tehokkaampi varalevyn varaus ja sen seurauksena nopeampi palautusaika. Kuten RAID5E-taso, tämä RAID-taso jakaa tietolohkot ja tarkistussummat riveihin. Mutta se myös varaa ilmaisia ​​varalevylohkoja, eikä vain jätä osaa levytilasta näihin tarkoituksiin. Tämä vähentää aikaa, joka tarvitaan RAID5EE-taltion eheyden rekonstruoimiseen. Taltion mukana olevaa varalevyä ei voi jakaa muiden taltioiden kanssa - kuten edellisessä tapauksessa. RAID 5EE -taltio on rakennettu vähintään neljälle fyysiselle levylle. Loogisen tilavuuden käyttökelpoinen koko lasketaan kaavalla N-2.

Kummallista kyllä, tasosta ei mainita RAID 6E En löytänyt sitä Internetistä - toistaiseksi yksikään valmistaja ei ole tarjonnut tai edes ilmoittanut tätä tasoa. Mutta RAID6E (tai RAID6EE?) tasoa voidaan ehdottaa samalla periaatteella kuin edellinen. Levy hotspare Välttämättä on oltava minkä tahansa RAID-taltion mukana, mukaan lukien RAID 6. Emme tietenkään menetä tietoja, jos yksi tai kaksi levyä epäonnistuu, mutta on erittäin tärkeää aloittaa taulukon eheyden uudelleen luominen mahdollisimman pian, jotta järjestelmä saadaan nopeasti esiin. "kriittisestä" tilasta. Koska Hot Spare -levyn tarve on meille kiistaton, olisi loogista mennä pitemmälle ja "tahistaa" se samalla tavalla kuin RAID 5EE:ssä, jotta saadaan hyödyt käyttöön. lisää levyt ( paras nopeus lue-kirjoita tai enemmän nopea palautuminen eheys).

RAID-tasot "numeroissa".

Taulukkoon olen kerännyt joitain tärkeitä parametreja lähes kaikilla RAID-tasoilla, jotta voit verrata niitä toisiinsa ja ymmärtää paremmin niiden olemusta.

Taso
~~~~~~~

mökki-
koskettaa-
ness
~~~~~~~

Käyttää-
levykapasiteetin luokitus
~~~~~~~

Tuotanto
ditel-
ness
lukeminen

~~~~~~~

Tuotanto
ditel-
ness
levyjä

~~~~~~~

Sisäänrakennettu
levy
varata

~~~~~~~

Min. levyjen määrä
~~~~~~~

Max. levyjen määrä

~~~~~~~

exc

exc

exc

exc

Kaikki "peilitasot" ovat RAID 1, 1+0, 10, 1E, 1E0.

Yritetään vielä kerran ymmärtää perusteellisesti, kuinka nämä tasot eroavat toisistaan?

RAID 1.
Tämä on klassinen peili. Kaksi (ja vain kaksi!) Kovalevyt toimivat yhtenä kokonaisuutena toistensa kopiona. Kummankaan aseman vikaantuminen ei johda tietojen menettämiseen, sillä ohjain jatkaa työskentelyä jäljellä olevan aseman kanssa. RAID1 numeroina: 2x redundanssi, 2x luotettavuus, 2x hinta. Kirjoituskyky vastaa yhden kiintolevyn suorituskykyä. Lukukyky on parempi, koska ohjain voi jakaa lukemat kahdelle asemalle.

RAID 10.
Tämän tason ydin on, että taulukon levyt yhdistetään pareittain "peileiksi" (RAID 1), ja sitten kaikki nämä peiliparit puolestaan ​​yhdistetään yhteiseksi raidaksi (RAID 0). Siksi sitä joskus kutsutaan RAID 1+0. Tärkeä pointti– RAID 10:ssä vain parillinen määrä levyjä voidaan yhdistää (vähintään - 4, enintään - 16). Edut: luotettavuus peritään "peilistä", "nollasta" - sekä luku- että kirjoitussuorituskyky.

RAID 1E.
Kirjain "E" nimessä tarkoittaa "Enhanced", ts. "parantunut". Tämän parannuksen periaate on seuraava: tiedot "raidataan" lohkoiksi kaikille taulukon levyille ja sitten "lomitetaan" uudelleen yhden levyn siirrolla. RAID 1E:ssä voit yhdistää kolmesta 16 levyyn. Luotettavuus vastaa "kymmeniä", ja suuremman "vuorottelun" ansiosta suorituskyky paranee hieman.

RAID 1E0.
Tämä taso toteutetaan seuraavasti: luomme "nolla"-taulukon RAID1E-taulukoista. Siksi levyjen kokonaismäärän on oltava kolmen kerrannainen: vähintään kolme ja enintään kuusikymmentä! Tässä tapauksessa emme todennäköisesti saa etua nopeudesta, ja toteutuksen monimutkaisuus voi vaikuttaa haitallisesti luotettavuuteen. Suurin etu on kyky yhdistää erittäin suuri (jopa 60) levymäärä yhdeksi ryhmäksi.

Kaikkien RAID 1X -tasojen samankaltaisuus piilee niiden redundanssiindikaattoreissa: tasan 50 % ryhmän kokonaislevykapasiteetista uhrataan luotettavuuden vuoksi.