Informatiecapaciteit van de harde schijf: wat is het?

Informatiecapaciteit harde schijf- een belangrijk concept voor dataopslagsystemen. Daarachter ligt het volledige volume van de schijf. Nu zijn twee methoden om het te berekenen wijdverspreid geworden. Ze geven verschillende resultaten en het is niet bedreven in deze kwestie misleidt gebruikers.

Wat is het probleem?

Een persoon verwerkt informatie op een manier die zich historisch heeft ontwikkeld, en niemand wil dit opgeven. Het is handiger voor ons. Het bestaat uit cijfers van 0 tot en met 9 (sommige mensen tellen van 1 tot en met 10, maar dit verandert niets aan de essentie). Maar de computer verwerkt gegevens daarin. Het is gebaseerd op 0 (geen signaal) en 1 (aanwezigheid van spanning). Dus het blijkt die informatie te zijn harde capaciteit schijf kan binair of decimaal worden bepaald. In dit geval moet er rekening mee worden gehouden belangrijk punt. In de eerste daarvan is 1 kilobyte 2 10 of 1024 bytes. Programmeurs gebruiken deze waarde, en dit is hoe alle Windows-besturingssystemen tegenwoordig de hoeveelheid informatie bepalen. Maar in het tweede geval is deze waarde gelijk aan 10 3 of 1000 bytes. Dit is hoe mensen en aandrijffabrikanten over de informatie denken. Zoals gemakkelijk te begrijpen is, kan een persoon kopen harde schijf met dezelfde kenmerken, en het Windows-besturingssysteem zal hem iets andere informatie tonen. In dit geval zal de informatiecapaciteit van de harde schijf voor het binaire systeem kleiner zijn en voor het decimale systeem groter. Maar de hoeveelheid blijft ongewijzigd. De beslissende factor in dit geval is op welke manier er moet worden geteld.


Herberekening

Laten we opnieuw berekenen met behulp van het voorbeeld van een schijf van 500 GB (volgens de fabrikant) en het verliespercentage bepalen. Laten we eerst verduidelijken dat het voorvoegsel "giga" in decimaal systeem betekent 10 9, en in binair betekent het 2 30. Vermenigvuldig eerst 500 GB met 10 9. Dit geeft je de grootte in bytes. Om naar toe te gaan binair systeem we moeten de resulterende waarde 500 x 10 9 delen door 2 30, en we krijgen 465 GB. Dit zal de informatiecapaciteit van de harde schijf zijn nieuw systeem. Vervolgens bepalen we het percentage verliezen tijdens de overgang daartussen. Om dit te doen, trekt u 465 GB af van 500 GB en deelt u de resulterende waarde door 500 GB. Het resultaat is 0,07. Als we deze waarde met 100 vermenigvuldigen, vinden we het verschil als percentage. Het zal 7% zijn.

Het blijkt dus dat het volume van de schijf, dat door het Windows-besturingssysteem wordt weergegeven, onmiddellijk afneemt met de verkregen waarde. Het is goed als iemand dit begrijpt en begrijpt. Maar er zijn andere gevallen waarin een beledigde klant naar de winkel komt en dingen begint uit te zoeken. Tegelijkertijd wordt de verkoper ervan beschuldigd een “cut” schijf te verkopen. De klant begrijpt niet dat de maximale capaciteit van een harde schijf eigenlijk een constante waarde is. Maar de waarde ervan kan variëren, afhankelijk van de berekeningsmethode. En het verschil daartussen is 7%, ongeacht het volume. Deze verklaring geldt voor alle apparaten voor informatieopslag, inclusief flashdrives, diskettes en cd's.


Conclusie

De totale capaciteit van de harde schijf bedraagt sleutelparameter, waar kopers op letten voordat ze kopen. Maar tegelijkertijd denken maar weinig mensen dat de waarde ervan 7% minder zal zijn in het Windows-besturingssysteem. Maar u moet hier rekening mee houden en het apparaat met een zekere reserve meenemen, om later geen tweede schijf te kopen.

Geïnstalleerd op harde schijf. Winchester is het meest belangrijk ding voor u en uw informatie.
Het volume harde schijven groeit voortdurend, nieuwe schijven vervangen elk jaar de oude. Volgens Dataquest werden in 2001 130 miljoen harde schijven vervangen, en in 2002 150 miljoen.

Verhaal: begin jaren zeventig door het bedrijf IBM De eerste harde schijf werd ontwikkeld magnetische schijven(14 inch). Op de schijf konden 30 nummers worden opgenomen met elk 30 sectoren (30/30) en er kon tot 16 KB aan informatie worden opgeslagen. Aanvankelijk kreeg het de naam 30/30. Maar naar analogie met Amerikaanse "Winchester" automatische geweren met 30/30 kaliber, schijf apparaten met niet-verwijderbare schijven ( harde schijven ) begon te worden genoemd harde schijven. In 1973 creëerde IBM de eerste harde schijf met meerdere schijven met een capaciteit van 140 MB, die voor $ 8.600 werd verkocht.
De ontwikkeling van HDD-technologieën kan in vijf fasen worden verdeeld:

  • De eerste (vóór 1979) is het gebruik van “klassieke” inductieve opname-/afspeelkoppen;
  • De tweede fase (1979-1991) - het gebruik van dunnefilmkoppen;
  • De derde (1991-1995) - het gebruik van magnetoresistieve (MR, Magneto-Resistive) koppen;
  • Vierde (1995-2000) - het gebruik van supermagnetoresistieve koppen (GMR, Giant Magneto-Resistive): het verkleinen van de magnetische opening in de opnamekop en het vergroten van de gevoeligheid van de leeskop door het gebruik van materialen met een abnormaal hoge magnetosensitiviteitscoëfficiënt;
  • Ten vijfde (sinds 2000) - de opkomst van modellen met een nieuw type magnetische coating - met antiferromagnetische koppeling (AFC) met behoud van de parameters van de magnetische koppen;

De harde schijf heeft acht hoofdparameters:

Naast de belangrijkste parameters is het belangrijk " Overbelasting door shock in werkende/niet-operationele toestand (operationele/niet-operationele schok), G" (een parameter die de weerstand van de harde schijf karakteriseert mechanische spanning), "Bedrijfstemperatuur(Bedrijfstemperatuur), °C" (een parameter waarmee men de “hittebestendigheid” van een harde schijf kan beoordelen), Stroomverbruik (energiebeheer), W(een parameter over hoe warm de harde schijf zal zijn), garantieperiode (van 6 maanden tot 5 jaar) en fabrikant:

Belangrijkste producenten:

[Fujitsu] [Hitachi Inc. ] [ IBM ] [ Iomega * ] [ LaCie ] [ Matsushita * ] [ Maxtor Corporation ] [ QArchos * ] [ Quantum Corporation * ] [ Samsung ] [ Seagate Technology, Inc.] [ SimpleTech ] [ Opslagtechnologiebedrijf] [ Toshiba * ] [
West-digitaal Bedrijf]* - per bedrijf Maxtor Winchester-bedrijf gekocht van Quantum; En Matsushita Toshiba is gespecialiseerd in harde schijven voor digitale spelers en 1,8 inch; Iomega; ontwikkelt zich alleen externe harde schijven QArchos- pocket harde schijven;
SimpelTech - Flash-harde schijven.

· ** - veel ontwikkelingsbedrijven voor harde schijven hebben verschillende fabrieken voor de productie van harde schijven verschillende merken Partitionering van harde schijven. De “fysieke” harde schijf is verdeeld in een of meer “logische” schijven (d.w.z. deze bevat

  1. logisch regio). U kunt elke partitieconfiguratie maken. Secties kunnen uit vier typen bestaan: Hoofdopstartrecord opstartrecord
  2. ,MBR)
  3. . Hier (in het eerste HDD-blok) wordt informatie over schijfpartitionering opgeslagen en kan Boot Manager daar worden geplaatst; Primair. Dit is de partitie waarop het besturingssysteem altijd is geïnstalleerd. Veel “eenvoudige” programma's (bijv. DOS, Windows) worden alleen in de primaire versie geïnstalleerd; Verlengd. Dit is de sectie voor gebruikersprogramma's waartoe de gebruiker toegang heeft.
  4. Verlengd Verlengd kan in zijn geheel worden gebruikt (als een enkele logische schijfeenheid) of worden opgedeeld in meerdere logische schijfeenheden (zie afbeelding); Andere (andere) sectie. Dit;
-partitie toegewezen voor het installeren van een ander besturingssysteem dan het besturingssysteem waarin het is geïnstalleerd Andere (andere) sectie. Dit primair Als je een HDD deelt, krijg je er altijd maar één-sectie en een of meer verlengd-secties. De grootte van elke HDD-partitie heeft een bovengrens.


Miljoenen "dummies" zijn hun gegevens kwijtgeraakt bij het maken van een back-up van de "C:\" schijf naar de aangrenzende "D:\" schijf, omdat dit vaak één harde schijf is! Vroeger was het partitioneren van de harde schijf verplicht vanwege de beperkingen van het vetsysteem en nu - voor het gemak (een keer) - meerdere besturingssystemen (twee) en dezelfde (drie). Het toegewezen volume is afhankelijk van het type besturingssysteem en het aantal programma's dat u gebruikt.

· Bedrijfsmodi van IDE-harde schijven. Vanwege de lagere kosten van IDE-schijven (vergeleken met SCSI-schijven en gezien de onderontwikkeling van USB-schijven) hebben ze feitelijk de overhand. Er kunnen maximaal twee IDE-apparaten werken op één IDE-kabel: Master (MA) - de hoofdkabel (eerste) en Slave (SL) - extra (tweede). Die. max - 4 IDE-HDD. Master/Slave-installatie wordt uitgevoerd door HDD-Jumpers. Als er maar één apparaat op de kabel zit, staat deze ingesteld op de Master-modus, maar sommige HDD's hebben een aparte Single-modus. Het is niet direct toegestaan ​​om het apparaat in de modus te bedienen Slaaf bij afwezigheid van een Master-apparaat, maar sommige nieuwe HDD-modellen kunnen in deze modus werken, op voorwaarde dat het juiste BIOS of stuurprogramma is geïnstalleerd. Dit is nodig omdat Veel chauffeurs stoppen nadat ze de afwezigheid van een Master-apparaat hebben ontdekt verder werk met deze regelaar. Er is een modus waarin de HDD zelf is ingesteld op Master/Slave-modus, afhankelijk van het type connector op de interfacekabel - Kabel selecteren(CS, CSel, selectie via kabelconnector). Twee installatievoorbeelden harde schijven:

Andere (andere) sectie. Dit secundair
meester slaaf meester slaaf
HDD --- CD ---
Andere (andere) sectie. Dit secundair
meester slaaf meester slaaf
Vaste schijf 1 Vaste schijf 2 CD-RW/DVD CD

Er is een optie om het maximale aantal aangesloten IDE-apparaten te vergroten (standaard - niet meer dan 4 stuks). Om te "cheaten" heb je een vrij PCI-slot m/b nodig. Door verschijning Dit is een kaart met twee (of vier) IDE-controllers geïnstalleerd in de PCI-connector van het moederbord. Om de controller te activeren, moet u de BIOS -a van de kaart configureren.

Anatomie van een harde schijf... De HDD bestaat uit een HDA en een elektronicabord. Alle mechanische onderdelen en de voorversterker zijn in de HDA geplaatst (“verzegeld”) en vrijwel alle besturingselektronica bevindt zich op het bord. In het deel van de HDA dat het verst verwijderd is van de connectoren bevindt zich een spindel met een of meerdere schijven. Magnetische schijven zijn platen gemaakt van aluminium, keramiek of glas, waarop een dun laagje hoogwaardige ferromagneet wordt aangebracht - op basis van chroomoxide (voorheen ijzeroxide en bariumferrieten). Het aantal schijven is één tot drie (meestal), maar in sommige modellen bereikt het 10. Onder de schijven bevindt zich een motor die een roterend magnetisch veld creëert. Dichter bij de connectoren, aan de linker- of rechterkant van de spil, bevindt zich een roterende positioner ( hoofd positioneerder) - aan de ene kant - met magnetische koppen, en aan de andere kant - een korte en massievere schacht met een elektromagnetische aandrijfwikkeling. Er zijn roterende en lineaire positioners.
In de HDA bevindt zich gewone lucht (geen vacuüm), die tijdens de productie is gezuiverd met behulp van speciale filters. Wanneer de schijven roteren, ontstaat er een sterke luchtstroom, die rond de omtrek van de verwarmde eenheid circuleert en voortdurend wordt gereinigd door een filter dat aan een van de zijkanten is geïnstalleerd. Gegevens van het schijfoppervlak worden rechtstreeks door de magneetkop gelezen. Bij het schrijven creëert de kop een magnetisch veld, waardoor een deel van de schijf wordt gemagnetiseerd; bij het lezen wekt het veld van de schijf daarentegen een signaal in de kop op; Moderne schijven bevatten meerdere magnetische koppen - meestal één aan elke kant van elke schijf.
Omdat magneetkoppen van de harde schijf werken met zeer hogere snelheid is er een zeer nauw contact tussen hen en het oppervlak van de drager vereist. Wanneer de schijven in de behuizing draaien, ontstaat er een luchtstroom die de hoofden boven het oppervlak tilt - de hoofden worden op een luchtkussen "geplant". Maar dit ontwerp vereist het parkeren van de koppen - ze buiten het werkgebied van de schijf verplaatsen ( landingszone) wanneer de computer is uitgeschakeld. Die. wanneer de harde schijf wordt uitgeschakeld, stoppen de schijven, verdwijnt de magnetische flux en vallen de koppen naar de oppervlakte. Daarom moeten de hoofden worden teruggetrokken naar een niet-werkgebied. De positioner regelt dit allemaal.


De elektronicakaart is verwijderbaar en wordt via een of twee connectoren van verschillende ontwerpen op de HDA aangesloten. Het bord bevat de hoofdprocessor van de harde schijf, ROM met een programma, werk-RAM, dat meestal wordt gebruikt als schijfbuffer, een digitale signaalprocessor (DSP) voor het voorbereiden van opgenomen en verwerken van leessignalen, en interfacelogica. Op sommige harde schijven wordt het processorprogramma volledig in ROM opgeslagen, op andere wordt een bepaald deel ervan vastgelegd in het servicegebied van de schijf. De schijf bevat ook HDD-parameters (fabrikant, model, serienummer, enz.). Sommige harde schijven slaan deze informatie op in een elektrisch programmeerbare schijf ROM (EEPROM). Veel harde schijven hebben een speciale technologische interface met een connector op de elektronicakaart, waarmee u met behulp van bankapparatuur verschillende servicewerkzaamheden aan de schijf kunt uitvoeren: testen, formatteren, defecte gebieden opnieuw toewijzen, enz.
Alle informatie die op de schijf is opgeslagen, is conventioneel verdeeld in ambtenaar Winchester-bedrijf gekocht van aangepast. De eerste zorgt voor een normale werking en is in eerste instantie aanwezig op elke harde schijf - deze is opgenomen door de fabrikant.
Elke HDD is verdeeld in zones ( inkepingen), die elk gewoonlijk 20 tot 30 cilinders met hetzelfde aantal sectoren bevatten. Sectoren kunnen (meestal) van 17 tot 150 op één spoor passen. Hun nummering begint bij 1, terwijl de nummering van de koppen en cilinders begint bij 0. Het aantal sectoren op de baan is niet gelijk. Hoe verder het pad van het centrum verwijderd is, hoe groter aantal sectoren op schijf
Omdat De technologie voor de productie van harde schijven laat ons nog niet toe om er vanaf te komen slechte sectoren 100%, op elke harde schijf bevindt zich een tabel voor het herverdelen van beschadigde sectoren (tracksectie). Elke keer dat u de HDD inschakelt, leest hij de tabel en merkt hij eenvoudigweg de defecte onderdelen niet op. Maar tijdens het gebruik verschijnen er nieuwe slechte sectoren - die niet in de fabriekstabel zijn gemarkeerd. Bij toegang tot een dergelijke sector probeert de magnetische kop herhaaldelijk te lezen of te schrijven, en het “gezonde” oppervlak van de schijf kan worden vernietigd. Dit brengt verdere “reproductie” van beschadigde sectoren met zich mee. Zo wordt de schroef geleidelijk onbruikbaar. Veel harde schijven hebben een functie automatisch opnieuw toewijzen. Het is bedoeld om te vervangen slechte sectoren naar normaal van het reservegebied naar hardwareniveau. Het werkt echter niet altijd. Maar u kunt het schijfhulpprogramma uitvoeren (bijv. HDDSnelheid in schrijftestmodus) - hierna verdwijnen de slechte blokken (autoremap wordt geactiveerd).
Alle schijven in de fabriek ondergaan primaire markeringen (laag niveau, Laag niveau Opmaak) op een speciale, uiterst nauwkeurige technologische standaard. Bij het markeren worden servicemarkeringen (servomarkeringen) naar de schijven geschreven en worden er ook sporen en sectoren gevormd. Hun voor- en achtervoegsels worden vastgelegd. Opmaak op hoog niveau wordt gedaan door de gebruiker die gebruikt FORMAT-hulpprogramma's. Er wordt naar elke schijfpartitie geschreven VBS (volume-opstartsector - opstartsector volumes), FAT, hoofdmap, wordt de schijf gecontroleerd op fouten.
Er is een geluidsreductiesysteem ( Geluidsbarrièretechnologie), die voorziet laag niveau geluid tijdens schijfwerking (bijvoorbeeld SBT-technologie ontwikkeld door Seagate).
Op harde schijven nieuwste generatie technologieën worden gebruikt PRML (gedeeltelijke respons, maximale waarschijnlijkheid- maximale waarschijnlijkheid bij onvolledig antwoord) en SLIM. (Zelfmonitoringanalyse en rapporttechnologie- technologie voor onafhankelijke trackinganalyse en rapportage). Er zijn veel schijfhulpprogramma's beschikbaar voor de gebruiker. Voorbeeld - DFT (rijgeschiktheidstest) Winchester-bedrijf gekocht van IBM FeatureTool. Beide zijn gratis. De eerste diagnosticeert de harde schijf en stelt u in staat S.M.A.R.T.-parameters te bekijken. en ook een low-level format implementeren, de tweede is het beheren van de werking van de cache, veranderen akoestische kenmerken en UDMA-modus.

· Schijfgeometrie of Normaal, LBA, Groot. De voormalige klassieke manier om sectoren aan te spreken is C.H.S.- op cilinder-, kop- en sectornummer ( Cilinder/kop/sector). De ontwikkelaars van de eerste pc gooiden een ‘mijn’ naar iedereen door het aantal bits waarmee gegevens werden aangesproken strikt te definiëren. Er werden 16 cijfers toegewezen voor het cilindernummer, 4 voor het kopnummer en 8 voor de sector, wat een maximale capaciteit van de harde schijf opleverde van 128 GB. Maar Bios beperkte vanaf het allereerste begin het aantal sectoren tot 63 en cilinders tot 1024, en DOS volgde hetzelfde voorbeeld, dat uiteindelijk een maximum van 528 MB opleverde. Toen er harde schijven met een capaciteit van meer dan 528 MB verschenen, 'zagen' pc's de schijf niet meer volledig. Bios-fabrikanten hebben dringend ondersteuning voor de modus vrijgegeven LBA (logische blokadressering). Ze gebruikten continue sectornummering en het CHS-adres wordt omgezet in één lineair 28-bits nummer van het absolute sectornummer (voor DOS is er nog steeds een limiet van 8,4 GB), gebruikt voor sectornummering (LBA-adres) en geconverteerd door de harde schijf . Om in de LBA-modus te werken, heb je ondersteuning nodig voor je harde schijf, BIOS en stuurprogramma. Een adresseringsschema met LBA werd voor het eerst door het bedrijf gebruikt West-digitaal eind 1993.
De modus Large (Large Block Adressing) is bedoeld voor harde schijven met een capaciteit van maximaal 1 GB die de LBA-modus niet ondersteunen. In Large neemt het aantal logische koppen toe tot 32 en wordt het aantal logische cilinders gehalveerd. In dit geval worden toegangen tot logische heads 0..F vertaald naar even fysieke cilinders, en worden toegangen tot heads 10..1F vertaald naar oneven cilinders. Een harde schijf die is gepartitioneerd in de LBA-modus is incompatibel met Grote modus, en omgekeerd. De normale modus zorgde ervoor dat Bios werkte als oudere versies zonder vertaling.
Maar vandaag is dit allemaal verleden tijd (met de huidige GB HDD's). Die schijfparameters die u in de sectie ziet INSTELLING Standaard CMOS-installatie hebben in de regel niets te maken met de echte parameters van de schijf. HDD's werken nu rechtstreeks (via stuurprogramma's).

· Cluster - minimale maat HDD-ruimte toegewezen door het bestandssysteem voor het opslaan van één bestand. Eenvoudiger: een cluster is een datalocatiecel. Alle beschikbare ruimte op de harde schijf is verdeeld in partities - van één tot veel. Partities zijn verdeeld in clusters, en elk cluster kan dat ook zijn onbezet(bruikbaar bestand) of defect(onbruikbaar). Eén harde schijf kan meerdere partities hebben (C-schijf, D-schijf, E-schijf, F-schijf, G-schijf, H-schijf, I-schijf, J-schijf, K-schijf, enz.). De schijfsector van 512 bytes wordt gebruikt als basis voor het berekenen van clustergroottes. De clustergrootte moet gelijk zijn aan grondtal (512 bytes) maal 2 tot de macht n. De clustergrootte wordt automatisch bepaald, afhankelijk van het volume van de aangemaakte partitie en/of bestandssysteem. De enige uitzondering is systeempartitie: Als deze kleiner is dan 2048 MB, is de clustergrootte altijd 512 bytes. 16-bits FAT kan slechts 65.526 clusters ondersteunen.
Impact van clustergrootte op verliezen - efficiëntie van gebruik schijfruimte- kan worden geschat met behulp van de formule:

Eff = [ Grootte / (Grootte + Overhang) ] x 100%
Waar:
- Eff - efficiëntie van het gebruik van schijfruimte, uitgedrukt als een percentage van 0 tot 100;
- Grootte - totale grootte van alle bestanden op de schijf;
- Overhang - totale resterende redundantie van clusters.
De som van de waarden voor Grootte en Overhang geeft het totale volume aan clusters dat wordt ingenomen door alle bestanden op de schijf. Hoe hoger de verhouding, hoe efficiënter de schijfruimte wordt gebruikt. Typische Eff varieert van 51% tot 98%. Voor een FAT-partitie van 1 GB met 10.000 bestanden is het verlies bijvoorbeeld 160 MB!

Grootte van de HDD-partitieGrootte in FAT16 Gemiddelde verliezenGrootte in NTFS
minder dan 127 MB2 KB1,00-1,75 KB512 bytes
127 MB - 255 MB4 KB2,00-3,75 KB512 bytes
256 MB - 511 MB8 KB4,00-7,75 KB512 bytes
512 MB - 1023 MB16 KB8,00-15,75 KB1 KB
1024 MB - 2047 MB32 KB16.00-31.75 KB2K
2048 MB - 4095 MB64 KB16.00-31.75 KB4K
4096 MB - 8191 MB 8K
8192 MB - 16383 MB 16K
16384 MB - 32767 MB 32K
vanaf 32768MB 64K

Grofweg kunnen we aannemen dat elk bestand zijn laatste cluster ongeveer de helft in beslag neemt - en uw verliezen (HDD-ruimte) zullen gelijk zijn aan het aantal bestanden vermenigvuldigd met de helft van de clustergrootte. Manieren om ruimteverlies tegen te gaan:
- het opslaan van grote sets zelden gebruikte bestanden in de vorm van archieven;
- het opsplitsen van de harde schijf in schijven.
Eten universele methode voor alle Windows (behalve ingebouwde hulpprogramma's). Maak (of neem een ​​kant-en-klaar) heel klein bestand van 1-500 bytes groot. Rechter knop muizen - Eigenschappen. Kijk naar twee punten: Maat Winchester-bedrijf gekocht van Grootte op schijf. Maat- het bestand heeft daadwerkelijk een grootte. Grootte op schijf zal (bijvoorbeeld) 4096 bytes zijn, wat overeenkomt met de werkelijke clustergrootte, d.w.z. 4 KB. Die. met een cluster van 32 KB zal een bestand met informatie van 1 byte 32 KB op schijf in beslag nemen.
De gebruiker kan ook de clustergrootte selecteren (handmatig tijdens het formatteren). Dit doe je als volgt: “format d: /A:size”, waarbij size de grootte van het cluster in bytes is. Maar er zijn regels die moeten worden gevolgd: de clustergrootte moet een veelvoud zijn van de grootte fysieke sector, dat wil zeggen 512 bytes in de overgrote meerderheid van de gevallen (ten eerste); er zijn beperkingen op het aantal clusters op een partitie (ten tweede).

"...Elk wezen heeft hardware! ...

RAID-arrays (Redundant Array of Inexpensive Disks, redundante set goedkope schijven). Raid is een manier om grote informatieopslagplaatsen te organiseren en de uitwisselingssnelheid en betrouwbaarheid van gegevensopslag te vergroten. Een RAID-systeem is een groep van meerdere gewone (goedkope) harde schijven die werken onder de besturing van een eenvoudige controller en van buitenaf zichtbaar zijn als één apparaat met totale capaciteit en hoge snelheid of betrouwbaarheid. RAID-technologie is gebaseerd op drie hoofdmethoden:

  1. Alternatieve plaatsing van gegevens op schijven met een bepaalde cyclische volgorde. Alternatieve plaatsing houdt in dat het eerste datasegment naar de eerste schijf wordt geschreven, het tweede naar de tweede, enz. In dit geval nemen de prestaties van de array toe omdat de computer het volgende datasegment begint te schrijven (naar volgende schijf) voordat u klaar bent met het opnemen van het vorige segment. De prestaties van het schijfsysteem kunnen verder worden verbeterd door verbinding te maken verschillende groepen schijven naar individuele controllers;
  2. Schijfspiegeling. Back-up verstrekt geen gegevens (dagelijks of meerdere keren per week) snel herstel informatie en snelle bescherming van nieuwe gegevens die na de laatste kopieersessie zijn aangemaakt. Deze problemen worden opgelost met behulp van spiegel reflectie schijven, waarbij alles wat op de eerste schijf is opgenomen, op de tweede wordt gedupliceerd. Als de eerste schijf defect raakt (of gegevens worden geschreven naar een beschadigde sector van de schijfruimte), worden ze gelezen vanaf de tweede (“spiegel”) schijf;
  3. Berekening van controlesommen. Pariteitscontrole werkt als volgt: alle informatiebits in een byte worden modulo 2 opgeteld en als het aantal enen daarin even is, wordt de controlebit op nul gezet, en als deze oneven is, op één. Bij het lezen van gegevens worden de informatiebits opnieuw opgeteld en het resulterende resultaat wordt vergeleken met de waarde van de controlebit. Als ze overeenkomen, zijn de gegevens correct, en zo niet, dan zijn de waarden van een of meer cijfers onjuist;
Bedrijven ( Adaptec, CMD en anderen) produceren speciale controllers die zijn ontworpen voor het organiseren van RAID-arrays.
Een dergelijke array kan ook op basis van het gebruikelijke worden geïmplementeerd SCSI-controller of Fibre-kanaal- een programma gebruiken dat gegevenssegmenten over schijven verdeelt. Dit software-oplossing goedkoper dan één op basis van een speciale controller, maar deze ondersteunt (meestal) alleen RAID-niveaus 0 en 1.

· Verhaal... De geboorteplaats van RAID-technologie is de Universiteit van Californië, Berkeley, VS. In 1987 de specialisten (Petterson, Gibson en Katz) publiceerden een artikel waarin de principes van het combineren van talloze werden beschreven schijfstations. Aanvankelijk werden zes niveaus gedefinieerd ( niveaus) RAID 0-5, maar naarmate de technologie zich ontwikkelde, extra niveaus(vijf meer).

· Raid 0: gegevensstriping. Informatie wordt opgesplitst in brokken (vaste hoeveelheden gegevens, gewoonlijk blokken genoemd) en deze brokken worden parallel naar schijven geschreven en gelezen. Twee schijfblokken van 512 bytes vormen een segment.

Raid 0 is niet fouttolerant, maar dit RAID-niveau wordt veel vaker gebruikt dan andere RAID-niveaus. Voordelen van Raid 0 (in termen van prestaties):

  • stijgt doorvoer Seriële I/O via gelijktijdig downloaden meerdere interfaces;
  • de latentie bij willekeurige toegang wordt verminderd - meerdere verzoeken aan verschillende kleine informatiesegmenten kunnen tegelijkertijd worden uitgevoerd;
· Raid 1: Schijfspiegeling. Van elk informatieblok wordt een kopie afzonderlijk opgeslagen. Normaal gesproken heeft elke (gebruikte) schijf een "dubbele" die wordt opgeslagen exacte kopie deze schijf. Als een van de hoofdschijven uitvalt, wordt deze vervangen door zijn "dubbele". De prestaties worden verbeterd door het systeem zo te configureren dat de “dubbelganger” wiens hoofd zich dichter bij het vereiste blok bevindt, wordt gebruikt om informatie te lezen.
Schijf 1Schijf 2 Schijf 3Schijf 4 Schijf 5
Segment 1Segment 1Segment 2Segment 2 ---
Segment 3Segment 3Segment 4Segment 4 ---
gegevens Xschijfkopie 1Y-gegevenskopie van schijf 3 vrij

Een van de duurste niveaus, omdat... Alle schijven worden gedupliceerd en bij elke opname wordt ook informatie naar de testschijf geschreven. Vaak voor normale werking RAID Level 1 vereist HDD's met dezelfde capaciteit, vervaardigd door dezelfde fabrikant. De nadelen van Raid 1 zijn onder meer de hoogste redundantie en software-implementatie- problemen met het hot-swappen van een defecte HDD.

· Raid 2: matrix met bitsgewijze stratificatie. Deze technologie biedt gegevensbescherming met behulp van een foutcorrigerende Haming-code. De gegevens die worden geschreven, worden over meerdere schijven verdeeld en vervolgens worden ECC-controlesommen (Error-Correction Code) naar een enkele schijf of meerdere schijven geschreven. aparte schijven. Commercieel RAID-implementaties Niveau 2 is vrijwel afwezig.

· Raid 3: detectie van hardwarefouten en pariteit. Gegevens worden verdeeld over informatieschijven en voor elke ‘baan’ met gegevens (een reeks gegevenssegmenten die zich in dezelfde sectoren op verschillende fysieke schijven) wordt bepaald controlesom(of pariteitscode), die naar een afzonderlijke schijf wordt geschreven.

Schijf 1Schijf 2 Schijf 3Schijf 4 Schijf 5
Byte 1Byte 2Byte 3Byte 4 Pariteitsbyte
Byte 5Byte 6Byte 7Byte 8 Pariteitsbyte
gegevensgegevensgegevensgegevens pariteitsinformatie

RAID-niveau 3 is behoorlijk complex en kan alleen in hardware worden geïmplementeerd. Er zijn minimaal drie schijven nodig.

· Raid 4: parallellisme binnen de groep. In tegenstelling tot Raid 3 is er een afwisselende verdeling van geen korte datasegmenten, maar eerder grote informatieblokken. Dit maakt het mogelijk om meerdere verschillende leesverzoeken tegelijkertijd uit te voeren. Omdat alle controle informatie geconcentreerd op één (laatste) schijf, gegeven array kan niet meerdere schrijfbewerkingen tegelijkertijd uitvoeren. Er zijn minimaal drie schijven nodig. Raid 4 is uiterst zeldzaam.

· Raid 5: Rotatiepariteit voor parallellisatie van records. Op systeemschijven RAID-niveau 5 worden grote gegevensblokken één voor één geplaatst, maar in tegenstelling tot Raid 4 wordt de besturingsinformatie over alle schijven van de array verdeeld. Voor de eerste "strip" van gegevenssegmenten kan de pariteitscode op de laatste schijf van de array worden geschreven, voor de tweede op de voorlaatste, enz. Hierdoor kunnen meerdere schrijfbewerkingen tegelijkertijd worden uitgevoerd.

Schijf 1Schijf 2 Schijf 3Schijf 4 Schijf 5
Pariteitssegment Segment 1Segment 2Segment 3Segment 4
Segment 5Pariteitssegment Segment 6Segment 7Segment 8
Segment 9Segment 10 Pariteitssegment Segment 11Segment 12

Een van de meest gebruikte in de praktijk en de moeilijkste van de eerste zes niveaus. Er zijn minimaal drie schijven nodig.

· Raid 6: 2D-pariteit. Dit is een geavanceerde versie van RAID Level 5, die dubbele pariteit van opgeslagen informatie biedt om een ​​grotere betrouwbaarheid te garanderen. Alleen voor het opslaan van besturingsinformatie zijn twee HDD's nodig. RAID Level 6 is ontworpen voor kritieke situaties belangrijke toepassingen en heeft zeer lage productiviteit records vanwege de noodzaak om extra controlesommen te berekenen.

· Inval 7. Unieke technologie van Storage Computer Corporation. Het veronderstelt de asynchrone werking van zijn componenten (inclusief het communicatiekanaal met de hostmachine) en de onafhankelijkheid van hun beheer. Arrays gebruiken ingebouwde besturingssysteem realtime voor het cachen van gegevens en het berekenen van besturingsinformatie. Bovendien wordt deze informatie via een speciale X-bus verzonden. Gegevens worden verspreid over gewone schijven en besturingsinformatie wordt op een afzonderlijke schijf opgeslagen. Om de prestaties te verbeteren, worden lees- en schrijfbewerkingen centraal in de cache opgeslagen. Erg hoge prestaties en betrouwbaarheid van gegevensopslag, maar de prijs van een systeem dat met een dergelijke array is uitgerust, is ook hoog. RAID 7 is een handelsmerk.

· Overval 10/1+0. Arrays op dit niveau zijn een combinatie van de principes die worden gebruikt in arrays van het nul- en eerste niveau. Dat wil zeggen, “strippen” gecombineerd met spiegelen. Die. de eerste twee zijn gemaakt RAID-array 0 en vervolgens gespiegeld, waarvoor minimaal vier schijven nodig zijn in een minimale configuratie - erg duur. De prijs van een dergelijke array begint snel te stijgen wanneer de uitbreiding begint.

· Inval 50. Een array die de principes van arrays van niveau nul en niveau vijf combineert. Die. Als de controller bijvoorbeeld een opdracht ontvangt om 256 KB aan gegevens naar de HDD te schrijven, dan worden deze gegevens verdeeld in twee stukken van 128 KB volgens de principes van RAID 0 en vervolgens elk van hen, volgens de principes van de vijfde- arrays, is verdeeld in stukken van 32 KB en wordt fysiek gelijktijdig naar alle schijven van de array geschreven. Het doel van de toepassing is om de werksnelheid te verhogen schijf subsysteem met behoud van de hoogste betrouwbaarheid van gegevensopslag.

· Inval 53. Het zou juister zijn om het RAID-niveau 03 te noemen, omdat het combineert RAID-architectuur niveau 0 en 3. Om dit te implementeren schijfarray Je hebt minimaal vijf HDD's nodig. In deze configuratie schrijft RAID Level 53 afwisselend kleine gegevenssegmenten naar de eerste twee HDD's en schrijft pariteitsinformatie naar de derde HDD. De laatste twee schijven (vierde en vijfde) bevatten dezelfde gegevens, afwisselend geschreven in grote blokken zonder pariteit, zoals gebeurt in RAID-systeem niveau 0.

· Als de harde schijf overleden is... Geen enkele harde schijf gaat eeuwig mee en je moet voorbereid zijn op de dood ervan. Doen back-ups naar CD-R, streamer, magneto-optica, enz. Dus het gebeurde. Het meest veelvoorkomende redenen dood:

Als HDD nog niet garantie - vervang hem door een nieuwe (met extra betaling); als de garantie is verlopen, geef hem dan aan rommeldealers of gooi hem weg. Als er geen gegevensarchieven zijn gemaakt en de informatie erg belangrijk is, probeer deze dan te herstellen. De hoeveelheid informatie (bestanden) op de harde schijf is enorm en de fysieke vernietiging ervan duurt behoorlijk lang. Die. informatie bijna altijd leeft nog, maar is niet beschikbaar. En het is niet de informatie zelf die moet worden hersteld, maar alleen de toegang daartoe. Houd er rekening mee dat herstel de harde schijf in de regel niet geneest, maar u in staat stelt bestaande gegevens naar een ander medium te kopiëren.
Laat uw gegevens niet aan vreemden achter! In 2002 voerden studenten van het Massachusetts Institute een experiment uit: ze kochten honderden "kapotte" harde schijven. Slechts 60% van de harde schijven werd geformatteerd en bij 17,7% werd de informatie zelfs helemaal niet verwijderd. 81,6% van de harde schijven was in werkende staat. Omdat standaard Windows-opmaakopdracht formaat overschrijft geen blokken (gebruik deze rommel niet), en "dummies" bewaren domweg informatie in de map "Mijn documenten" (twee) - alle gegevens kunnen eenvoudig worden hersteld. In het bijzonder werden financiële bedrijfsinformatie, creditcardnummers, persoonlijke medische gegevens enz. geëxtraheerd.
Voor herstel heeft u nodig: een opstartdiskette (beveiligd tegen schrijven), hulpprogramma's FDisk Winchester-bedrijf gekocht van Formaat(uit de geïnstalleerde kit), hulpprogramma's SchijfBewerken Winchester-bedrijf gekocht van UnWissen(van Norton-hulpprogramma's), programma NC. En alles is eenvoudiger als de schijf door BIOS wordt gedetecteerd en fysiek intact is.
Als u niet zeker bent van uw kennis en/of niet uitsluit mogelijke fout onderneem bij uw handelingen zelf geen handelingen. Zelfs een kleine onnauwkeurigheid in uw handelingen kan het aanzienlijk ingewikkelder of zelfs onmogelijk maken verder herstel informatie. Neem contact op met de experts voor hulp.

Verschillende definities die het principe van het opslaan van informatie op een FATxx-schijf uitleggen:

"...De schijven zijn vers, niet schoongemaakt..."

De aanduidingen van elke harde schijf zijn gemakkelijk te ontcijferen - ze zijn meestal alfanumeriek en zijn gebaseerd op vergelijkbare principes: eerst - de aanduiding van de fabrikant en het model, vervolgens het volume in miljoenen bytes, en aan het einde - achtervoegsels die het ontwerp specificeren , specifieke kenmerken, enz. Het achtervoegsel "A" geeft bijvoorbeeld de ATA (IDE)-interface aan, en de "S" geeft SCSI aan. Het achtervoegsel "V" duidt bij veel modellen een goedkoper (Value) model aan, met uitzondering van Micropolis harde schijven, waarbij het achtervoegsel "AV" Audio/Video aanduidt - een focus op uniforme gegevensuitwisseling bij het lezen/schrijven. Voorbeelden:

******* Western Digital ******* WD AC 2 635 - 0 0 F 1 2 3 4 5 6 7 8 1 - Western Digital 2 - interface: A - IDE, S - SCSI, C - PCMCIA-IDE 3 - model: C - Caviar, P - Piranha, L - Lite, U - Ultralite 4 - aantal fysieke schijven 5 - capaciteit in miljoenen bytes 6 - LED-indicator: 0 - geen, 1 - rood, 2 - groen 7 - frontpaneel: 0 - geen, 1 - zwart, 2 - grijs 8 - buffervolume: S - 8 kb, M - 32 kb, F - 64 kb, H - 128 kb. Voor herstelde harde schijven na de productiedatum wordt de plaats van restauratie aangegeven: E - Europa, S - Singapore. ******* Maxtor ******* Mxt 7 850 AV 1 2 3 4 1 - Maxtor 2 - serie (7xxx) 3 - capaciteit in miljoenen bytes 4 - achtervoegsels: A - ATA (IDE), S - SCSI, V - Waarde ******* Seagate ******* ST 5 1080 A PR -0 1 2 3 4 5 6 1 - Seagate Technology 2 - behuizing: 1 - 3,5" hoogte 41 mm 2 - 5,25" hoogte 41 mm 3 - 3,5" hoogte 25 mm of 5,7" diepte 146 mm 4 - 5,25" hoogte 82 mm 5 - 3,5" hoogte 25 mm of 5" diepte 127 mm 6 - 9" 7 - 1,8" 8 - 8 "9 - 2,5" hoogte 19 mm of 12,5 mm
In plaats van samen te vatten, zou ik uw aandacht willen vestigen op een aantal belangrijke factoren:

  • aan de extreme gevoeligheid van harde schijven voor verschillende soorten schokken, schokken en schokken;
  • dat de harde schijven van hetzelfde merk zijn, maar dan van verschillende landen sterk verschillen in prijs en kwaliteit;
  • dat u geen “Made in China” harde schijven moet kopen;
  • dat als de garantie maar 6 maanden is, deze harde schijven al een hele tijd ergens liggen;
Persoonlijke mening... harde schijven die in conventionele pc's worden gebruikt, evolueren alleen maar in de richting van toenemende capaciteit en lagere kosten. Snelheid en betrouwbaarheid verdwijnen helaas naar de achtergrond. De wereld heeft goede HDD's, maar aangeboden Russische markt"filistijnse" harde schijven zijn er vreselijk ver van verwijderd...

Apparaat met harde schijf

Opslag aan hard magnetisch schijven bestaan ​​uit een of meer platen met een magnetische laag, koppen, een positioneringsapparaat, een behuizing en een controller. Platen- het hoofdelement van het opslagapparaat wordt erop opgeslagen; Hoofden ontworpen voor het lezen en schrijven van informatie op platen. Positioneringsapparaat zorgt voor beweging van de koppen naar de gewenste locatie op het oppervlak van de platen. Kader dient om andere structurele elementen te bevestigen, maar ook om platen en koppen tegen te beschermen mechanische schade en stof. Controleur bestuurt alle elektrische en elektromechanische componenten van de schijf en zorgt voor de overdracht van informatie van de computer en terug.

Afb.1

Geometrie van de harde schijf

Platen Schijven zijn gemaakt van metaal of glas en hebben aan één of beide zijden een magnetische laag waarop informatie wordt vastgelegd. De kant van de plaat met de aangebrachte magnetische laag wordt het werkoppervlak genoemd. Oppervlakken platen worden zorgvuldig gepolijst en voorzien van een ferromagnetische laag. Coatingmateriaal en aantal lagen (de magnetische laag kan uit meerdere lagen bestaan verschillende materialen) kan voor verschillende schijven verschillend zijn. Voor elk werkoppervlak reken er één voor één af hoofd(eigenlijk binnen moderne aandrijvingen Om de opnamedichtheid te vergroten, worden aparte opname- en leeskoppen gebruikt, vervaardigd met behulp van verschillende technologieën). Het oppervlak van de wafel is verdeeld in dunne concentrische ringvormige zones, sporen genoemd. En elk spoor, op zijn beurt, is verdeeld in verschillende gebieden die sectoren worden genoemd. Sector kan in twee gebieden worden verdeeld: het datagebied en het service-informatiegebied. Service-informatie wordt één keer in de fabriek op het plaatje vastgelegd en kan in de toekomst niet meer worden gewijzigd. Het servicegebied bevat een uniek sectoradres in de schijf, waardoor de controller dit herkent bij het schrijven of lezen van informatie. Het gegevensgebied bevat nuttige informatie, naar de schijf geschreven. Dit gebied kan tijdens bedrijf vele malen worden gewijzigd. De omvang van het datagebied overschrijdt enigszins de informatiecapaciteit van de sector aanvullende informatie- voor verificatie en eventueel foutcorrectie. Het sectorgegevensgebied kan alleen in zijn geheel worden bijgewerkt. Die. U kunt niet één of tien bytes naar de schijf schrijven, alleen de hele sector. Alle hoofden bewegen synchroon en dit proces duurt enige tijd. De reeks sporen op verschillende platen die gelijktijdig toegankelijk zijn met de koppen in dezelfde positie, wordt genoemd cilinder. Qua prestaties schijf systeem Het is raadzaam om seriële gegevens binnen één cilinder te plaatsen.



Afb.2

Op oudere schijven bevatten alle tracks hetzelfde aantal sectoren. In dit geval zou het unieke adres van elke sector (dat wil zeggen het minimale deel van de informatie die op de schijf is opgeslagen) kunnen worden gespecificeerd door drie cijfers: cilinder-, kop- en sectornummers. Zo werd een driedimensionaal coördinatensysteem op de harde schijf geïntroduceerd, dat sterk doet denken aan een cilindrisch systeem in de driedimensionale ruimte: de straal komt overeen met het cilindernummer, de hoogte komt overeen met het kopnummer en de hoek komt overeen met de sector nummer.

Als we ons een dergelijke structuur voorstellen in een cartesiaans coördinatensysteem (we nemen bijvoorbeeld aan dat onze "schijf" is samengesteld uit verschillende borden met flash-geheugen), dan zal deze de vorm hebben van een parallellepipedum, verdeeld in cellen - sectoren.

Echter, met zulke moeilijk markeren schijf is de opnamedichtheid op de externe tracks ongeveer drie keer lager dan op de interne (dezelfde hoeveelheid informatie voor drie keer de tracklengte). Daarom gebruiken moderne schijven zogenaamde zone-opname, waarbij het oppervlak van de platters langs de straal is verdeeld in verschillende zones (meestal ongeveer een dozijn), waarbij het aantal sectoren per spoor constant is, maar dit aantal varieert van zone tot zone. De buitenste sporen bevatten meer sectoren dan de binnenste. Hierdoor kunt u de informatiecapaciteit van de schijf ongeveer verdubbelen zonder de maximale opnamedichtheid te wijzigen. Maar omdat het wordt weergegeven in de Cartesiaanse geometrie, zal zo'n figuur een nogal complexe vorm hebben waar het BIOS niet mee kan werken. Daarom, van alle diversiteit harde interfaces schijven (ST506/412, ESDI, IDE, SCSI), alleen de laatste twee blijven over, onderscheiden door de grootste “intelligentie”, die tot uiting komt in het vermogen om een ​​dergelijke “coördinatentransformatie” uit te voeren waarbij een onregelmatig gevormde figuur verandert in een nette “steen”. Tegelijkertijd kun je met een dergelijke transformatie omzeilen of voorbijgaan ten minste, verzacht enigszins de beperkingen die door het BIOS worden opgelegd maximale waarden enkele parameters. Het BIOS kan bijvoorbeeld niet meer dan 63 sectoren per track verwerken moderne aandrijvingen er zijn er ongeveer een orde van grootte meer. Tegelijkertijd kan het BIOS 'denken' dat de harde schijf 16 of zelfs 255 koppen heeft, terwijl dit aantal bij echte schijven meestal varieert van 1 tot 6.



Afb.3

Uiteraard is zone-opname, d.w.z. verschillende hoeveelheid sectoren op verschillende sporen met constante snelheid rotatie leidt ertoe dat de gegevensuitwisselingssnelheid afhankelijk is van het cilindernummer.



Afb.4

Volumebeperkingen

Ooit, bij het ontwikkelen van de eerste BIOS-versies voor de IBM PC werd besloten om het aantal sectoren en cilinders te beperken tot één 16-bits getal, waarbij 6 bits werden toegewezen voor een sector (maximaal aantal 63) en 10 voor een cilinder (maximaal aantal 1023). Het BIOS-kopnummer kreeg 8 cijfers toegewezen (maximaal aantal - 255). Maar de IDE-interface stond niet meer dan 16 heads toe, wat, met een sectorgrootte van 512 bytes, de som van alle beperkingen een bovengrens opleverde van 504MB(528.482.304 bytes). De oplossing voor dit probleem was het invoeren van het LBA-regime, d.w.z. "overdragen" van ongebruikte bits van het kopnummer om het cilindernummer te adresseren. Deze oplossing vereiste ondersteuning voor zowel hardware (van de IDE-controller) als software (vanuit het BIOS). Tegelijkertijd was de capaciteit van de ISA-bus uitgeput. Daarom werd er een enigszins opnieuw ontworpen controller (nu met een interface genaamd EIDE) op geplaatst systeembord, d.w.z. op dezelfde plaats waar de BIOS-chip met ondersteuning voor nieuwe functies zich bevond.

  • Maar zodra deze grens overwonnen was, bleek dat er al een volgende beperking aan verbonden was bestandssysteem FAT16 - formaat logische schijf mag niet groter zijn dan 2 GB (meer precies 2047 MB). Tegelijkertijd wordt de ruimte op de harde schijf uiterst inefficiënt gebruikt (zie het hoofdstuk "Problemen met clustering").

    De introductie van FAT32 maakte het mogelijk om deze limiet te overwinnen, maar al snel ‘klom deze er weer uit’ BIOS-probleem- op volledig adres sectoren kregen 24 bits toegewezen, en meer 8 GB(meer precies 7,85 GB) schijf geheugen met sectoren van 512 bytes bleek het onmogelijk. Voor de meeste moesten we nieuwe BIOS-functies introduceren schijfbewerkingen. Nu is de limiet 64 bits, wat overeenkomt met 8 miljard TB, dus voorlopig is er enige tijdreserve. Bovendien is bepaald dat blokken, en niet sectoren, onderworpen zijn aan nummering. Voorlopig is 1 blok gelijk aan 1 sector, maar zodra het aantal schijven de opgegeven limiet nadert, zal er enige reserve ontstaan ​​als gevolg van een toename van de blokgrootte.

    Omdat met de introductie van zoneregistratie de verwijzing naar de fysieke structuur van de aandrijving, uitgedrukt in cilinders, sectoren en koppen, irrelevant bleek te zijn, werd bovendien besloten om het driedimensionale coördinatensysteem achterwege te laten en over te stappen op een eendimensionaal - volgens het absolute sectornummer.

    Nu softwarebeperkingen Er wordt geen groei van de opslagcapaciteit in de nabije toekomst verwacht (maar sommige programma's kunnen vanwege fouten die ze bevatten niet werken met schijven groter dan 32 of 64 MB), hoewel bepaalde beperkingen gerelateerd blijven aan de hardware, d.w.z. met de fysieke organisatie van de IDE-interface.

    Interactie tussen de gebruiker en de schijf

    Het zou voor de gemiddelde gebruiker uiterst omslachtig zijn om bij te houden welke sectoren op zijn harde schijf al bezet zijn en waar nieuwe gegevens moeten worden geschreven. Om dit werk voor hem gemakkelijker te maken, introduceert een besturingssysteem (OS) het concept van een bestand en kunt u byte voor byte met de inhoud van het bestand werken. Om dit te doen, reserveert het besturingssysteem wat schijfruimte voor zijn behoeften. Zo ziet het toevoegen van een paar bytes aan het einde eruit bestaand bestand vanuit het oogpunt van het besturingssysteem in de hoofdmap.

    • 1. overweeg een inhoudsopgave met daarin vereiste bestand en plaats deze in buffer nr. 1,
    • 2. lees de FAT-tabel en plaats deze in buffer nr. 2,
    • 3. lees in overeenstemming met FAT de laatste (onvolledige) sector van het bestand in buffer nr. 3,
    • 4. voeg enkele van de vereiste bytes toe aan buffer nr. 3 totdat deze vol is,
    • 5. schrijf buffer nr. 3 naar de oorspronkelijke plaats op de schijf,
    • 6. zoek met FAT een vrij fragment op de schijf,
    • 7. schrijf de resterende bytes in buffer nr. 4,
    • 8. schrijf de inhoud van buffer nr. 4 naar het gevonden vrije schijffragment,
    • 9. breng wijzigingen aan in FAT (in buffer nr. 2) en schrijf het naar de oorspronkelijke locatie op de schijf,
    • 10. Breng wijzigingen aan in de bestandslengte in de inhoudsopgave (buffer nr. 1) en schrijf deze op dezelfde plaats op de schijf.

    Dit is gewoon het meeste eenvoudigste geval. Als het bestandssysteem geneste inhoudsopgaven, informatiebescherming, toegangscontrole, terugdraaien en herstel van fouten biedt, dan is de lijst noodzakelijke acties kan meerdere malen toenemen.

    We hebben al gezegd dat gegevens in de schijf worden geadresseerd via het logische sectornummer of via het cilinderkop-sectortriplet. Dit is precies hoe het besturingssysteem toegang krijgt tot het BIOS. Deze laatste moet op zijn beurt het besturingssysteem het volume van de schijf en, indien nodig, de geometrische kenmerken ervan vertellen, en ook het verzoek om een ​​bewerking met een specifieke sector vertalen in een reeks opdrachten voor een bepaalde interface. Voor besturingssysteeminterfacetype ST512/412, ESDI. IDE, SCSI, USB, IEEE1394 of bedrijfsmodus, PIO, UDMA zijn niet interessant. Ze is alleen geïnteresseerd in sectoren en dat is alles!

    Clusterproblemen

    Zoals we hebben gezien, is er voor het werken met bestanden voortdurend bepaalde informatie nodig over de plaatsing ervan op de schijf. In het bovenstaande geval is het FAT. Voor de eenvoud zullen we ons beperken tot het beschouwen van dit specifieke geval. Van de zeven schijfbewerkingen zijn er drie FAT. Gezien het feit dat bestandsbewerkingen uitgevoerd met hoofdbeweging aanzienlijk langzamer zijn dan bewerkingen zonder beweging, blijkt dat het opslaan van FAT in RAM verdubbelt de prestaties van het bestandssysteem ruimschoots. Maar er is ook een duidelijk negatief kenmerk: als u, voordat u de computer uitschakelt, de FAT-kopie die op de schijf is opgeslagen niet overeenkomt met de kopie in het RAM, is informatieverlies onvermijdelijk. Daarom is het uitschakelen van de computer met een knop of tuimelschakelaar op het voorpaneel, zoals gebruikelijk in DOS, niet langer acceptabel.

    Bovendien, als de buffers voor bestands- of directorygegevens in één sector klein zouden kunnen zijn, moet FAT soms volledig worden verwerkt, bijvoorbeeld bij het zoeken naar een vrij fragment.

    In FAT16 maximale hoeveelheid fragmenten bedoeld voor het opslaan van bestanden zijn ongeveer 65 duizend, en de ruimte die wordt ingenomen door tabellen is 128 KB (64K woorden van 2 bytes). Bij het toewijzen van ruimte per sector zal het maximale schijfvolume dus 32 MB zijn (sommige mensen herinneren zich nog dat er eigenlijk zo'n beperking was op de grootte van de harde schijf).

    Om de beschikbare schijfruimte voor het besturingssysteem te vergroten, moesten sectoren worden gecombineerd tot clusters die verschillende sectoren bevatten. Bovendien is het duidelijk dat wanneer de clustergrootte wordt verdubbeld, de FAT-grootte wordt gehalveerd, waardoor zowel het RAM-verbruik als de zoektijd naar vrije ruimte worden verminderd. Maar het vergroten van de omvang van clusters leidt tot een inefficiënt gebruik van schijfruimte. Ik kwam ooit een analogie tegen voor de distributie van schijfruimte met de noodzaak om voor alle goederen alleen met biljetten van honderd dollar te betalen: ik kocht een doosje lucifers - en er is geen $ 100, ik kocht een brood - nog eens honderd dollar . Het schrijven van zelfs maar één byte verbruikt het hele cluster. Met clusters van 32 KB (schijf van 2 GB) nemen 1000 bestanden van één byte met een totale lengte van minder dan een KB bijvoorbeeld 32 MB schijfruimte in beslag.

    De introductie van FAT32 heeft dit probleem gedeeltelijk geëlimineerd; nu is er nog maar 4 MB nodig om dezelfde hoeveelheid informatie te verwerken. Maar niets is gratis. De grootte van één FAT-element is verdubbeld en het aantal elementen is 8 keer toegenomen, dus nu zal het volume aan tabellen voor dit geval 2 MB zijn. Natuurlijk is dit volgens de huidige normen niet veel, maar als je bedenkt dat de opslagcapaciteit meer dan honderd GB kan bedragen, blijkt dat een aanzienlijk deel van het RAM-geheugen niet zal worden gebruikt om gebruikersgegevens op te slaan, maar voor de interne behoeften van het besturingssysteem. Laten we ook onthouden dat om een ​​vrij fragment op de schijf te vinden, het nodig kan zijn om door een aanzienlijk deel van de FAT te kijken, dus in een poging om de snelheid van het schijfsysteem te verhogen, verhogen we tegelijkertijd de belasting van CPU en RAM, wat leidt tot een afname van de algehele prestaties.

    Over het algemeen direct en de gemakkelijke manier er is geen toename van de productiviteit. Overal moeten we compromissen zoeken.

    Nadrukkelijk kenmerken van hard schijven

    Naast het volume zijn in de regel ook de snelheidskenmerken van aandrijvingen van belang. Hiervan kunnen twee belangrijke worden onderscheiden: gemiddelde toegangstijd Winchester-bedrijf gekocht van lijn datasnelheid.

    De toegangstijd is de tijd vanaf het moment waarop een klein deel van de gegevens wordt opgevraagd (het aanroepen van de BIOS-interrupt) tot het moment dat deze worden ontvangen (het terugkeren na de interrupt). De programma-uitvoeringstijd kan hier worden verwaarloosd; in dit geval bestaat de toegangstijd uit de positioneringstijd (zoektijd), dat wil zeggen het vinden van het gewenste spoor en de gemiddelde datawachttijd (latente tijd), d.w.z. tijd om de schijf zo te draaien dat de gewenste sector zich onder de leeskop bevindt. Uiteraard is de gemiddelde wachttijd gelijk aan de helft van de schijfrotatieperiode: 5,56 ms bij een rotatiesnelheid van 5400 rpm en 4,17 ms bij 7200 rpm. De positioneringstijd bestaat uit de tijd die nodig is om het hoofd te bewegen en de tijd om de trillingen na beweging te kalmeren. Omdat de amplitudevereisten voor lezen en schrijven verschillend zijn, kunnen de gemiddelde toegangs- en positioneringstijden ook verschillen. Helaas bestaat er geen uniforme methode om deze waarde te meten, dus gebruikt elk productiebedrijf zijn eigen methodologie om zijn producten in het best mogelijke licht te presenteren. Bovendien gebruiken verschillende bedrijven vaak verschillende termen om in wezen dezelfde hoeveelheden aan te duiden. Vaker geven specificaties de positioneringstijd aan, omdat het is kleiner.

    Ook met de lineaire gegevensoverdrachtsnelheid verloopt niet alles soepel. Ten eerste is er de gegevensoverdrachtsnelheid vanuit de cache van de controller: een meetbare hoeveelheid en in de regel de hoogste van alle overdrachtsnelheden. De wafercommunicatiesnelheid is meestal langzamer. Bovendien hangt het af van het nummer van de track; tegen het einde van de schijf kan deze snelheid 2-3 keer afnemen in vergelijking met wat wordt waargenomen op de eerste nummers. Specificaties vermelden vaak de maximale momentane leessnelheid van de schotel in bps. Hier kunt u de woorden van de fabrikant alleen maar op geloof aanvaarden of niet geloven, omdat... het kan niet worden gemeten op een schijf die is uitgerust met cachegeheugen. De maximale steady-state wisselkoers kan worden gemeten. "Maximaal" in in dit geval betekent dat het wordt gemeten in dat deel van de schijf dat dat wel heeft grootste aantal sectoren per spoor. Het wordt gedefinieerd als de verhouding tussen de hoeveelheid overgedragen gegevens en de tijd. Uiteraard omvat de tijd zowel de tijd waarin het hoofd boven de gegevens vliegt als de tijd gedurende welke het hoofd zich boven de service-informatiezones bevindt, evenals de tijd waarin het hoofd van spoor naar spoor overgaat. In de regel geven ze ofwel de maximale waarde van deze snelheid aan, ofwel bouwen ze een grafiek van de afhankelijkheid van deze snelheid van het sectornummer (een dergelijke grafiek wordt gegeven in het gedeelte "Geometrie van de harde schijf", zie figuur 3).

    U kunt de gegevensoverdrachtsnelheid van lezen, schrijven en verificatie meten. Bij een goed ontworpen aandrijving zouden alle drie deze grootheden moeten samenvallen. Voor een optimaal uitwisselingsproces moeten verschillende sporen niet vanaf dezelfde plek starten, maar met een verschuiving gelijk aan de verhouding van de overgangstijd naar 1 spoor en de rotatieperiode. In dit geval zou de eerste sector van het volgende spoor zich net onder de kop moeten bevinden op het moment dat de positionering voltooid is. Uiteraard kan de overgangstijd voor lezen en schrijven verschillend zijn, maar als het overgangsproces plotseling geen tijd heeft om te eindigen tegen de tijd dat de gewenste sector arriveert, zal dit leiden tot een snelheidsdaling van bijna de helft (met één werkoppervlak ) vanwege de noodzaak om te wachten op een hele revolutie. Ik denk dat fabrikanten dit niet toestaan, dus je mag verwachten dat de lees- en schrijfsnelheden overeenkomen. Wat de verificatiesnelheid betreft, is het raadzaam om deze te meten wanneer de snelheid van gegevensuitwisseling met de platen groter is dan de snelheid van gegevensoverdracht via de interface, wat bijvoorbeeld kan worden waargenomen bij het kiezen van een inadequate interface-bedieningsmodus. Verificatie is het proces waarbij in het interne geheugen van een schijf wordt gelezen zonder gegevens naar buiten over te dragen.

    Als voorbeeld geven we een profiel van lees-, schrijf- en verificatiesnelheden voor een schijf met een maximale stabiele gegevensoverdrachtsnelheid die hoger is dan de interfaceoverdrachtsnelheid (in feite ligt het punt natuurlijk niet in de interface van de schijf zelf - UDMA100, maar in de interface van de IDE-controller op het moederbord, waarop de schijf is aangesloten - UDMA33).



    Afb.5

    Voor moderne aandrijvingen de toegangstijd is ongeveer 15 ms en de vastgestelde lineaire gegevensoverdrachtsnelheid is ongeveer 30 MB/s. Het is gemakkelijk te zien dat tijdens het zoeken bijna een halve megabyte aan informatie kon worden gelezen of geschreven. In werkelijkheid wordt informatie echter meestal per cluster gelezen, d.w.z. per cluster. 4 KB elk, of het maximale aantal fragmenten ondersteund door BIOS - 64 KB. Bovendien overschrijdt het volume van een enkel gelezen stukje informatie nooit de bestandsgrootte (meer precies, de totale lengte van de clusters die het in beslag neemt), en de gemiddelde bestandsgrootte is in de regel niet groter dan enkele kilobytes. Daarom wordt de bepalende bijdrage aan de prestaties van schijfsystemen geleverd door de toegangstijd, en lineaire snelheid overdrachten hebben slechts een zeer klein effect op de uitvoeringstijd bestandsbewerkingen. Zelfs bij het schrijven of lezen van één lang bestand op een systeem met één taak echte snelheid uitwisseling blijkt aanzienlijk, soms meerdere keren, lager te zijn dan de vastgestelde snelheid van de schijf.



    Afb.6

    De toegangstijd wordt bepaald door de rotatiesnelheid van de schijf, het ontwerp van het koppositioneringsmechanisme, evenals de lineaire afmetingen die moeten worden verplaatst, dat wil zeggen de diameter van de platen. De steady-state wisselkoers hangt voornamelijk af van de opnamedichtheid en rotatiesnelheid. Het is onwaarschijnlijk dat je een aanzienlijke toename van de rotatiesnelheid van de platters mag verwachten, dus in de toekomst kun je nauwelijks hopen op een merkbare toename van de operationele prestaties van harde schijven.

    Het verkorten van de toegangstijd is voornamelijk mogelijk door de diameter van de platen te verkleinen, wat het mogelijk maakt om zowel de rotatiesnelheid te verhogen als de positioneringstijd te verkorten. Deze aanpak leidt echter tot een radicale vermindering van de opslagcapaciteit. En hoewel de eerste harde schijf platters had met een diameter van 24 inch, werd de eerste gebruikt in persoonlijke computer- ongeveer 5 (5,25" behuizingsvormfactor), en moderne - ongeveer 3 (en snelle SCSI-schijven met een 3,5" behuizingsvormfactor hebben kleinere platters), het is onwaarschijnlijk dat een grootschalige overgang naar 2,5-inch schijven mogelijk is verwacht in de nabije toekomst. De revolutie in toegangstijd zou eerder geassocieerd moeten worden met de overgang naar solid-state drives.

    Meest effectieve middelen het verbeteren van de schijfsysteemprestaties is caching, d.w.z. het opslaan van de meest gebruikte gegevens van de harde schijf in RAM. Het duurt immers ongeveer 15 ms om toegang te krijgen tot een specifieke byte op de schijf, en ongeveer 0,1 μs om toegang te krijgen tot een byte in het RAM. Zelfs caching met één cluster (buffer van 4 KB) voor regel-voor-regel leesbewerkingen tekstbestand met een regellengte van 80 tekens zal de leestijd met 50 keer worden verkort. Het vergroten van de buffergrootte zal dit proces verder versnellen. Daarom bevatten de schijven zelf ten eerste een buffer, meestal van 2 tot 8 MB, en ten tweede wordt caching uitgevoerd op besturingssysteemniveau.

    Interface

    Momenteel zijn er voor harde schijven (enkele schijven voor laptops, draagbare apparatuur en externe modellen niet meegerekend) twee parallelle interface, ontwikkeld in de jaren 80 van de vorige eeuw: IDE (ATA) en SCSI.

    IDE is democratischer. De hoofdbelasting daarin valt op de apparaatcontroller. De eerste aanpassingen werkten in de programmeerbare input/output-modus (PIO) en waren beperkt tot snelheden van 3 tot 16 MB/s. Externe controllers werden echter vaak nog meer “vertraagd” door de ISA-bus. In werkelijkheid kon zo'n controller zelfs op de PCI-bus geen overdrachtssnelheid hoger dan 8-9 MB/s bereiken. Vervolgens werd de ondersteunde gebruikt PCI-mechanisme directe geheugenuitwisseling (UDMA), resulterend in maximale snelheid verhoogd tot 33, 66 of 100 MB/s, afhankelijk van het type interface (en Maxtor produceert zelfs UDMA133-drives).

    SCSI heeft beide meer ruime mogelijkheden, en tegen een hogere prijs. Op deze interface kunt u niet alleen schijfstations aansluiten, maar ook tapedrives, scanners, printers etc. Bovendien kunnen meerdere apparaten tegelijkertijd werken, waardoor de centrale processor minder wordt belast. Het snelheidsbereik dat door SCSI wordt ondersteund, strekt zich uit van 5 tot 320 MB/s. In de toekomst is het de bedoeling om de uitwisselingssnelheid te verhogen tot 640 MB/s.

    Onlangs heeft IDE SCSI aanzienlijk vervangen. Zeker na de introductie van de UDMA-modus, waardoor de belasting van de processor sterk werd verminderd en het belangrijkste voordeel van SCSI ten opzichte van IDE verdween. Tegelijkertijd de komst van USB begon SCSI te verdringen van langzame apparaten zoals scanners en printers.

    Een verdere snelheidsverhoging bij het gebruik van parallelle interfaces is al zeer beperkt. ernstige problemen over de synchronisatie van datalijnen, dus het lijkt erop dat de toekomst aan seriële interfaces ligt.

    Momenteel is de ontwikkeling van een seriële versie van de IDE-interface actief aan de gang - Seriële ATA. Elke aandrijving wordt met een eigen 7-aderige kabel op de controller aangesloten. De eerste geplande snelheidslimiet is 150 MB/s, de volgende in de rij is 300 MB/s. Deze interfaces zullen, ondanks de aanzienlijke hardwareverschillen, softwarematig compatibel zijn met de momenteel bestaande parallelle IDE.

    Er zijn ook bepaalde ontwikkelingen gepland om de SCSI-interface te verbeteren. Er is ook een overgang naar seriële interface, evenals een aanzienlijke kostenverlaging als gevolg van de sterke concurrentie van SerialATA.

    Voor aandrijvingen harde schijven naast de besproken interfaces kunnen Compact Flash Type II-interfaces worden gebruikt - voor een 1-inch schijf IBM MicroDrive, USB, IEEE1394 (FireWire) - voor externe apparaten en Fibre Channel - voor de meest productieve servers.