Bedrijven die gegevensopslagsystemen gebruiken. SAS, NAS, SAN: een stap richting opslagnetwerken. Classificatie van opslagsystemen op verbindingstype

In dit artikel zullen we bekijken welke soorten gegevensopslagsystemen (SDS) er tegenwoordig bestaan, en we zullen ook een van de belangrijkste componenten van SDS beschouwen: externe verbindingsinterfaces (interactieprotocollen) en schijven waarop gegevens worden opgeslagen. We zullen ze ook algemeen vergelijken op basis van de geboden mogelijkheden. Voor voorbeelden verwijzen we naar de opslagsysteemlijn van DELL.

Voorbeelden van DAS-modellen
Voorbeelden van NAS-modellen
Voorbeelden van SAN-modellen
Soorten opslagmedia en protocol voor interactie met opslagsystemen Fibre Channel Protocol
iSCSI-protocol
SAS-protocol
Vergelijking van verbindingsprotocollen voor opslagsystemen

Bestaande soorten opslagsystemen

In het geval van een afzonderlijke pc kan het opslagsysteem worden opgevat als een interne harde schijf of schijfsysteem (RAID-array). Als het gaat om dataopslagsystemen op verschillende bedrijfsniveaus, kunnen we traditioneel drie technologieën onderscheiden voor het organiseren van dataopslag:

Direct aangesloten opslag (DAS);
Netwerk Attach Storage (NAS);
Storage Area Network (SAN).

DAS-apparaten (Direct Attached Storage) zijn een oplossing wanneer een gegevensopslagapparaat rechtstreeks op een server of werkstation wordt aangesloten, meestal via een interface die gebruikmaakt van het SAS-protocol.

NAS-apparaten (Network Attached Storage) zijn een vrijstaand geïntegreerd schijfsysteem, in wezen een NAS-server, met een eigen gespecialiseerd besturingssysteem en een reeks handige functies om het systeem snel op te starten en toegang tot bestanden te bieden. Het systeem maakt verbinding met een gewoon computernetwerk (LAN) en is een snelle oplossing voor het probleem van gebrek aan vrije schijfruimte voor gebruikers van dit netwerk.

Een Storage Area Network (SAN) is een speciaal speciaal netwerk dat opslagapparaten verbindt met applicatieservers, meestal gebaseerd op het Fibre Channel-protocol of het iSCSI-protocol.

Laten we nu elk van de bovengenoemde soorten opslagsystemen, hun positieve en negatieve kanten, eens nader bekijken.

DAS-opslagsysteemarchitectuur (Direct Attached Storage).

De belangrijkste voordelen van DAS-systemen zijn de lage kosten (vergeleken met andere opslagoplossingen), het gemak van implementatie en beheer, evenals de hoge snelheid van gegevensuitwisseling tussen het opslagsysteem en de server. Juist hierdoor hebben ze grote populariteit verworven in het segment van kleine kantoren, hostingproviders en kleine bedrijfsnetwerken. Tegelijkertijd hebben DAS-systemen ook hun nadelen, waaronder een niet-optimaal gebruik van bronnen, aangezien elk DAS-systeem de verbinding van een speciale server vereist en u in een bepaalde configuratie maximaal 2 servers op een schijfplank kunt aansluiten. .

Figuur 1: Direct Attached Storage-architectuur

Redelijk lage kosten. In wezen is dit opslagsysteem een schijfmand met harde schijven die zich buiten de server bevinden.
Eenvoudig te implementeren en te beheren.
Hoge uitwisselingssnelheid tussen de disk-array en de server.

Lage betrouwbaarheid. Als de server waarop deze opslag is aangesloten uitvalt, zijn de gegevens niet meer beschikbaar.
Lage mate van consolidatie van bronnen: alle capaciteit is beschikbaar voor één of twee servers, waardoor de flexibiliteit van de gegevensdistributie tussen servers wordt verminderd. Als gevolg hiervan is het noodzakelijk om meer interne harde schijven aan te schaffen of extra schijfplanken voor andere serversystemen te installeren
Laag gebruik van hulpbronnen.

Voorbeelden van DAS-modellen

Van de interessante modellen van apparaten van dit type zou ik de DELL PowerVault MD-serie willen noemen. Met de initiële modellen schijfplanken (JBOD) MD1000 en MD1120 kunt u schijfarrays maken met maximaal 144 schijven. Dit wordt bereikt dankzij de modulariteit van de architectuur; er kunnen maximaal zes apparaten op de array worden aangesloten, drie schijfplanken per RAID-controllerkanaal. Als we bijvoorbeeld een rack van 6 DELL PowerVault MD1120 gebruiken, dan implementeren we een array met een effectief datavolume van 43,2 TB. Dergelijke schijfbehuizingen worden via een of twee SAS-kabels aangesloten op externe poorten van RAID-controllers die zijn geïnstalleerd in Dell PowerEdge-servers en worden beheerd door de beheerconsole van de server zelf.

Als er behoefte is aan het creëren van een architectuur met hoge fouttolerantie, bijvoorbeeld om een failovercluster van MS Exchange of een SQL-server te creëren, dan is het DELL PowerVault MD3000-model geschikt voor deze doeleinden. Dit systeem beschikt al over actieve logica in de schijfbehuizing en is volledig redundant dankzij het gebruik van twee ingebouwde actief-actieve RAID-controllers die een gespiegelde kopie hebben van de gegevens die zijn gebufferd in het cachegeheugen.

Beide controllers verwerken data-lees- en schrijfstromen parallel, en als een van beide faalt, "haalt" de tweede data op van de naburige controller. Tegelijkertijd kan via verschillende interfaces (MPIO) verbinding worden gemaakt met een low-level SAS-controller binnen 2 servers (cluster), wat zorgt voor redundantie en taakverdeling in Microsoft-omgevingen. Om de schijfruimte uit te breiden, kunt u 2 extra MD1000-schijfplanken op de PowerVault MD3000 aansluiten.

NAS-opslagsysteemarchitectuur (Network Attached Storage).

NAS-technologie (netwerkopslagsubsystemen, Network Attached Storage) ontwikkelt zich als alternatief voor universele servers die veel functies bevatten (afdrukken, toepassingen, faxserver, e-mail, enz.). NAS-apparaten vervullen daarentegen slechts één functie: een bestandsserver. En ze proberen het zo goed, gemakkelijker en sneller mogelijk te doen.

NAS maakt verbinding met een LAN en biedt gegevenstoegang tot een onbeperkt aantal heterogene clients (clients met verschillende besturingssystemen) of andere servers. Momenteel zijn bijna alle NAS-apparaten ontworpen voor gebruik in Ethernet-netwerken (Fast Ethernet, Gigabit Ethernet) op basis van TCP/IP-protocollen. Toegang tot NAS-apparaten wordt gebruikt via speciale protocollen voor bestandstoegang. De meest voorkomende protocollen voor bestandstoegang zijn CIFS, NFS en DAFS. Dergelijke servers bevatten gespecialiseerde besturingssystemen, zoals MS Windows Storage Server.

Figuur 2: Network Attached Storage-architectuur

De goedkoopheid en beschikbaarheid van de bronnen, niet alleen voor individuele servers, maar ook voor alle computers in de organisatie.
Gemakkelijk bronnen delen.
Gemak van implementatie en beheer
Veelzijdigheid voor clients (één server kan MS-, Novell-, Mac- en Unix-clients bedienen)

Toegang tot informatie via “netwerkbestandssysteem”-protocollen is vaak langzamer dan toegang tot een lokale schijf.
De meeste goedkope NAS-servers bieden niet de snelle en flexibele methode voor toegang tot gegevens op blokniveau die inherent is aan SAN-systemen, in plaats van op bestandsniveau.

Voorbeelden van NAS-modellen

Momenteel klassieke NAS-oplossingen zoals PowerVault NF100/500/600. Dit zijn systemen gebaseerd op mainstream Dell-servers met 1 en 2 processors, geoptimaliseerd voor de snelle implementatie van NAS-services. Hiermee kunt u bestandsopslag tot 10 TB (PowerVault NF600) creëren met behulp van SATA- of SAS-schijven en deze server verbinden met een LAN. Er zijn ook geïntegreerde oplossingen met hogere prestaties, zoals PowerVault NX1950, die plaats biedt aan 15 schijven en kan worden uitgebreid tot 45 door extra MD1000-schijfbehuizingen aan te sluiten.

Een groot voordeel van de NX1950 is de mogelijkheid om niet alleen met bestanden te werken, maar ook met datablokken op iSCSI-protocolniveau. Bovendien kan de NX1950-variant werken als een gateway, waardoor bestandstoegang mogelijk wordt tot op iSCSI gebaseerde opslagsystemen (met bloktoegangsmethode), bijvoorbeeld MD3000i of Dell EqualLogic PS5x00.

SAN-opslagsysteemarchitectuur (Storage Area Network).

Een Storage Area Network (SAN) is een speciaal speciaal netwerk dat opslagapparaten verbindt met applicatieservers, meestal gebaseerd op het Fibre Channel-protocol, of op het steeds populairder wordende iSCSI-protocol. In tegenstelling tot NAS heeft SAN geen concept van bestanden: bestandsbewerkingen worden uitgevoerd op servers die zijn aangesloten op het SAN. SAN werkt in blokken, zoals een grote harde schijf. Het ideale resultaat van een SAN is de mogelijkheid van elke server met elk besturingssysteem om toegang te krijgen tot elk deel van de schijfcapaciteit die zich in het SAN bevindt. SAN-eindelementen zijn applicatieservers en opslagsystemen (disk-arrays, tapebibliotheken, enz.). En daartussen bevinden zich, net als in een gewoon netwerk, adapters, switches, bruggen en hubs. ISCSI is een “vriendelijker” protocol omdat het gebaseerd is op het gebruik van de standaard Ethernet-infrastructuur: netwerkkaarten, switches, kabels. Bovendien zijn op iSCSI gebaseerde opslagsystemen het populairst voor gevirtualiseerde servers vanwege het gemak waarmee het protocol kan worden ingesteld.

Figuur 3: Storage Area Network-architectuur

Hoge betrouwbaarheid van toegang tot gegevens op externe opslagsystemen. Onafhankelijkheid van de SAN-topologie van de gebruikte opslagsystemen en servers.
Gecentraliseerde gegevensopslag (betrouwbaarheid, veiligheid).
Handig gecentraliseerd schakel- en gegevensbeheer.
Verplaatst zwaar I/O-verkeer naar een afzonderlijk netwerk, waardoor het LAN wordt ontlast.
Hoge prestaties en lage latentie.
Schaalbaarheid en flexibiliteit van de logische SAN-structuur
Mogelijkheid om back-up, externe opslagsystemen en een extern back-up- en gegevensherstelsysteem te organiseren.
De mogelijkheid om zonder extra kosten fouttolerante clusteroplossingen te bouwen op basis van een bestaand SAN.

Hogere kosten
Moeilijkheden bij het opzetten van FC-systemen
De behoefte aan certificering van specialisten in FC-netwerken (iSCSI is een eenvoudiger protocol)
Strengere eisen voor componentcompatibiliteit en validatie.
Het verschijnen van DAS-‘eilanden’ in netwerken gebaseerd op het FC-protocol vanwege de hoge kosten, wanneer bedrijven vanwege budgetbeperkingen afzonderlijke servers met interne schijfruimte, NAS-servers of DAS-systemen hebben.

Voorbeelden van SAN-modellen

Op dit moment is er een vrij grote keuze aan disk-arrays voor het bouwen van SAN's, variërend van modellen voor kleine en middelgrote ondernemingen, zoals de DELL AX-serie, waarmee opslagcapaciteiten tot 60 TB kunnen worden gecreëerd, en eindigend met disk-arrays voor grote bedrijven, de DELL/EMC CX4-serie, kunt u opslagcapaciteiten tot 950 TB creëren. Er is een goedkope oplossing gebaseerd op iSCSI, dit is de PowerVault MD3000i - met de oplossing kunt u maximaal 16-32 servers aansluiten, u kunt maximaal 15 schijven in één apparaat installeren en het systeem uitbreiden met twee MD1000-planken, waardoor een 45TB-array.

Speciale vermelding verdient het Dell EqualLogic-systeem, gebaseerd op het iSCSI-protocol. Het is gepositioneerd als een opslagsysteem op ondernemingsniveau en is qua prijs vergelijkbaar met Dell-systemen | EMC CX4, met een modulaire poortarchitectuur die zowel het FC-protocol als het iSCSI-protocol ondersteunt. Het EqualLogic-systeem is peer-to-peer, wat betekent dat elke schijfbehuizing actieve RAID-controllers heeft. Wanneer deze arrays op één systeem zijn aangesloten, nemen de prestaties van de schijvenpool soepel toe met de toename van het beschikbare gegevensopslagvolume. Met het systeem kunt u arrays van meer dan 500 TB maken, het kan in minder dan een uur worden geconfigureerd en vereist geen gespecialiseerde kennis van beheerders.

Het licentiemodel is ook anders dan de rest en omvat al in de initiële prijs alle mogelijke snapshot-opties, replicatie- en integratietools in verschillende besturingssystemen en applicaties. Dit systeem wordt beschouwd als een van de snelste systemen in tests voor MS Exchange (ESRP).

Soorten opslagmedia en protocol voor interactie met opslagsystemen

Nadat u hebt besloten welk type opslagsysteem voor u het meest geschikt is om bepaalde problemen op te lossen, moet u verder gaan met het kiezen van een protocol voor interactie met het opslagsysteem en het selecteren van de schijven die in het opslagsysteem zullen worden gebruikt.

Momenteel worden SATA- en SAS-schijven gebruikt om gegevens op schijfarrays op te slaan. Welke schijven u voor opslag moet kiezen, hangt af van specifieke taken. Verschillende feiten zijn het vermelden waard.

SATA II-schijven:

Enkele schijfgroottes tot 1 TB beschikbaar
Rotatiesnelheid 5400-7200 RPM
I/O-snelheid tot 2,4 Gbps
MTBF is ongeveer twee keer minder dan die van SAS-schijven.
Minder betrouwbaar dan SAS-schijven.
Ongeveer 1,5 keer goedkoper dan SAS-schijven.

Enkele schijfformaten tot 450 GB beschikbaar
Rotatiesnelheid 7200 (NearLine), 10000 en 15000 RPM
I/O-snelheid tot 3,0 Gbps
MTBF is twee keer zo lang als SATA II-schijven.
Betrouwbaardere schijven.

Belangrijk! Vorig jaar begon de industriële productie van SAS-schijven met een verlaagde rotatiesnelheid van 7200 rpm (Near-line SAS Drive). Dit maakte het mogelijk om de hoeveelheid gegevens die op één schijf was opgeslagen te vergroten tot 1 TB en het energieverbruik van schijven met een snelle interface te verminderen. Ondanks het feit dat de kosten van dergelijke schijven vergelijkbaar zijn met de kosten van SATA II-schijven, en de betrouwbaarheid en I/O-snelheid op het niveau van SAS-schijven blijven.

Op dit moment is het dus de moeite waard om echt serieus na te denken over de gegevensopslagprotocollen die u gaat gebruiken in het kader van bedrijfsopslag.

Tot voor kort waren FibreChannel en SCSI de belangrijkste protocollen voor interactie met opslagsystemen. Nu is SCSI vervangen door de iSCSI- en SAS-protocollen, waardoor de functionaliteit ervan is uitgebreid. Laten we hieronder eens kijken naar de voor- en nadelen van elk van de protocollen en de bijbehorende interfaces voor verbinding met het opslagsysteem.

Fibre Channel-protocol

In de praktijk heeft moderne Fibre Channel (FC) snelheden van 2 Gbit/Sec (Fiber Channel 2 Gb), 4 Gbit/Sec (Fiber Channel 4 Gb) full-duplex of 8 Gbit/Sec, dat wil zeggen dat deze snelheid gelijktijdig wordt geleverd. in beide richtingen. Bij dergelijke snelheden zijn de verbindingsafstanden vrijwel onbeperkt: van de standaard 300 meter op de meest “gewone” apparatuur tot enkele honderden of zelfs duizenden kilometers bij gebruik van gespecialiseerde apparatuur. Het belangrijkste voordeel van het FC-protocol is de mogelijkheid om veel opslagapparaten en hosts (servers) te combineren in één storage area network (SAN). Tegelijkertijd is er geen probleem met het distribueren van apparaten over lange afstanden, de mogelijkheid van kanaalaggregatie, de mogelijkheid van redundante toegangspaden, "hot plugging" van apparatuur en een grotere immuniteit tegen ruis. Maar aan de andere kant hebben we hoge kosten en een hoge arbeidsintensiteit voor het installeren en onderhouden van disk-arrays met behulp van FC.

Belangrijk! Er moet onderscheid worden gemaakt tussen de twee termen Fibre Channel-protocol en Fibre Channel-interface. Het Fibre Channel-protocol kan op verschillende interfaces werken - zowel op een glasvezelverbinding met verschillende modulaties als op koperverbindingen.

Flexibele schaalbaarheid van opslag;
Hiermee kunt u opslagsystemen creëren over aanzienlijke afstanden (maar korter dan in het geval van het iSCSI-protocol; waarbij in theorie het gehele wereldwijde IP-netwerk als drager kan fungeren.
Geweldige reserveringsmogelijkheden.

Hoge kosten van de oplossing;
Nog hogere kosten bij het organiseren van een FC-netwerk over honderden of duizenden kilometers
Hoge arbeidsintensiteit tijdens implementatie en onderhoud.

Belangrijk! Naast de opkomst van het FC8 Gb/s-protocol wordt ook de opkomst van het FCoE-protocol (Fibre Channel over Ethernet) verwacht, dat het gebruik van standaard IP-netwerken mogelijk zal maken om de uitwisseling van FC-pakketten te organiseren.

iSCSI-protocol

Met iSCSI (IP-gebaseerde SCSI-encapsulatie) kunnen gebruikers IP-gebaseerde opslagnetwerken creëren met behulp van de Ethernet-infrastructuur en RJ45-poorten. Met iSCSI kunt u dus de beperkingen van direct aangesloten opslag overwinnen, inclusief het onvermogen om bronnen over servers te delen en het onvermogen om de capaciteit uit te breiden zonder applicaties af te sluiten. De overdrachtssnelheid is momenteel beperkt tot 1 Gb/s (Gigabit Ethernet), maar deze snelheid is voldoende voor de meeste zakelijke toepassingen van middelgrote ondernemingen, en dit wordt door talloze tests bevestigd. Het is interessant dat niet zozeer de gegevensoverdrachtsnelheid op één kanaal belangrijk is, maar de algoritmen voor de werking van RAID-controllers en de mogelijkheid om arrays in één enkele pool samen te voegen, zoals het geval is bij DELL EqualLogic, wanneer drie 1GB poorten worden op elke array gebruikt en er vindt taakverdeling plaats tussen de arrays in één groep.

Het is belangrijk op te merken dat SAN's die zijn gebaseerd op het iSCSI-protocol dezelfde voordelen bieden als SAN's die het Fibre Channel-protocol gebruiken, maar tegelijkertijd zijn de procedures voor het implementeren en beheren van het netwerk vereenvoudigd en zijn de kosten van dit opslagsysteem aanzienlijk. verminderd.

Hoge beschikbaarheid;
Schaalbaarheid;
Eenvoudig beheer, omdat Ethernet-technologie wordt gebruikt;
Lagere prijs voor het organiseren van een SAN met behulp van het iSCSI-protocol dan voor het gebruik van FC.
Eenvoudige integratie in virtualisatieomgevingen

Er zijn bepaalde beperkingen voor het gebruik van opslagsystemen met het iSCSI-protocol bij sommige OLAP- en OLTP-toepassingen, bij Real Time-systemen en bij het werken met een groot aantal videostreams in HD-formaat
Hoogwaardige opslagsystemen op basis van iSCSI, evenals opslagsystemen met het FC-protocol, vereisen het gebruik van snelle, dure Ethernet-switches
Het wordt aanbevolen om speciale Ethernet-switches of een VLAN-organisatie te gebruiken om datastromen te scheiden. Netwerkontwerp is een niet minder belangrijk onderdeel van het project dan bij het ontwikkelen van FC-netwerken.

Belangrijk! Fabrikanten beloven binnenkort massaal SAN's te gaan produceren op basis van het iSCSI-protocol met ondersteuning voor gegevensoverdrachtsnelheden tot 10 Gb/s. De definitieve versie van het DCE-protocol (Data Center Ethernet) wordt ook voorbereid; de massale verschijning van apparaten die het DCE-protocol ondersteunen, wordt tegen 2011 verwacht.

Vanuit het oogpunt van de gebruikte interfaces maakt het iSCSI-protocol gebruik van 1Gbit/C Ethernet-interfaces, en dit kunnen zowel koper- als glasvezelinterfaces zijn bij gebruik over lange afstanden.

SAS-protocol

Het SAS-protocol en de gelijknamige interface zijn ontworpen om parallelle SCSI te vervangen en een hogere doorvoersnelheid te bereiken dan SCSI. Hoewel SAS een seriële interface gebruikt in tegenstelling tot de parallelle interface die door traditionele SCSI wordt gebruikt, worden SCSI-opdrachten nog steeds gebruikt om SAS-apparaten te besturen. Met SAS kunt u over korte afstanden een fysieke verbinding tot stand brengen tussen een data-array en meerdere servers.

Redelijke prijs;
Gemakkelijke opslagconsolidatie - hoewel op SAS gebaseerde opslag niet verbinding kan maken met zoveel hosts (servers) als SAN-configuraties die de FC- of iSCSI-protocollen gebruiken, zijn er bij gebruik van het SAS-protocol geen problemen met extra apparatuur om gedeelde opslag voor meerdere servers te organiseren.
Het SAS-protocol maakt een hogere doorvoer mogelijk met behulp van 4-kanaalsverbindingen binnen één interface. Elk kanaal biedt 3 Gb/s, waarmee u een gegevensoverdrachtsnelheid van 12 Gb/s kunt bereiken (momenteel de hoogste gegevensoverdrachtsnelheid voor opslagsystemen).

Beperkt bereik - de kabellengte mag niet groter zijn dan 8 meter. Opslag met een verbinding via het SAS-protocol zal dus alleen optimaal zijn als de servers en arrays zich in hetzelfde rack of in dezelfde serverruimte bevinden;
Het aantal verbonden hosts (servers) is doorgaans beperkt tot meerdere knooppunten.

Belangrijk! In 2009 zal de SAS-technologie naar verwachting verschijnen met een gegevensoverdrachtsnelheid over één kanaal van 6 Gbit/s, wat de aantrekkelijkheid van het gebruik van dit protocol aanzienlijk zal vergroten.

Vergelijking van opslagverbindingsprotocollen

Hieronder vindt u een samenvattende tabel waarin de mogelijkheden van verschillende protocollen voor interactie met opslagsystemen worden vergeleken.

Parameter	Protocollen voor opslagverbindingen
Parameter
Architectuur	SCSI-opdrachten worden ingekapseld in een IP-pakket en verzonden via Ethernet, seriële transmissie	Seriële verzending van SCSI-opdrachten	Inbellen
Afstand tussen de diskarray en het knooppunt (server of switch)	Alleen beperkt door de afstand van IP-netwerken.	Niet meer dan 8 meter tussen apparaten.	50.000 meter zonder het gebruik van gespecialiseerde repeaters
Schaalbaarheid	Miljoenen apparaten – bij het werken via het IPv6-protocol.	32 apparaten	256 apparaten 16 miljoen apparaten als u FC-SW-architectuur (fabric switches) gebruikt
Prestatie	1 Gb/s (gepland voor ontwikkeling tot 10 Gb/s)	3 Gb/s bij gebruik van 4 poorten, tot 12 Gb/s (in 2009 tot 6 Gb/s op één poort)	Tot 8 Gb/s
Investeringsniveau (implementatiekosten)	Klein - Ethernet wordt gebruikt	Gemiddeld	Significant

Op het eerste gezicht zijn de gepresenteerde oplossingen dus vrij duidelijk onderverdeeld op basis van hun overeenstemming met de eisen van de klant. In de praktijk is alles echter niet zo eenvoudig; aanvullende factoren zijn inbegrepen in de vorm van budgetbeperkingen, de dynamiek van de ontwikkeling van de organisatie (en de dynamiek van het vergroten van de hoeveelheid opgeslagen informatie), branchespecifieke kenmerken, enz.

Wat is het doel van dataopslagsystemen (DSS)?

Gegevensopslagsystemen zijn ontworpen voor veilige en fouttolerante opslag van verwerkte gegevens met de mogelijkheid om snel de toegang tot gegevens te herstellen in geval van een systeemstoring.

Wat zijn de belangrijkste soorten opslagsystemen?

Op basis van het type implementatie worden opslagsystemen onderverdeeld in hardware en software. Afhankelijk van het toepassingsgebied zijn opslagsystemen onderverdeeld in individueel, voor kleine werkgroepen, voor werkgroepen, voor ondernemingen en bedrijven. Op basis van het type verbinding zijn opslagsystemen onderverdeeld in:

1. DAS (Direct Attached Storage - direct aangesloten systemen)

Een kenmerk van dit type systeem is dat de controle over de toegang tot gegevens voor apparaten die op het netwerk zijn aangesloten, wordt uitgevoerd door de server of het werkstation waarop de opslag is aangesloten.

2. NAS (Network Attached Storage - systemen aangesloten op een LAN)

Bij dit type systeem wordt de toegang tot informatie die in de repository is opgeslagen, beheerd door software die in de repository zelf draait.

3. SAN (Storage Attached Network — systemen die een netwerk vormen tussen servers die gegevens verwerken en feitelijk opslagsystemen);

Bij deze methode voor het bouwen van een gegevensopslagsysteem wordt de toegang tot informatie gecontroleerd door software die op opslagservers draait. Via SAN-switches wordt de opslag verbonden met servers met behulp van hoogwaardige toegangsprotocollen (Fibre Channel, iSCSI, ATA via ethernet, enz.)

Wat zijn de kenmerken van de software- en hardware-implementatie van opslagsystemen?

De hardware-implementatie van een opslagsysteem is een enkel hardwarecomplex dat bestaat uit een opslagapparaat (een schijf of een reeks schijven waarop gegevens fysiek worden opgeslagen) en een beheerapparaat (een controller die gegevens tussen opslagelementen verdeelt).

De software-implementatie van een opslagsysteem is een gedistribueerd systeem waarin gegevens worden opgeslagen zonder verwijzing naar een specifieke opslag of server, en de toegang tot de gegevens wordt uitgevoerd via gespecialiseerde software die verantwoordelijk is voor de veiligheid en beveiliging van de opgeslagen gegevens).

We starten een nieuwe sectie genaamd “Educatief Onderwijs”. Dingen die bij iedereen goed bekend lijken, zullen hier worden beschreven, maar, zoals vaak blijkt, niet voor iedereen, en niet zo goed. We hopen dat de sectie nuttig zal zijn.

Dus kwestie nr. 1 - "Gegevensopslagsystemen".

Gegevensopslagsystemen.

In het Engels worden ze in één woord genoemd: opslag, wat erg handig is. Maar dit woord wordt nogal onhandig in het Russisch vertaald: "opslag". Vaak gebruiken ze in het jargon van 'IT-mensen' het woord 'opslag' in de Russische transcriptie, of het woord 'kranilka', maar dit zijn volkomen slechte manieren. Daarom zullen we de term ‘gegevensopslagsystemen’ gebruiken, afgekort als opslagsystemen, of eenvoudigweg ‘opslagsystemen’.

Tot gegevensopslagapparaten wordt elk apparaat voor het vastleggen van gegevens gerekend: de zogenaamde. “flashdrives”, compact discs (CD, DVD, ZIP), tapedrives (Tape), harde schijven (harde schijf, ze worden op de ouderwetse manier ook wel “harde schijven” genoemd, omdat hun eerste modellen leken op de cartridgeclip van het 19e-eeuwse geweer met dezelfde naam) en dergelijke. Harde schijven worden niet alleen in computers gebruikt, maar ook als externe USB-opslagapparaten, en zelfs een van de eerste iPod-modellen is bijvoorbeeld een kleine harde schijf met een diameter van 1,8 inch, met hoofdtelefoonuitgang en ingebouwd scherm.

Recentelijk zijn de zgn “solid-state” opslagsystemen SSD (Solid State Disk, of Solid State Drive), die in principe vergelijkbaar zijn met een “flashdrive” voor een camera of smartphone, hebben alleen een controller en een groter volume aan opgeslagen gegevens. In tegenstelling tot een harde schijf heeft een SSD geen mechanisch bewegende delen. Hoewel de prijzen voor dergelijke opslagsystemen vrij hoog zijn, dalen ze snel.

Dit zijn allemaal consumentenapparaten, en bij de industriële systemen moet in de eerste plaats de nadruk worden gelegd op hardwareopslagsystemen: harde schijfarrays, de zogenaamde. RAID-controllers voor hen, tape-opslagsystemen voor langdurige gegevensopslag. Daarnaast een aparte klasse: controllers voor opslagsystemen, voor het beheren van gegevensback-ups, het maken van “snapshots” in het opslagsysteem voor daaropvolgende restauratie, gegevensreplicatie, enz.). Tot opslagsystemen behoren ook netwerkapparaten (HBA's, Fibre Channel Switches, FC/SAS-kabels, enz.). En tenslotte zijn er grootschalige oplossingen ontwikkeld voor dataopslag, archivering, dataherstel en disaster recovery.

Waar komen de gegevens vandaan die moeten worden opgeslagen? Van ons, geliefde gebruikers, van applicatieprogramma's, e-mail, maar ook van verschillende apparatuur - bestandsservers en databaseservers. Daarnaast is de aanbieder van een grote hoeveelheid data – de zogenaamde. M2M-apparaten (Machine-to-Machine-communicatie) - verschillende soorten sensoren, sensoren, camera's, enz.

Op basis van de gebruiksfrequentie van opgeslagen gegevens kunnen opslagsystemen worden onderverdeeld in opslagsystemen voor de korte termijn (online opslag), opslagsystemen voor de middellange termijn (near-line opslag) en opslagsystemen voor de lange termijn (offline opslag).

De eerste omvat de harde schijf (of SSD) van elke pc. De tweede en derde zijn externe opslagsystemen DAS (Direct Attached Storage), wat een array van schijven kan zijn buiten de computer (Disk Array). Ze kunnen op hun beurt ook worden onderverdeeld in "slechts een stel schijven", JBOD (Just a Bunch Of Disks) en een array met een iDAS-beheercontroller (Intelligent Disk Array Storage).

Externe opslagsystemen zijn er in drie soorten: DAS (Direct Attached Storage), SAN (Storage Area Network) en NAS (Network Attached Storage). Helaas kunnen zelfs veel ervaren IT-specialisten het verschil tussen SAN en NAS niet verklaren, omdat ze zeggen dat dit verschil ooit bestond, maar nu vermoedelijk niet meer bestaat. In feite is er een verschil, en wel een significant verschil (zie figuur 1).

Figuur 1. Verschil tussen SAN en NAS.

In een SAN zijn de servers zelf feitelijk verbonden met het opslagsysteem via het SAN Storage Area Network. In het geval van NAS zijn netwerkservers via een lokaal LAN verbonden met een gedeeld bestandssysteem in RAID.

Basisprotocollen voor opslagverbinding

SCSI-protocol(Small Computer System Interface), uitgesproken als "skázy", is een protocol dat halverwege de jaren tachtig werd ontwikkeld voor het aansluiten van externe apparaten op minicomputers. De versie, SCSI-3, vormt de basis voor alle communicatieprotocollen van opslagsystemen en maakt gebruik van de algemene SCSI-opdrachtenset. De belangrijkste voordelen: onafhankelijkheid van de gebruikte server, de mogelijkheid van parallelle werking van meerdere apparaten, hoge gegevensoverdrachtsnelheid. Nadelen: beperkt aantal aangesloten apparaten, verbindingsbereik zeer beperkt.

FC-protocol(Fiber Channel), intern protocol tussen de server en het gedeelde opslagsysteem, controller, schijven. Het is een veelgebruikt serieel communicatieprotocol dat werkt met snelheden van 4 of 8 Gigabit per seconde (Gbps). Het werkt, zoals de naam al aangeeft, via glasvezel, maar het kan ook via koper werken. Fibre Channel is het primaire protocol voor FC SAN-opslagsystemen.

iSCSI-protocol(Internet Small Computer System Interface), een standaardprotocol voor het overbrengen van datablokken via het bekende TCP/IP-protocol, d.w.z. "SCSI over IP". iSCSI kan worden beschouwd als een snelle, goedkope oplossing voor opslagsystemen die op afstand via internet zijn verbonden. iSCSI kapselt SCSI-opdrachten in TCP/IP-pakketten in voor verzending via een IP-netwerk.

SAS-protocol(Seriële aangesloten SCSI). SAS maakt gebruik van seriële gegevensoverdracht en is compatibel met SATA-harde schijven. Momenteel kan SAS gegevens overbrengen met 3 Gbit/s of 6 Gbit/s en ondersteunt het de full duplex-modus, d.w.z. kan gegevens in beide richtingen met dezelfde snelheid verzenden.

Soorten opslagsystemen.

Er kunnen drie hoofdtypen opslagsystemen worden onderscheiden:

DAS (direct aangesloten opslag)
NAS (netwerkgekoppelde opslag)
SAN (Storage Area Netwerk)

Opslagsystemen met directe aansluiting op DAS-schijven werden eind jaren zeventig ontwikkeld vanwege de explosieve toename van gebruikersgegevens, die simpelweg fysiek niet pasten in het interne langetermijngeheugen van computers (laten we voor jongeren opmerken dat we hier dan hebben we het niet over personal computers, die waren er toen nog niet, maar over grote computers, zogenaamde mainframes). De dataoverdrachtsnelheid in DAS was niet erg hoog, van 20 tot 80 Mbit/s, maar voor de behoeften van die tijd was het ruim voldoende.

Figuur 2. DAS

Opslagsystemen met netwerkverbinding NAS verschenen begin jaren 90. De reden hiervoor was de snelle ontwikkeling van netwerken en de kritieke vereisten voor het delen van grote hoeveelheden gegevens binnen een bedrijfs- of operatornetwerk. De NAS maakte gebruik van een speciaal netwerkbestandssysteem, CIFS (Windows) of NFS (Linux), waardoor verschillende servers van verschillende gebruikers tegelijkertijd hetzelfde bestand van de NAS konden lezen. De dataoverdrachtsnelheid was al hoger: 1 – 10 Gbit/s.

Figuur 3. NAS

Halverwege de jaren negentig verschenen netwerken voor het verbinden van FC SAN-opslagapparaten. Hun ontwikkeling werd gedreven door de noodzaak om gegevens verspreid over het netwerk te organiseren. Eén opslagapparaat in een SAN kan worden onderverdeeld in verschillende kleine knooppunten, LUN (Logical Unit Number) genaamd, die elk tot één server behoren. De snelheid van de gegevensoverdracht is toegenomen tot 2-8 Gbit/s. Dergelijke opslagsystemen kunnen technologieën voor gegevensbescherming bieden tegen verlies (momentopname, back-up).

Figuur 4. FC SAN

Een ander type SAN is IP SAN (IP Storage Area Network), ontwikkeld begin jaren 2000. FC SAN's waren duur, moeilijk te beheren en IP-netwerken waren op hun hoogtepunt, dus deze standaard ontstond. De opslagsystemen waren via een iSCSI-controller via IP-switches met de servers verbonden en leverden gegevensoverdrachtsnelheden van 1–10 Gbit/s.

Afb.5. IP-SAN.

De onderstaande tabel toont enkele vergelijkende kenmerken van alle beoordeelde opslagsystemen:

Type	NAS	SAN
Type	NAS
Parameter		FC SAN	*IP-SAN*	DAS
Transmissietype	SCSI, FC, SAS	F.C.	IP	IP
Gegevenstype	Gegevensblok	Bestand	Gegevensblok	Gegevensblok
Typische toepassing	Elk	Bestandsserver	Databases	Videobewaking
Voordeel	Uitstekende compatibiliteit	Eenvoudig te installeren, lage kosten	Goede schaalbaarheid	Goede schaalbaarheid
Gebreken	Moeilijkheden met controle. Inefficiënt gebruik van hulpbronnen. Slechte schaalbaarheid	Slechte prestaties. Beperkingen in toepasbaarheid	Hoge kosten. Complexiteit van de schaalconfiguratie	Lage prestaties

Kortom, SAN's zijn ontworpen om enorme gegevensblokken naar opslagsystemen over te dragen, terwijl NAS's toegang tot gegevens op bestandsniveau bieden. Met de combinatie van SAN + NAS bereikt u een hoge mate van data-integratie, hoge prestaties en het delen van bestanden. Dergelijke systemen worden uniforme opslag genoemd.

Uniforme opslagsystemen: netwerkopslagarchitectuur die zowel een bestandsgeoriënteerd NAS-systeem als een blokgeoriënteerd SAN-systeem ondersteunt. Dergelijke systemen werden begin jaren 2000 ontwikkeld om de beheerproblemen en de hoge totale eigendomskosten van afzonderlijke systemen in één onderneming op te lossen. Dit opslagsysteem ondersteunt vrijwel alle protocollen: FC, iSCSI, FCoE, NFS, CIFS.

Harde schijven

Alle harde schijven kunnen worden onderverdeeld in twee hoofdtypen: HDD (Hard Disk Drive, wat feitelijk vertaald wordt als “harde schijf”) en SSD (Solid State Drive, de zogenaamde “solid-state drive”). Dat wil zeggen, beide schijven zijn hard. Wat is dan een “zachte schijf”, bestaan ze überhaupt? Ja, in het verleden waren er zogenaamde “floppy disks” (ze werden zo genoemd vanwege het karakteristieke “ploppende” geluid in de diskdrive tijdens het gebruik). Schijven daarvoor zijn nog steeds te zien in de systeemeenheden van oude computers die bij sommige overheidsinstanties bewaard zijn gebleven. Hoe dan ook, dergelijke magnetische schijven kunnen ondanks alle wensen nauwelijks als opslagSYSTEMEN worden geclassificeerd. Dit waren enkele analogen van de huidige “flashdrives”, zij het met een zeer kleine capaciteit.

Het verschil tussen een HDD en een SSD is dat een HDD meerdere coaxiale magnetische schijven bevat en complexe mechanica heeft die de magnetische lees-schrijfkoppen beweegt, terwijl een SSD helemaal geen mechanisch bewegende delen heeft en in feite een geperste microschakeling is. in kunststof. Daarom is het strikt genomen onjuist om alleen HDD's "harde schijven" te noemen.

Harde schijven kunnen worden geclassificeerd op basis van de volgende parameters:

Uitvoering: HDD, SSD;
HDD-diameter in inches: 3,5, 2,5, 1,8 inch;
Interface: ATA/IDE, SATA/NL SAS, SCSI, SAS, FC
Gebruiksklasse: individueel (desktopklasse), zakelijk (enterpriseklasse).


Parameter	SATA	SAS	NL-SAS	SSD
Rotatiesnelheid (RPM)	7200	15000/10000	7200	N.A.
Typische capaciteit (TB)	1T/2T/3T	0,3T/0,6T/0,9T	2T/3T/4T	0,1T/0,2T/0,4T
MTBF (uur)	1 200 000	1 600 000	1 200 000	2 000 000
Opmerkingen	Ontwikkeling van ATA harde schijven met seriële gegevensoverdracht. SATA 2.0 ondersteunt overdrachtssnelheden van 300 MB/s, SATA3.0 ondersteunt tot 600 MB/s. De gemiddelde jaarlijkse AFR (Annualized Failure Rate) voor SATA-schijven bedraagt ongeveer 2%.	SATA harde schijven met een SAS-interface zijn geschikt voor tiering. De gemiddelde jaarlijkse AFR (Annualized Failure Rate) voor NL-SAS-schijven bedraagt ongeveer 2%.		Solid-state drives gemaakt van elektronische geheugenchips, inclusief een besturingsapparaat en een chip (FLASH/DRAM). De interfacespecificatie, functies en gebruiksmethode zijn hetzelfde als die van de HDD, de grootte en vorm zijn hetzelfde.

Kenmerken van harde schijven.

Capaciteit

Moderne harde schijven meten de capaciteit in gigabytes of terabytes. Voor HDD is deze waarde een veelvoud van de capaciteit van één magnetische schijf in de doos, vermenigvuldigd met het aantal magnetische schijven, waarvan er meestal meerdere zijn.

Rotatiesnelheid (alleen HDD)

De rotatiesnelheid van de magnetische schijven in de drive, gemeten in omwentelingen per minuut RPM (Rotation Per Minute), is gewoonlijk 5400 RPM of 7200 RPM. HDD's met SCSI/SAS-interfaces hebben een rotatiesnelheid van 10.000-15.000 RPM.

Gemiddelde toegangstijd = Gemiddelde zoektijd + gemiddelde wachttijd, d.w.z. tijd om informatie van de schijf op te halen.
Gegevensoverdrachtsnelheid

Dit zijn de snelheden waarmee een harde schijf gegevens kan lezen en schrijven, gemeten in megabytes per seconde (MB/S).

IOPS (invoer/uitvoer per seconde)

Het aantal I/O-bewerkingen (of lezen/schrijven) per seconde (Input/Output Operations Per Second), een van de belangrijkste indicatoren voor het meten van schijfprestaties. Voor toepassingen met frequente lees- en schrijfbewerkingen, zoals OLTP (Online Transaction Processing), is IOPS de belangrijkste indicator, omdat de prestaties van een bedrijfsapplicatie zijn ervan afhankelijk. Een andere belangrijke indicator is de datadoorvoer, die grofweg kan worden vertaald als ‘datatransmissiedoorvoer’, die laat zien hoeveel gegevens er per tijdseenheid kunnen worden overgedragen.

INVAL

Hoe betrouwbaar harde schijven ook zijn, gegevens erop gaan soms om verschillende redenen verloren. Daarom werd RAID-technologie (Redundant Array of Independent Disks) voorgesteld: een reeks onafhankelijke schijven met redundante gegevensopslag. Redundantie betekent dat alle bytes aan gegevens die naar de ene schijf worden geschreven, op een andere schijf worden gedupliceerd en kunnen worden gebruikt als de eerste schijf defect raakt. Bovendien helpt deze technologie de IOPS te verhogen.

De basisconcepten van RAID zijn het strippen en spiegelen van gegevens. Hun combinaties bepalen verschillende soorten RAID-arrays van harde schijven.

Er worden de volgende niveaus van RAID-arrays onderscheiden:

Combinaties van deze typen geven aanleiding tot nog een aantal nieuwe typen RAID:

De afbeelding legt het principe van RAID 0 (partitionering) uit:

Rijst. 6. RAID0.

En zo wordt RAID 1 (duplicatie) uitgevoerd:

Rijst. 7. RAID1.

En dit is hoe RAID 3 werkt. XOR is een logische functie “exclusieve OR” (eXclusive OR). Hiermee wordt de pariteitswaarde berekend voor datablokken A, B, C, D..., die naar een afzonderlijke schijf worden geschreven.

Rijst. 8. RAID3.

De bovenstaande diagrammen illustreren goed het principe van RAID-werking en behoeven geen commentaar. Voor de overige RAID-niveaus verstrekken wij geen bedieningsschema's; geïnteresseerden kunnen deze op internet vinden.

De belangrijkste kenmerken van RAID-typen worden weergegeven in de tabel.

Opslagsoftware

Opslagsoftware kan worden onderverdeeld in de volgende categorieën:

Beheer en administratie: beheer en instelling van infrastructuurparameters: ventilatie, koeling, werkingsmodi van de schijf, enz., controle op tijdstip van de dag, enz.
Gegevensbescherming: Snapshot (“snapshot” van de schijfstatus), kopiëren van de inhoud van LUN, meervoudige duplicatie (split mirror), duplicatie op afstand van gegevens (Remote Replication), continue gegevensbescherming CDP (Continuous Data Protection), enz.
Verhoogde betrouwbaarheid: diverse software voor het meervoudig kopiëren en back-uppen van datatransmissieroutes binnen en tussen datacenters.
Verhoogde efficiëntie: Thin Provisioning-technologie, automatische gelaagde opslag, deduplicatie, Quality of Service-beheer, cache prefetch, partitionering, automatische gegevensmigratie, vermindering van de schijfrotatiesnelheid (schijf spin-down)

De technologie is erg interessant" dunne bevoorrading" Zoals vaak het geval is in de IT, zijn termen vaak moeilijk adequaat te vertalen in het Russisch. Het is bijvoorbeeld moeilijk om het woord ‘provisioning’ (‘provisioning’, ‘support’, ‘provisioning’) accuraat te vertalen - geen van deze termen brengt de betekenis volledig). En als het “dun” is...

Om het principe van ‘thin provisioning’ te illustreren, kunnen we een banklening aanhalen. Wanneer een bank tienduizend creditcards uitgeeft met een limiet van 500.000, hoeft ze geen 5 miljard op haar rekening te hebben staan om dit volume aan leningen af te lossen. Creditcardgebruikers geven doorgaans niet al hun tegoed in één keer uit, maar gebruiken slechts een klein deel ervan. Elke individuele gebruiker kan echter het gehele of bijna het gehele geleende bedrag gebruiken, als het totale bedrag aan bankgelden niet is opgebruikt.

Rijst. 9. Dunne bevoorrading.

Het gebruik van thin provisioning stelt ons dus in staat het probleem van inefficiënte toewijzing van ruimte in het SAN op te lossen, ruimte te besparen, administratieve procedures voor het toewijzen van ruimte aan applicaties op opslag te vergemakkelijken en het zogenaamde overinschrijven te gebruiken, dat wil zeggen meer ruimte toe te wijzen aan applicaties dan we fysiek hebben, in de hoop dat die applicaties niet tegelijkertijd alle ruimte in beslag nemen. Naarmate de behoefte daartoe ontstaat, is het later mogelijk om de fysieke opslagcapaciteit te vergroten.

De indeling van een opslagsysteem in lagen (tiered storage) gaat ervan uit dat verschillende gegevens worden opgeslagen op opslagapparaten waarvan de snelheid overeenkomt met de frequentie van toegang tot deze gegevens. Veelgebruikte gegevens kunnen bijvoorbeeld in ‘online opslag’ worden geplaatst op SSD-schijven met hoge toegangssnelheden en hoge prestaties. De prijs van dergelijke schijven is echter nog steeds hoog, dus het is raadzaam om ze (voorlopig) alleen voor online opslag te gebruiken.

De snelheid van FC/SAS-schijven is ook behoorlijk hoog en de prijs is redelijk. Daarom zijn dergelijke schijven zeer geschikt voor “near-line storage”, waar gegevens worden opgeslagen die niet zo vaak, maar tegelijkertijd niet zo zelden worden gebruikt.

Ten slotte hebben SATA/NL-SAS-schijven relatief lage toegangssnelheden, maar ze hebben een hoge capaciteit en zijn relatief goedkoop. Daarom worden ze meestal gebruikt voor offline opslag, voor zelden gebruikte gegevens.

Zodra het besturingssysteem merkt dat de toegang tot gegevens in offline opslag frequenter is geworden, zet het deze over naar near-line opslag, en bij verdere intensivering van het gebruik ervan, naar online opslag op SSD-schijven.

Deduplicatie (eliminatie van herhalingen) van gegevens(ontdubbeling, DEDUP). Zoals de naam al doet vermoeden, elimineert deduplicatie dubbele gegevens uit de schijfruimte die doorgaans wordt gebruikt voor gegevensback-ups. Hoewel het systeem niet kan bepalen welke informatie redundant is, kan het wel de aanwezigheid van dubbele gegevens detecteren. Hierdoor wordt het mogelijk om de capaciteitsbehoefte van het redundantiesysteem aanzienlijk te verminderen.

Schijf-spin-down) – wat gewoonlijk ‘slaapstand’ (in slaap vallen) van de schijf wordt genoemd. Als de gegevens op een bepaalde schijf lange tijd niet worden gebruikt, dan Schijf-spin-down zet het in de slaapstand om het energieverbruik te verminderen als de schijf op normale snelheid draait. Dit verlengt ook de levensduur van de schijf en verhoogt de betrouwbaarheid van het systeem als geheel. Wanneer er een nieuw verzoek binnenkomt voor gegevens op deze schijf, wordt deze “wakker” en neemt de rotatiesnelheid toe naar normaal. De wisselwerking tussen het besparen van energie en het vergroten van de betrouwbaarheid is enige vertraging bij de eerste toegang tot gegevens op de schijf, maar deze kosten zijn goed gerechtvaardigd.

"Snapshot" van de schijfstatus (Snapshot). Een momentopname is een volledig bruikbare kopie van een specifieke set gegevens op de schijf op het moment dat de kopie werd gemaakt (vandaar dat het een “momentopname” wordt genoemd). Een dergelijke kopie wordt gebruikt om de systeemstatus ten tijde van het kopiëren gedeeltelijk te herstellen. In dit geval wordt de continuïteit van het systeem helemaal niet beïnvloed en gaan de prestaties niet achteruit.

Gegevensreplicatie op afstand: Werkt met behulp van Mirroring-technologie. Kan meerdere kopieën van gegevens op twee of meer locaties bewaren om gegevensverlies bij natuurrampen te voorkomen. Er zijn twee soorten replicatie: synchroon en asynchroon, het verschil daartussen wordt uitgelegd in de figuur.

Rijst. 10. Gegevensreplicatie op afstand (Remote Replication).

Continue gegevensbescherming CDP (Continue gegevensbescherming), ook wel continue back-up of realtime back-up genoemd, is het automatisch maken van een back-upkopie wanneer gegevens veranderen. Tegelijkertijd wordt het mogelijk om op elk moment gegevens te herstellen in geval van een ongeluk, en is er een actuele kopie van de gegevens beschikbaar, en niet die van een paar minuten of uren geleden.

Beheer- en administratieprogramma's (Managementsoftware): Dit omvat een verscheidenheid aan software voor het beheren en administreren van verschillende apparaten: eenvoudige configuratieprogramma's (cofiguratiewizards), gecentraliseerde monitoringprogramma's: topologieweergave, realtime monitoring, mechanismen voor het genereren van storingsrapporten. Dit omvat ook Business Guarantee-programma's: multidimensionale prestatiestatistieken, prestatierapporten en -query's, enz.

Noodherstel (DR, noodherstel). Dit is een vrij belangrijk onderdeel van serieuze industriële opslagsystemen, hoewel vrij duur. Maar deze kosten moeten worden gedragen om niet van de ene op de andere dag te verliezen ‘wat door zware arbeid is verworven’. De hierboven besproken gegevensbeschermingssystemen (Snapshot, Remote Replication, CDP) zijn goed totdat zich een natuurramp voordoet op de plaats waar het opslagsysteem zich bevindt: een tsunami, overstroming, aardbeving of (pah-pah-pah) nucleaire oorlog. En elke oorlog kan ook de levens van mensen die nuttige dingen doen enorm bederven, bijvoorbeeld door gegevens op te slaan en niet met een machinegeweer rond te rennen om andermans territorium af te snijden of sommige ‘ongelovigen’ te straffen. Replicatie op afstand impliceert dat het replicerende opslagsysteem zich in dezelfde stad bevindt, of op zijn minst dichtbij. Wat bijvoorbeeld niet helpt bij een tsunami.

Disaster Recovery-technologie gaat ervan uit dat het back-upcentrum dat wordt gebruikt om gegevens te herstellen tijdens natuurrampen zich op aanzienlijke afstand van het hoofddatacenter bevindt en ermee communiceert via een datatransmissienetwerk dat bovenop een transportnetwerk is gelegd, meestal een optisch netwerk. Het gebruik van een dergelijke opstelling van de hoofd- en back-updatacenters zou bijvoorbeeld eenvoudigweg technisch onmogelijk zijn om CDP-technologie te gebruiken.

DR-technologie maakt gebruik van drie fundamentele concepten:

BW (Back-upvenster)– “reserveringsvenster”, de tijd die het back-upsysteem nodig heeft om de ontvangen hoeveelheid gegevens van het werkende systeem te kopiëren.
RPO (herstelpuntdoelstelling)– “Acceptabel herstelpunt”, de maximale tijdsperiode en de bijbehorende hoeveelheid gegevens die aanvaardbaar is voor een gebruiker van een opslagsysteem om te verliezen.
RTO (hersteltijddoelstelling)– “aanvaardbare onbeschikbaarheidstijd”, de maximale tijd gedurende welke het opslagsysteem niet beschikbaar kan zijn zonder kritische gevolgen voor de hoofdactiviteit.

Rijst. 11. Drie fundamentele concepten van DR-technologie.

* * *

Dit essay pretendeert niet volledig te zijn en legt alleen de basisprincipes van het opslagsysteem uit, zij het niet volledig. Verschillende bronnen op internet bevatten veel documenten die alle hier genoemde (en niet genoemde) punten gedetailleerder beschrijven.

Vervolg van het opslagonderwerp over objectopslagsystemen -.

Het bedrijf Trinity is een van de leiders op de IT-markt onder leveranciers van dataopslagsystemen (DSS) in Rusland. Gedurende onze meer dan 25-jarige geschiedenis, als officiële leverancier en partner van bekende merken van opslagsystemen, hebben we onze klanten honderden dataopslagsystemen geleverd voor verschillende doeleinden van apparatuurleveranciers (fabrikanten) zoals: IBM, Dell EMC , NetApp, Lenovo, Fujitsu, HP, Hitachi, Oracle (Sun Microsystems), Huawei, RADIX, Infortrend. Sommige opslagsystemen bevatten meer dan 1.000 harde schijven en hadden een capaciteit van meer dan een petabyte.

Tegenwoordig zijn we een systeemintegrator van meerdere leveranciers en houden we ons bezig met het ontwerp en de bouw van IT-infrastructuur voor ondernemingen, waarbij we onze klanten niet alleen dataopslagsystemen van bekende merken leveren en implementeren, maar ook server- en netwerkapparatuur, technische infrastructuur,en, evenals beheer en monitoring. De alomvattende aanpak van Trinity wordt verzekerd door de diepgaande expertise van onze ingenieurs en langdurige partnerschappen met hardware- en softwarefabrikanten. Tegenwoordig kunnen we uitgebreide IT-oplossingen bieden voor bedrijven van elke omvang en voor taken van elke complexiteit.

Wij bieden een breed assortiment GRATIS diensten, waarmee we mogelijke activiteiten begeleiden in relaties met onze potentiële klanten van IT-apparatuur en -oplossingen. Wij staan klaar om GRATIS een oplossing voor een IT-probleem uit te werken en voor te bereiden in termen van het analyseren van alle mogelijke opties, het kiezen van de optimale, het berekenen van de oplossingsarchitectuur, het opstellen van alle hardware- en softwarespecificaties, evenals het inzetten van deze oplossing in de de infrastructuur van de klant.

Een systematische aanpak voor het alomvattend oplossen van de IT-problemen van een klant of het leveren van individuele IT-componenten van een oplossing impliceert diepgaand overleg met Trinity-experts om de enige juiste en optimale oplossing te selecteren.

Trinity is een officiële partner van toonaangevende fabrikanten van opslagapparatuur en software, bevestigd door de hoogste statussen Premier, GOLD, PLATINUM en ontvangt speciale onderscheidingen waarmee leveranciers hun partners erkennen voor prestaties op het gebied van expertise en implementatie van complexe informatietechnologieën in de industrieën van productie, handel en openbaar bestuur.

We bieden niet alleen de aankoop van dataopslagapparatuur aan van toonaangevende internationale merken (fabrikanten), zoals Dell EMC, Lenovo, NetApp, Fujitsu, HP (HPe), Hitachi, Cisco, IBM, Huawei, maar we zijn ook bereid om de gehele scala aan IT-diensten voor u: het selecteren van apparatuur, advies, het opstellen van specificaties, pilottesten in ons laboratorium of bij u op locatie, het opzetten, installeren en optimaliseren van de infrastructuur specifiek voor uw taken en specifieke toepassingen. We zijn ook bereid om speciale prijzen te bieden voor geleverde dataopslagsystemen en aanverwante apparatuur en software, en om gekwalificeerde technische ondersteuning en service te bieden.

Wij staan altijd klaar om te helpen bij het ontwikkelen van technische specificaties en specificaties voor dataopslagsystemen (DSS) en serverapparatuur voor specifieke taken, diensten en toepassingen, het selecteren van financiële voorwaarden (termijnen, leasing), het leveren en installeren van apparatuur op de locatie van de klant en de daaropvolgende inbedrijfstelling met advies en training van IT-medewerkers van klanten.

Selectie van de optimale apparatuurconfiguratie voor gegevensopslag en -verwerking

Wij staan klaar om u optimaal geconfigureerde dataopslagsystemen aan te bieden. In ons portfolio aan oplossingen hebben wij diverse dataopslagsystemen: All-Flash Class systemen (flash), Hybride opslagsystemen op solid-state Flash drives, SSD, NVMe, SAS, SATA met diverse mogelijkheden om verbinding te maken met hosts, zoals file omgevingen (netwerkbestandssysteem NFS en SMB), en blokopslagsystemen (Fibre Channel en iSCSI), en zijn ook klaar om hypergeconvergeerde systemen (HCI) te berekenen. U kunt uw taken of wensen formuleren voor de samenstelling van het opslagsysteem, prestatie-eisen (IOPs - input/output operations per second), eisen aan toegangstijd (Latency, vertraging in milli- of microseconden), opslagcapaciteit (gigabytes, terabytes, petabytes ), fysieke omvang en energieverbruik, evenals servers en software (besturingssystemen, hypervisors en applicatietoepassingen). Wij staan klaar om u telefonisch of per mail te adviseren en staan klaar om u een volledige of gedeeltelijke audit aan te bieden van de middelen en opslagdiensten van de IT-infrastructuur van uw bedrijf, voor een diepgaand inzicht in uw taken, vereisten en mogelijkheden voor de optimale selectie van een IT-oplossing (opslagsysteem) of de implementatie van een complex project, waarvan de resultaten vele jaren voor uw bedrijf zullen werken, met de mogelijkheid om het vermogen en de opslagcapaciteit te vergroten met groeiende eisen, uw specifieke kenmerken en ontwikkelingstaken. U kunt gegevensopslagsystemen in uw infrastructuur selecteren (specificaties en prijzen ontvangen), proeftesten uitvoeren van gegevensopslagsystemen in uw infrastructuur, alle noodzakelijke adviezen ontvangen en vervolgens gegevensopslagsystemen en andere gerelateerde apparatuur en software kopen, waarbij u een single-vendor of multi-leverancier ontvangt. leverancieroplossing, en onze specialisten zullen de gehele complexe leveringen en werkzaamheden voltooien, vanaf uw eerste contact met ons tot het ondertekenen van certificaten van voltooide werkzaamheden en de dienstverlening.

Naast kant-en-klare en geconfigureerde dataopslagsystemen biedt Trinity een breed scala aan serverapparatuur en netwerkinfrastructuur die zijn geïntegreerd in de IT-infrastructuur van de klant voor een alomvattende oplossing voor problemen met dataopslag en -verwerking. Bijna elke recensie van opslagsystemen die op thematische sites en forums te vinden is, zal zeker informatie bevatten van onze langetermijnpartners IBM, Dell EMC, NetApp, Lenovo, Fujitsu, HP, Hitachi, Cisco en Huawei. Al deze dataopslagapparatuur kunt u bij ons snel en voordelig aanschaffen en installeren.

Dimensionering en selectie van specificaties voor gegevensopslagsystemen voor de taken van uw bedrijf

We hebben zowel kant-en-klare, meest populaire dataopslagsystemen op voorraad als alle mogelijkheden voor het snel en nauwkeurig ontwikkelen van technische specificaties voor het ontwikkelen van opslagsysteemconfiguraties voor de behoeften van een specifiek bedrijf. Onze systemen kunnen 24 uur per dag, 7 dagen per week, 365 dagen per jaar zonder storingen of fouten functioneren. We bereiken dergelijke statistieken door de hoge kwaliteit van de geleverde oplossingen en het rigoureus testen van alle eenheden en componenten van opslagsystemen voordat ze naar onze klanten worden verzonden. Het gebruik van RAID-technologieën, fouttolerantietools, clustering en rampenbeschermingsoplossingen (Disaster Recovery), zowel op hardwareniveau als op het niveau van besturingssystemen, controllers, hypervisors en geïmplementeerde services, garandeert de integriteit en beschikbaarheid van verwerkte en opgeslagen informatie op gegevensopslagsystemen en op back-ups. U kunt eenvoudig gegevensopslagsystemen bij ons bedrijf kopen of ons uitnodigen om deel te nemen aan een complex IT-project waarbij apparatuur voor gegevensopslag een van de componenten is van de IT-infrastructuur van de onderneming.

In-house ontwikkeling van dataopslagsysteem

Het bedrijf Trinity heeft onder zijn eigen merk "FlexApp" een dataopslagsysteem (DSS) ontwikkeld en geleverd aan de Russische markt. Dit opslagsysteem is gebaseerd op RAIDIX-software. De lijn van in eigen land geproduceerde opslagapparatuur van Trinity omvat zowel hoogwaardige gegevensopslagsystemen op basis van flashdrives (All-Flash) als opslagsystemen met hoge capaciteit die gebruik maken van veel van de meest ruime harde schijven van 16TB (terabytes) in elke plank met de mogelijkheid om combineer deze planken tot pools met een totale capaciteit van honderden petabytes. Het door ons ontwikkelde FlexApp-gegevensopslagsysteem kan de basis vormen voor gegevensopslagapparatuur waarmee telecomoperatoren kunnen voldoen aan de vereisten van de Yarovaya-wet.

Hoe kunt u een gegevensopslagsysteem van ons bedrijf kopen?

Om een gegevensopslagsysteem van ons bedrijf te berekenen en aan te schaffen, moet u per post een aanvraag indienen voor het model waarin u geïnteresseerd bent of uw vereisten voor de samenstelling van een dergelijk model beschrijven. U kunt ons ook tijdens kantooruren bellen. Wij bespreken graag met u de taken en vereisten voor gegevensopslagsystemen, hun prestaties en het niveau van fouttolerantie. We staan klaar om volledig en gratis deskundig advies te geven over de configuratie en technische kenmerken van alle gegevensopslagsystemen geproduceerd door onze partners: Dell EMC, Lenovo, NetApp, Fujitsu, HP (HPe), Hitachi, Cisco, IBM, Huawei voor de optimale selectie van de gewenste oplossing.

Onze kantoren met ingenieurs en experts zijn gevestigd in drie regio’s van het land:

Centraal Federaal District, Moskou;
Noordwestelijk Federaal District, Sint-Petersburg;
Federaal District Oeral, Jekaterinenburg.

Wij staan altijd voor u klaar en nodigen u uit om de Trinity-kantoren te bezoeken om oplossingen voor uw IT-problemen te bespreken met onze managers, experts, ingenieurs en bedrijfsmanagement. Indien nodig staan wij klaar om bijeenkomsten te organiseren tussen klanten en vertegenwoordigers van verkopers (fabrikanten) en toeleveranciers. Onze medewerkers staan ook klaar om bij u ter plaatse te komen voor een kennismaking en gedetailleerd onderzoek naar de IT-infrastructuur en werking van de IT-diensten.

Informatie is de drijvende kracht achter het moderne bedrijfsleven en wordt momenteel beschouwd als het meest waardevolle strategische bezit van elke onderneming. De hoeveelheid informatie groeit exponentieel, samen met de groei van mondiale netwerken en de ontwikkeling van e-commerce. Succes in de informatieoorlog vereist een effectieve strategie voor het opslaan, beschermen, delen en beheren van uw belangrijkste digitale bezit – gegevens – zowel vandaag als in de nabije toekomst.

Het beheren van opslagbronnen is een van de meest urgente strategische problemen geworden waarmee IT-afdelingen worden geconfronteerd. Door de ontwikkeling van internet en fundamentele veranderingen in bedrijfsprocessen verzamelt informatie zich met een ongekende snelheid. Naast het dringende probleem van het garanderen van de mogelijkheid om de hoeveelheid opgeslagen informatie voortdurend te vergroten, staat het probleem van het garanderen van de betrouwbaarheid van de gegevensopslag en de constante toegang tot informatie niet minder urgent op de agenda. Voor veel bedrijven is de formule ‘24 uur per dag, 7 dagen per week, 365 dagen per jaar’ de norm geworden.

Bij een losse PC kan een opslagsysteem (SDS) worden opgevat als een losse interne harde schijf of schijfsysteem. Als het om bedrijfsopslagsystemen gaat, kunnen we traditioneel drie technologieën onderscheiden voor het organiseren van gegevensopslag: Direct Attached Storage (DAS), Network Attach Storage (NAS) en Storage Area Network (SAN).

Direct aangesloten opslag (DAS)

DAS-technologie omvat een directe (directe) verbinding van schijven met een server of pc. In dit geval kunnen opslagapparaten (harde schijven, tapedrives) intern of extern zijn. Het eenvoudigste geval van een DAS-systeem is een enkele schijf in een server of pc. Bovendien kan een DAS-systeem ook het organiseren van een interne RAID-array van schijven omvatten met behulp van een RAID-controller.

Het is vermeldenswaard dat, ondanks de formele mogelijkheid om de term DAS-systeem te gebruiken in relatie tot een enkele schijf of een interne reeks schijven, een DAS-systeem doorgaans wordt opgevat als een extern rek of mandje met schijven, dat kan worden beschouwd als een autonoom opslagsysteem (Fig. 1). Naast een onafhankelijke stroomvoorziening hebben dergelijke standalone DAS-systemen een gespecialiseerde controller (processor) om de opslagarray te beheren. Een dergelijke controller kan bijvoorbeeld een RAID-controller zijn met de mogelijkheid om RAID-arrays van verschillende niveaus te organiseren.

Rijst. 1. Voorbeeld van een DAS-opslagsysteem

Opgemerkt moet worden dat standalone DAS-systemen meerdere externe I/O-kanalen kunnen hebben, waardoor het mogelijk is meerdere computers tegelijkertijd op het DAS-systeem aan te sluiten.

SCSI (Small Computer Systems Interface), SATA, PATA en Fibre Channel-interfaces kunnen worden gebruikt als interfaces voor het aansluiten van schijven (intern of extern) in DAS-technologie. Als SCSI-, SATA- en PATA-interfaces voornamelijk worden gebruikt voor het aansluiten van interne schijven, wordt de Fibre Channel-interface uitsluitend gebruikt voor het aansluiten van externe schijven en stand-alone opslagsystemen. Het voordeel van de Fibre Channel-interface is in dit geval dat deze geen strikte lengtebeperking kent en kan worden gebruikt wanneer de server of pc die op het DAS-systeem is aangesloten, zich op aanzienlijke afstand ervan bevindt. SCSI- en SATA-interfaces kunnen ook worden gebruikt om externe opslagsystemen aan te sluiten (in dit geval wordt de SATA-interface eSATA genoemd). Deze interfaces hebben echter een strikte beperking op de maximale lengte van de kabel die het DAS-systeem en de aangesloten server verbindt.

De belangrijkste voordelen van DAS-systemen zijn de lage kosten (vergeleken met andere opslagoplossingen), het gemak van implementatie en beheer, evenals de hoge snelheid van gegevensuitwisseling tussen het opslagsysteem en de server. Eigenlijk is het juist hierdoor dat ze grote populariteit hebben verworven in het segment van kleine kantoren en kleine bedrijfsnetwerken. Tegelijkertijd hebben DAS-systemen ook hun nadelen, waaronder slechte beheersbaarheid en suboptimaal gebruik van bronnen, aangezien elk DAS-systeem de verbinding van een speciale server vereist.

Momenteel nemen DAS-systemen een leidende positie in, maar het omzetaandeel van deze systemen neemt voortdurend af. DAS-systemen worden geleidelijk vervangen door universele oplossingen met de mogelijkheid tot soepele migratie van NAS-systemen, of door systemen die de mogelijkheid bieden om ze zowel als DAS-, NAS- en zelfs SAN-systemen te gebruiken.

DAS-systemen moeten worden gebruikt wanneer het nodig is om de schijfruimte van een server te vergroten en deze buiten het chassis te verplaatsen. DAS-systemen kunnen ook worden aanbevolen voor gebruik op werkstations die grote hoeveelheden informatie verwerken (bijvoorbeeld voor niet-lineaire videobewerkingsstations).

Netwerkgekoppelde opslag (NAS)

NAS-systemen zijn netwerkopslagsystemen die rechtstreeks op het netwerk zijn aangesloten, op dezelfde manier als een netwerkprintserver, router of een ander netwerkapparaat (Fig. 2). In feite vertegenwoordigen NAS-systemen een evolutie van bestandsservers: het verschil tussen een traditionele bestandsserver en een NAS-apparaat is ongeveer hetzelfde als tussen een hardwarenetwerkrouter en een speciale servergebaseerde softwarerouter.

Rijst. 2. Voorbeeld van een NAS-opslagsysteem

Om het verschil tussen een traditionele bestandsserver en een NAS-apparaat te begrijpen, moeten we onthouden dat een traditionele bestandsserver een speciale computer (server) is die informatie opslaat die beschikbaar is voor netwerkgebruikers. Voor het opslaan van informatie kunnen harde schijven worden gebruikt die in de server zijn geïnstalleerd (in de regel worden ze in speciale manden geïnstalleerd) of kunnen DAS-apparaten op de server worden aangesloten. De bestandsserver wordt beheerd met behulp van het serverbesturingssysteem. Deze benadering voor het organiseren van gegevensopslagsystemen is momenteel het populairst in het segment van kleine lokale netwerken, maar heeft één belangrijk nadeel. Feit is dat een universele server (en zelfs in combinatie met een serverbesturingssysteem) bepaald geen goedkope oplossing is. Tegelijkertijd wordt het grootste deel van de functionaliteit die inherent is aan een universele server simpelweg niet gebruikt in een bestandsserver. Het idee is om een geoptimaliseerde bestandsserver te creëren met een geoptimaliseerd besturingssysteem en een uitgebalanceerde configuratie. Dit is precies het concept dat een NAS-apparaat belichaamt. In die zin kunnen NAS-apparaten worden beschouwd als ‘dunne’ bestandsservers, of, zoals ze ook wel worden genoemd, filers.

Naast een geoptimaliseerd besturingssysteem, vrij van alle functies die geen verband houden met het onderhoud van het bestandssysteem en de implementatie van data-invoer/uitvoer, hebben NAS-systemen een bestandssysteem dat is geoptimaliseerd voor toegangssnelheid. NAS-systemen zijn zo ontworpen dat al hun rekenkracht uitsluitend gericht is op bestandsbediening en opslagbewerkingen. Het besturingssysteem zelf bevindt zich in flash-geheugen en is vooraf geïnstalleerd door de fabrikant. Met de release van een nieuwe versie van het besturingssysteem kan de gebruiker uiteraard het systeem zelfstandig "reflashen". NAS-apparaten op het netwerk aansluiten en configureren is een vrij eenvoudige taak en kan door elke ervaren gebruiker worden uitgevoerd, om nog maar te zwijgen van een systeembeheerder.

Vergeleken met traditionele bestandsservers zijn NAS-apparaten dus krachtiger en goedkoper. Momenteel zijn bijna alle NAS-apparaten ontworpen voor gebruik in Ethernet-netwerken (Fast Ethernet, Gigabit Ethernet) op basis van TCP/IP-protocollen. Toegang tot NAS-apparaten wordt gebruikt via speciale protocollen voor bestandstoegang. De meest voorkomende protocollen voor bestandstoegang zijn CIFS, NFS en DAFS.

CIFS(Common Internet File System System) is een protocol dat toegang biedt tot bestanden en services op externe computers (inclusief internet) en gebruikmaakt van een client-server-interactiemodel. De client creëert een verzoek aan de server om toegang te krijgen tot bestanden, de server voldoet aan het verzoek van de client en retourneert het resultaat van zijn werk. Het CIFS-protocol wordt traditioneel gebruikt op lokale netwerken met Windows OS om toegang te krijgen tot bestanden. CIFS gebruikt het TCP/IP-protocol om gegevens te transporteren. CIFS biedt functionaliteit die vergelijkbaar is met FTP (File Transfer Protocol), maar geeft klanten verbeterde controle over bestanden. Hiermee kunt u ook de toegang tot bestanden tussen clients delen, door de communicatie met de server te blokkeren en automatisch te herstellen in het geval van een netwerkstoring.

Protocol NFS(Network File System) wordt traditioneel gebruikt op UNIX-platforms en is een combinatie van een gedistribueerd bestandssysteem en een netwerkprotocol. Het NFS-protocol maakt ook gebruik van een client-server-communicatiemodel. Dankzij het NFS-protocol kunnen bestanden op een externe host (server) worden benaderd alsof ze zich op de computer van de gebruiker bevinden. NFS gebruikt het TCP/IP-protocol om gegevens te transporteren. Om NFS op internet te kunnen gebruiken, is het WebNFS-protocol ontwikkeld.

Protocol DAFS(Direct Access File System) is een standaard bestandstoegangsprotocol dat is gebaseerd op NFS. Met dit protocol kunnen applicatietaken gegevens overdragen, waarbij het besturingssysteem en de bufferruimte ervan worden omzeild, rechtstreeks om bronnen te transporteren. Het DAFS-protocol biedt hoge I/O-snelheden voor bestanden en vermindert de processorbelasting door het aantal bewerkingen en interrupts dat doorgaans nodig is bij het verwerken van netwerkprotocollen aanzienlijk te verminderen.

DAFS is ontworpen met de focus op gebruik in cluster- en serveromgevingen voor databases en een verscheidenheid aan internetapplicaties gericht op continu gebruik. Het biedt de laagste latentie voor toegang tot bestandsshares en gegevens, en ondersteunt ook intelligente systeem- en gegevensherstelmechanismen, wat het aantrekkelijk maakt voor gebruik in NAS-systemen.

Samenvattend kunnen NAS-systemen worden aanbevolen voor gebruik in multi-platformnetwerken in gevallen waarin netwerktoegang tot bestanden vereist is en het gemak van installatie van het systeembeheer voor gegevensopslag vrij belangrijke factoren is. Een mooi voorbeeld is het gebruik van een NAS als bestandsserver op het kantoor van een klein bedrijf.

Storage Area Network (SAN)

Eigenlijk is SAN niet langer een afzonderlijk apparaat, maar een alomvattende oplossing: een gespecialiseerde netwerkinfrastructuur voor gegevensopslag. Opslagnetwerken worden geïntegreerd als afzonderlijke gespecialiseerde subnetten in een lokaal (LAN) of wide area (WAN) netwerk.

In wezen verbinden SAN's een of meer servers (SAN-servers) met een of meer opslagapparaten. Met SAN-netwerken heeft elke SAN-server toegang tot elk opslagapparaat zonder andere servers of het lokale netwerk te belasten. Bovendien is het mogelijk om gegevens uit te wisselen tussen opslagapparaten zonder tussenkomst van servers. Met SAN's kan een zeer groot aantal gebruikers informatie op één plek opslaan en delen (met snelle, gecentraliseerde toegang). RAID-arrays, verschillende bibliotheken (tape, magneto-optisch, enz.), evenals JBOD-systemen (schijfarrays die niet in RAID zijn gecombineerd) kunnen worden gebruikt als apparaten voor gegevensopslag.

Gegevensopslagnetwerken begonnen zich intensief te ontwikkelen en werden pas in 1999 geïmplementeerd.

Net zoals lokale netwerken in principe op basis van verschillende technologieën en standaarden kunnen worden gebouwd, kunnen ook verschillende technologieën worden gebruikt om SAN-netwerken te bouwen. Maar net zoals de Ethernet-standaard (Fast Ethernet, Gigabit Ethernet) de de facto standaard is geworden voor lokale netwerken, domineert de Fibre Channel (FC)-standaard storage area-netwerken. Eigenlijk was het de ontwikkeling van de Fibre Channel-standaard die leidde tot de ontwikkeling van het SAN-concept zelf. Tegelijkertijd moet worden opgemerkt dat de iSCSI-standaard steeds populairder wordt, op basis waarvan het ook mogelijk is om SAN-netwerken te bouwen.

Naast de snelheidsparameters is een van de belangrijkste voordelen van Fibre Channel de mogelijkheid om over lange afstanden te werken en de flexibiliteit van de topologie. Het concept van het bouwen van een opslagnetwerktopologie is gebaseerd op dezelfde principes als traditionele lokale netwerken op basis van switches en routers, wat de constructie van systeemconfiguraties met meerdere knooppunten aanzienlijk vereenvoudigt.

Het is vermeldenswaard dat de Fibre Channel-standaard zowel glasvezel- als koperkabels gebruikt om gegevens te verzenden. Bij het organiseren van toegang tot geografisch afgelegen knooppunten op een afstand van maximaal 10 km worden standaardapparatuur en single-mode optische vezels gebruikt voor signaaloverdracht. Als de knooppunten over een grotere afstand (tientallen of zelfs honderden kilometers) van elkaar gescheiden zijn, worden speciale versterkers gebruikt.

SAN-netwerktopologie

Een typisch SAN-netwerk gebaseerd op de Fibre Channel-standaard wordt getoond in Fig. 3. De infrastructuur van een dergelijk SAN-netwerk bestaat uit opslagapparaten met een Fibre Channel-interface, SAN-servers (servers die zowel via een Ethernet-interface op het lokale netwerk zijn aangesloten als via een Fibre Channel-interface op het SAN-netwerk) en een schakelende fabric (Fiber Channel Fabric), dat is gebouwd op basis van Fibre Channel-switches (hubs) en is geoptimaliseerd voor het verzenden van grote blokken data. Netwerkgebruikers hebben toegang tot het gegevensopslagsysteem via SAN-servers. Het is belangrijk dat het verkeer binnen het SAN-netwerk wordt gescheiden van het IP-verkeer van het lokale netwerk, waardoor u uiteraard de belasting op het lokale netwerk kunt verminderen.

Rijst. 3. Typisch SAN-netwerkdiagram

Voordelen van SAN-netwerken

De belangrijkste voordelen van SAN-technologie zijn onder meer hoge prestaties, een hoog niveau van gegevensbeschikbaarheid, uitstekende schaalbaarheid en beheerbaarheid, en de mogelijkheid om gegevens te consolideren en te virtualiseren.

Fibre Channel-switch-fabrics met een niet-blokkerende architectuur zorgen ervoor dat meerdere SAN-servers tegelijkertijd toegang hebben tot opslagapparaten.

Met een SAN-architectuur kunnen gegevens eenvoudig van het ene opslagapparaat naar het andere worden verplaatst, waardoor een geoptimaliseerde gegevensplaatsing mogelijk is. Dit is vooral belangrijk wanneer meerdere SAN-servers gelijktijdige toegang tot dezelfde opslagapparaten nodig hebben. Houd er rekening mee dat het proces van gegevensconsolidatie niet mogelijk is bij gebruik van andere technologieën, zoals bijvoorbeeld bij het gebruik van DAS-apparaten, dat wil zeggen gegevensopslagapparaten die rechtstreeks op servers zijn aangesloten.

Een andere mogelijkheid die de SAN-architectuur biedt, is datavirtualisatie. Het idee van virtualisatie is om SAN-servers geen toegang te geven tot individuele opslagapparaten, maar tot bronnen. Dat wil zeggen dat servers geen opslagapparaten moeten 'zien', maar virtuele bronnen. Voor de praktische implementatie van virtualisatie kan een speciaal virtualisatieapparaat tussen SAN-servers en schijfapparaten worden geplaatst, waarop aan de ene kant opslagapparaten zijn aangesloten en aan de andere kant SAN-servers. Bovendien bieden veel moderne FC-switches en HBA's de mogelijkheid om virtualisatie te implementeren.

De volgende mogelijkheid die SAN-netwerken bieden, is de implementatie van gegevensspiegeling op afstand. Het principe van dataspiegeling is het dupliceren van informatie op verschillende media, waardoor de betrouwbaarheid van de informatieopslag toeneemt. Een voorbeeld van het eenvoudigste geval van gegevensspiegeling is het combineren van twee schijven in een RAID-niveau 1-array. In dit geval wordt dezelfde informatie gelijktijdig naar twee schijven geschreven. Het nadeel van deze methode is de lokale locatie van beide schijven (in de regel bevinden de schijven zich in dezelfde mand of rek). Met opslagnetwerken kunt u dit nadeel overwinnen en de mogelijkheid bieden om niet alleen de spiegeling van individuele gegevensopslagapparaten te organiseren, maar ook van de SAN-netwerken zelf, die honderden kilometers van elkaar verwijderd kunnen zijn.

Een ander voordeel van SAN-netwerken is het gemak waarmee gegevensback-ups kunnen worden georganiseerd. Traditionele back-uptechnologie, die in de meeste lokale netwerken wordt gebruikt, vereist een speciale back-upserver en, belangrijker nog, speciale netwerkbandbreedte. Tijdens de back-upoperatie wordt de server zelf zelfs niet beschikbaar voor lokale netwerkgebruikers. Dit is de reden dat back-ups meestal 's nachts worden gemaakt.

De architectuur van opslagnetwerken stelt ons in staat het probleem van back-up op een fundamenteel andere manier te benaderen. In dit geval maakt de Backup-server deel uit van het SAN-netwerk en is deze rechtstreeks verbonden met de schakelinfrastructuur. In dit geval wordt het back-upverkeer geïsoleerd van het lokale netwerkverkeer.

Apparatuur die wordt gebruikt om SAN-netwerken te creëren

Zoals al opgemerkt vereist het inzetten van een SAN opslagapparaten, SAN-servers en apparatuur om een switch-fabric te bouwen. Schakelende stoffen omvatten zowel fysieke laagapparaten (kabels, connectoren) als verbindingsapparaten (Interconnect Device) voor het met elkaar verbinden van SAN-knooppunten, vertaalapparaten (Vertaalapparaten) die de functies uitvoeren van het converteren van het Fibre Channel (FC)-protocol naar andere protocollen, bijvoorbeeld SCSI, FCP, FICON, Ethernet, ATM of SONET.

Kabels

Zoals reeds opgemerkt, staat de Fibre Channel-standaard het gebruik van zowel glasvezel- als koperkabels toe om SAN-apparaten aan te sluiten. Tegelijkertijd kunnen er in één SAN-netwerk verschillende soorten kabels worden gebruikt. Voor korte afstanden (tot 30 m) wordt koperkabel gebruikt en voor zowel korte afstanden als afstanden tot 10 km of meer wordt glasvezelkabel gebruikt. Er worden zowel multimode als singlemode glasvezelkabels gebruikt, waarbij multimode wordt gebruikt voor afstanden tot 2 km, en singlemode voor langere afstanden.

Het naast elkaar bestaan van verschillende soorten kabels binnen hetzelfde SAN-netwerk wordt verzekerd door speciale interfaceconverters GBIC (Gigabit Interface Converter) en MIA (Media Interface Adapter).

De Fibre Channel-standaard kent verschillende mogelijke transmissiesnelheden (zie tabel). Houd er rekening mee dat momenteel de meest voorkomende FC-apparaten de standaarden 1, 2 en 4 GFC zijn. Dit zorgt voor achterwaartse compatibiliteit van snellere apparaten met langzamere apparaten, dat wil zeggen dat een 4 GFC-apparaat automatisch het verbinden van apparaten met 1 en 2 GFC-standaarden ondersteunt.

Verbindingsapparaat

De Fibre Channel-standaard maakt het gebruik van verschillende netwerktopologieën mogelijk voor het verbinden van apparaten, zoals point-to-point, Arbitrated Loop (FC-AL) en geschakelde fabric.

Een point-to-point topologie kan worden gebruikt om een server te verbinden met een speciaal opslagsysteem. In dit geval worden de gegevens niet gedeeld met de SAN-servers. In feite is deze topologie een variant van een DAS-systeem.

Om een point-to-point topologie te implementeren heeft u minimaal een server nodig die is uitgerust met een Fibre Channel-adapter en een opslagapparaat met een Fibre Channel-interface.

Een split-access ringtopologie (FC-AL) is een apparaatverbindingsschema waarbij gegevens worden overgedragen in een logisch gesloten lus. In een FC-AL-ringtopologie kunnen de verbindingsapparaten hubs of Fibre Channel-switches zijn. Bij hubs wordt de bandbreedte gedeeld tussen alle knooppunten in de ring, terwijl elke switchpoort protocolbandbreedte aan elk knooppunt levert.

In afb. Figuur 4 toont een voorbeeld van een gesplitste Fibre Channel-ring.

Rijst. 4. Voorbeeld van een Fibre Channel-ring met gedeelde toegang

De configuratie is vergelijkbaar met de fysieke ster en logische ring die wordt gebruikt in lokale netwerken op basis van Token Ring-technologie. Bovendien reizen gegevens, net als Token Ring-netwerken, in één richting rond de ring, maar in tegenstelling tot Token Ring-netwerken kan een apparaat toestemming vragen om gegevens te verzenden in plaats van te wachten op een leeg token van de switch. Fibre Channel-ringen met gedeelde toegang kunnen maximaal 127 poorten adresseren, maar zoals de praktijk laat zien, bevatten typische FC-AL-ringen maximaal 12 knooppunten, en na het verbinden van 50 knooppunten gaan de prestaties catastrofaal achteruit.

De topologie van de geschakelde communicatiearchitectuur (Fiber Channel-switched-fabric) is geïmplementeerd op basis van Fibre Channel-switches. In deze topologie heeft elk apparaat een logische verbinding met elk ander apparaat. In feite vervullen Fibre Channel-fabricswitches dezelfde functies als traditionele Ethernet-switches. Bedenk dat een switch, in tegenstelling tot een hub, een hogesnelheidsapparaat is dat ‘iedereen-op-iedereen’-connectiviteit biedt en meerdere gelijktijdige verbindingen afhandelt. Elk knooppunt dat op een Fibre Channel-switch is aangesloten, ontvangt protocolbandbreedte.

In de meeste gevallen wordt bij het creëren van grote SAN-netwerken een gemengde topologie gebruikt. Op het lagere niveau worden FC-AL-ringen gebruikt, verbonden met laag presterende schakelaars, die op hun beurt zijn verbonden met hogesnelheidsschakelaars, waardoor de hoogst mogelijke doorvoer wordt geboden. Er kunnen meerdere schakelaars met elkaar worden verbonden.

Uitzendapparaten

Vertaalapparaten zijn tussenapparaten die het Fibre Channel-protocol omzetten naar protocollen op een hoger niveau. Deze apparaten zijn ontworpen om een Fibre Channel-netwerk te verbinden met een extern WAN-netwerk, een lokaal netwerk, en om verschillende apparaten en servers aan te sluiten op een Fibre Channel-netwerk. Dergelijke apparaten omvatten bruggen, Fibre Channel-adapters (Host Bus Adapters (HBA), routers, gateways en netwerkadapters. De classificatie van uitzendapparaten wordt weergegeven in figuur 5.

Rijst. 5. Classificatie van uitzendapparatuur

De meest voorkomende vertaalapparaten zijn HBA-adapters met een PCI-interface, die worden gebruikt om servers op een Fibre Channel-netwerk aan te sluiten. Met netwerkadapters kunt u lokale Ethernet-netwerken verbinden met Fibre Channel-netwerken. Bridges worden gebruikt om opslagapparaten met een SCSI-interface aan te sluiten op een Fibre Channel-gebaseerd netwerk. Opgemerkt moet worden dat recentelijk bijna alle apparaten voor gegevensopslag die bedoeld zijn voor gebruik in SAN's ingebouwde Fibre Channel hebben en geen gebruik van bridges vereisen.

Opslagapparaten

Zowel harde schijven als tapedrives kunnen worden gebruikt als gegevensopslagapparaten in SAN-netwerken. Als we het hebben over mogelijke configuraties voor het gebruik van harde schijven als gegevensopslagapparaten in SAN-netwerken, kunnen dit JBOD-arrays of RAID-schijfarrays zijn. Traditioneel worden opslagapparaten voor SAN-netwerken geproduceerd in de vorm van externe racks of baskets uitgerust met een gespecialiseerde RAID-controller. In tegenstelling tot NAS- of DAS-apparaten zijn apparaten voor SAN-systemen uitgerust met een Fibre Channel-interface. Tegelijkertijd kunnen de schijven zelf zowel een SCSI- als een SATA-interface hebben.

Naast op harde schijven gebaseerde opslagapparaten worden tapedrives en bibliotheken veel gebruikt in SAN-netwerken.

SAN-servers

SAN-servers verschillen slechts op één detail van conventionele applicatieservers. Naast de Ethernet-netwerkadapter, zodat de server kan communiceren met het lokale netwerk, zijn ze uitgerust met een HBA-adapter, waarmee ze kunnen worden aangesloten op SAN-netwerken op basis van Fibre Channel.

Intel-opslagsystemen

Vervolgens bekijken we enkele specifieke voorbeelden van Intel-opslagapparaten. Strikt genomen produceert Intel geen complete oplossingen en houdt het zich bezig met de ontwikkeling en productie van platforms en individuele componenten voor het bouwen van gegevensopslagsystemen. Op basis van deze platforms produceren veel bedrijven (waaronder een aantal Russische bedrijven) complete oplossingen en verkopen deze onder hun logo.

Intel Entry-opslagsysteem SS4000-E

Het Intel Entry Storage System SS4000-E is een NAS-apparaat dat is ontworpen voor gebruik in kleine en middelgrote kantoren en lokale netwerken met meerdere platforms. Bij gebruik van het Intel Entry Storage System SS4000-E krijgen clients op basis van Windows-, Linux- en Macintosh-platforms gedeelde netwerktoegang tot gegevens. Bovendien kan het Intel Entry Storage System SS4000-E zowel als DHCP-server als als DHCP-client fungeren.

Het Intel Entry Storage System SS4000-E is een compact extern rack waarin maximaal vier SATA-schijven kunnen worden geïnstalleerd (Afb. 6). De maximale systeemcapaciteit kan dus 2 TB zijn bij gebruik van schijven van 500 GB.

Rijst. 6. Intel Entry Storage-systeem SS4000-E

Het Intel Entry Storage System SS4000-E maakt gebruik van een SATA RAID-controller met ondersteuning voor RAID-niveaus 1, 5 en 10. Omdat dit systeem een NAS-apparaat is, dat wil zeggen in feite een “dunne” bestandsserver, moet het gegevensopslagsysteem beschikken over een gespecialiseerd besturingssysteem voor processor, geheugen en firmware. Het Intel Entry Storage System SS4000-E maakt gebruik van een Intel 80219-processor met een klokfrequentie van 400 MHz. Daarnaast is het systeem voorzien van 256 MB DDR-geheugen en 32 MB flashgeheugen voor het opslaan van het besturingssysteem. Het besturingssysteem is Linux Kernel 2.6.

Om verbinding te maken met een lokaal netwerk, beschikt het systeem over een tweekanaals gigabit-netwerkcontroller. Daarnaast zijn er ook twee USB-poorten.

Het Intel Entry Storage System SS4000-E gegevensopslagapparaat ondersteunt CIFS/SMB-, NFS- en FTP-protocollen en het apparaat wordt geconfigureerd met behulp van een webinterface.

Als u Windows-clients gebruikt (Windows 2000/2003/XP wordt ondersteund), is het bovendien mogelijk om gegevensback-up en -herstel te implementeren.

Intel-opslagsysteem SSR212CC

Het Intel Storage System SSR212CC is een universeel platform voor het creëren van DAS-, NAS- en SAN-opslagsystemen. Dit systeem is gehuisvest in een 2 HE hoge behuizing en is ontworpen voor montage in een standaard 19 inch rack (Fig. 7). Het Intel Storage System SSR212CC ondersteunt de installatie van maximaal 12 schijven met SATA- of SATA II-interface (hot-swappable), waardoor u de systeemcapaciteit kunt uitbreiden tot 6 TB met schijven van 550 GB.

Rijst. 7. Intel-opslagsysteem SSR212CC

In feite is het Intel Storage System SSR212CC een volwaardige, krachtige server met de besturingssystemen Red Hat Enterprise Linux 4.0, Microsoft Windows Storage Server 2003, Microsoft Windows Server 2003 Enterprise Edition en Microsoft Windows Server 2003 Standard Edition.

De server is gebaseerd op een Intel Xeon-processor met een klokfrequentie van 2,8 GHz (FSB-frequentie 800 MHz, L2-cachegrootte 1 MB). Het systeem ondersteunt het gebruik van SDRAM DDR2-400-geheugen met ECC met een maximale capaciteit van maximaal 12 GB (er zijn zes DIMM-slots aanwezig voor het installeren van geheugenmodules).

Het Intel Storage System SSR212CC is uitgerust met twee Intel RAID Controller SRCS28X's met de mogelijkheid om RAID-arrays van niveaus 0, 1, 10, 5 en 50 te creëren. Bovendien beschikt het Intel Storage System SSR212CC over een dual-channel gigabit netwerkcontroller.

Intel-opslagsysteem SSR212MA

Het Intel Storage System SSR212MA is een platform voor het creëren van dataopslagsystemen in IP SAN-netwerken op basis van iSCSI.

Dit systeem is gehuisvest in een 2 HE hoge behuizing en is ontworpen voor montage in een standaard 19 inch rack. Het Intel Storage System SSR212MA ondersteunt maximaal 12 SATA-schijven (hot-swappable), waardoor de systeemcapaciteit kan worden uitgebreid tot 6 TB met behulp van schijven van 550 GB.

Wat de hardwareconfiguratie betreft, verschilt het Intel Storage System SSR212MA niet van het Intel Storage System SSR212CC.