Modules worden toegewezen aan knooppunten van gedistribueerde informatiesystemen. Samenvatting: Gedistribueerde informatiesystemen. In het eenvoudigste geval bestaat een client-serverinformatiesysteem dus uit drie hoofdcomponenten

Elke organisatie ontwikkelt een min of meer belangrijk deel, maar niet de gehele, informatie-inhoud van haar GIS. De behoefte aan data is een stimulans voor gebruikers om nieuwe data op de meest efficiënte en snelste manier te verkrijgen, inclusief het kopen van delen van databases voor hun GIS van andere GIS-gebruikers. Op deze manier worden GIS-gegevens door meerdere gebruikers beheerd.


Deel uw werk op sociale netwerken

Als dit werk je niet bevalt, staat onderaan de pagina een lijst met soortgelijke werken. Je kunt ook de zoekknop gebruiken


12. GIS GEDISTRIBUEERD INFORMATIESYSTEEM

12.1. Algemene informatie

Nu in de meeste geografische gebieden informatiesystemen Laag- en tabelgegevens zijn afkomstig van verschillende organisaties. Elke organisatie ontwikkelt een min of meer belangrijk deel, maar niet de gehele, informatie-inhoud van haar GIS. Meestal zijn tenminste enkele gegevenslagen afkomstig van externe bronnen. De behoefte aan data is een stimulans voor gebruikers om nieuwe data op de meest efficiënte en snelste manier te verkrijgen, inclusief het kopen van delen van databases voor hun GIS van andere GIS-gebruikers. GIS-gegevens worden dus door meerdere gebruikers beheerd.

12.2. Mogelijkheden voor interactie

Het gedistribueerde karakter van GIS impliceert dit volop mogelijkheden voor interoperabiliteit tussen veel GIS-organisaties en -systemen. Samenwerking en samenwerking gebruikers zijn erg belangrijk voor GIS.

GIS-gebruikers vertrouwen in hun werk al lang op wederzijds voordelige gegevensuitwisseling en het delen ervan. Echte reflectie Deze fundamentele behoefte is de voortdurende inspanning om GIS-standaarden te creëren. Toewijding aan industriestandaarden en algemene principes het bouwen van een GIS is van cruciaal belang voor de succesvolle ontwikkeling en wijdverspreide implementatie van deze technologie. Een GIS moet de belangrijkste standaarden ondersteunen en zich kunnen aanpassen als er nieuwe standaarden beschikbaar komen.

12.3. GIS-netwerken

Veel geografische datasets kunnen worden samengesteld en beheerd als een gemeenschappelijke informatiebron en worden gedeeld door een gemeenschap van gebruikers. Daarnaast hebben GIS-gebruikers een eigen visie op hoe populaire datasets via het web gedeeld kunnen worden.

Belangrijke websites, GIS-catalogusportals genoemd, stellen gebruikers in staat zowel hun eigen informatie te posten als te zoeken naar geografische informatie die beschikbaar is voor gebruik. Als gevolg hiervan worden GIS-systemen steeds vaker met elkaar verbonden Wereld wijde web en nieuwe mogelijkheden krijgen voor het uitwisselen en gebruiken van informatie.

Deze visie is de afgelopen tien jaar diepgeworteld in het bewustzijn van mensen en wordt weerspiegeld in concepten als de National Spatial Data Infrastructure (NSDI) en Mondiale infrastructuur ruimtelijke gegevens (GSDI). Deze concepten evolueren voortdurend en worden geleidelijk geïmplementeerd, niet alleen op nationaal en mondiaal niveau, maar ook op districts- en districtsniveau gemeenten. In algemene vorm zijn deze concepten opgenomen in het concept van Spatial Data Infrastructure (SDI, Spatial Data Infrastructure).

Het GIS-netwerk is in wezen een van de methoden om de principes van SDI te introduceren en te promoten. Het verbindt veel gebruikerssites, bevordert publiceren, zoeken en delen geografische informatie door Wereldwijd Web.

Geografische kennis is inherent verspreid en losjes geïntegreerd. Alle benodigde informatie bevindt zich zelden in één database-instance met een eigen dataschema. GIS-gebruikers communiceren met elkaar om ontbrekende stukken te verkrijgen van wat ze hebben. GIS-gegevens. Via GIS-netwerken kunnen gebruikers gemakkelijker contacten leggen en opgebouwde geografische kennis uitwisselen.

Een GIS-netwerk bestaat uit drie hoofdbouwstenen:

  • Metadatacatalogusportals waar gebruikers GIS-informatie kunnen zoeken en vinden op basis van hun behoeften
  • GIS-knooppunten waar gebruikers compileren en publicerensets van GIS-informatie vervalsen
  • GIS-gebruikers die gepubliceerde gegevens en services zoeken, ontdekken, openen en gebruiken

12.4. Catalogi van GIS-portals

Een belangrijk onderdeel Een GIS-netwerk is een GIS-portaaldirectory met een systematische registratie van verschillende opslaglocaties voor gegevens- en informatiesets. Sommige GIS-gebruikers fungeren als datastewards en stellen hun datasets samen en publiceren deze delen in verschillende organisaties. Zij registreren hun informatiesets in de portaalcatalogus. Door in deze catalogus te zoeken, kunnen andere gebruikers de informatiesets vinden en openen die ze nodig hebben.

Een GIS-catalogusportaal is een website waar GIS-gebruikers de GIS-informatie kunnen zoeken en vinden die ze nodig hebben. De geboden mogelijkheden zijn afhankelijk van het aanbod aan diensten netwerkdiensten GIS-gegevens, kaartdiensten en metadatadiensten. Van tijd tot tijd kan de GIS-catalogusportaalsite een overzicht van de directory's van de aangesloten deelnemende sites uitvoeren om dit te doenhet publiceren en bijwerken van één centrale GIS-catalogus. De GIS-catalogus kan dus links bevatten naar gegevensbronnen die zowel op deze als op andere sites beschikbaar zijn. Er wordt verwacht dat er een reeks van dergelijke catalogusknooppunten zal worden gecreëerd, en op basis daarvan gedeeld netwerk- Ruimtelijke data-infrastructuur.

GIS-gegevens en -diensten worden gedocumenteerd als catalogusrecords in de GIS-portaalcatalogus, die kunnen worden gebruikt om kandidaten te zoeken voor gebruik in verschillende GIS-toepassingen.

Een voorbeeld van een GIS-catalogusportaal is het Amerikaanse overheidsportaal (Geospatial One-Stop, zie www.geodata.gov). Dit portaal zal alle overheidsniveaus en het grote publiek in staat stellen gemakkelijker, sneller en kosteneffectiever toegang te krijgen tot geografische informatie.

Andere soortgelijke werken die u mogelijk interesseren.vshm>

4627. Informatiesysteem Kliniek 436,13 KB
Het belangrijkste doel van het maken van databases is het combineren van de functies van het bijwerken, onderhouden en aanvullen van opgeslagen informatie, evenals een referentiefunctie. De belangrijkste karakteristieke eigenschap van de database is de onafhankelijkheid ervan van de besturingsprogramma's waarmee deze samenwerkt.
6245. Bedrijfsinformatiesysteem (CIS) 39,86 KB
Een bedrijfsinformatiesysteem CIS is een reeks informatiesystemen van individuele divisies van een onderneming, verenigd door een gemeenschappelijke documentenstroom, zodat elk van de systemen een deel van de taken van het beheer van de besluitvorming uitvoert en alle systemen samen het functioneren van de onderneming garanderen. in overeenstemming met de ISO 9000-kwaliteitsnormen Modulariteit Maakt parallellisatie mogelijk om het installatieproces te vergemakkelijken en dienovereenkomstig te versnellen, personeel op te leiden en het systeem in gebruik te nemen industriële exploitatie. Deze eis wordt...
1001. Informatiesysteem bij JSC Gazpromneft 44,35 KB
Doelen en doelstellingen vang. Strategie voor de ontwikkeling van managementinformatiesystemen. Informatieondersteuning voor het beheren van de activiteiten van het hoofd van een organisatie Inleiding Er wordt veel gesproken over informatie en slechts enkele organisaties formuleren duidelijk en duidelijk de vereisten voor dit hulpmiddel dat nodig is voor het nemen van effectieve managementbeslissingen.
7405. Marketinginformatiesysteem van Riviera-Sochi LLC 1,96 MB
Het doel van het onderzoek is het marketinginformatiesysteem van Riviera-Sochi LLC. Het doel van de studie is het ontwikkelen en implementeren van een marketingsysteem voor het verzamelen, verwerken en analyseren van informatie met als doel effectief en efficiënt gebruik van ondernemingsmiddelen. Tijdens het werk werd onderzoek gedaan naar de structuur van de organisatie en analyse van de economische indicatoren ervan. Als resultaat van het onderzoek is een enquêtemodule ontwikkeld die op de website van het bedrijf Riviera-Sochi LLC werkt om de nodige informatie van consumenten te verkrijgen...
11460. Management accounting als bedrijfsinformatiesysteem 64,49 KB
Overgang naar IFRS wel nieuwe look voor boekhouding. Nu bestaat het handelen van de accountant niet langer uit het volgen van instructies, maar uit het volgen van zijn eigen professionele oordeel over alle kwesties die verband houden met boekhouding, beperkt door bepaalde principes die door de IFRS worden voorgesteld.
17542. Informatiebeheersysteem voor de levering van grondstoffen voor een supermarkt 79,67 KB
De programma's slaan elektronische gegevens op over inventarissen die voortdurend worden gebruikt snelle oplossing standaardvragen waarvoor anders rechtstreeks met de inventaris zou moeten worden gewerkt. Moderne supermarkten kenmerken zich door de aanwezigheid van de volgende kenmerken: - een aanzienlijke hoeveelheid winkelruimte van 200 m2 of meer; - een aanzienlijk aantal afdelingen waarin een verscheidenheid aan producten wordt gepresenteerd: vlees, fruit- en plantaardige zuivelproducten, brood, bakkerijproducten en gebak, zoetwaren, tabak, parfum...
19833. Informatiesysteem. IP-classificatie. Structurele componenten van bedrijfs-IP 33,24 KB
Voor het bedrijfsleven zijn dergelijke taken het vergroten van de winstgevendheid, het verhogen van de omzet, het verlagen van de kosten, het verminderen van risico's en het algemeen stabiliseren van de marktsituatie. Het is belangrijk dat de staat een reeks sociale, economische, defensie- en andere problemen tegen de laagste kosten oplost. Een zekere doorbraak vond plaats in 2005, toen er voor het eerst een volledige schaal werd gerealiseerd computerbesturing. Als voorbeeld kunnen we de nieuwste informatietechnologieën noemen, die worden gekenmerkt door relatief kleine hoeveelheden benodigde...
12160. Informatiesysteem "Archief van de Russische Academie van Wetenschappen" (ISARAN) 17,86 KB
Korte beschrijving ontwikkeling. ISARAN-software is gemaakt in populaire omgeving visuele ontwikkeling Delphi Delphi client-server versie en aangepast aan de specifieke kenmerken van het departementale Archieffonds van de Russische Academie van Wetenschappen. Voordelen van ontwikkeling en vergelijking met analogen. Regio's commercieel gebruik ontwikkeling.
12142. Informatiesysteem voor het monitoren van het wetenschappelijke en technische potentieel van de regio 17,24 KB
Het informatiesysteem is een software- en informatiecomplex ontworpen voor operationele analytische boekhouding en monitoring van indicatoren van wetenschappelijk en technisch potentieel, gebaseerd op gegevens van verschillende statistische indicatoren, geanalyseerd met behulp van de methodologie van de auteur. De ontwikkelde applicatie IC heeft de volgende voordelen: aanpassingsvermogen voor een brede klasse van indicatoren, continuïteit van nieuwe indicatoren informatietechnologie automatisering van een aanzienlijk aantal functies die worden uitgevoerd bij het beoordelen van het wetenschappelijke en technische potentieel. Product...
12060. Multifunctioneel integrerend informatiesysteem voor het monitoren van waterlichamen (MISM VO) 17,91 KB
Het multifunctionele, integrerende informatiesysteem voor het monitoren van waterlichamen MISM VO is ontwikkeld op basis van portaalwebtechnologie en stelt u in staat gegevens over de toestand van waterlichamen te integreren en te verwerken in VO, ontvangen van alle mogelijke bronnen controle van de staat van de watervoorziening, inclusief automatische controleposten van de APM op verschillende niveaus, individuele waterlichamen, hun hydrografische netwerk binnen de administratieve regio en het land als geheel, een complex van waterlichamen, bijvoorbeeld een cascade van reservoirs, een waterbassin voor een optimaal beheer...

Inhoudsopgave

INLEIDING 4
1. HET CONCEPT VAN GEDISTRIBUEERD IS 6
1.1. Vereisten voor het maken van gedistribueerde IS 6
1.2. Concept van gedistribueerde informatiesystemen 8
1.3. Hulpmiddelen voor het werken met gedistribueerde gegevens 11
2. GEDISTRIBUEERDE DATABASES 13
2.1. Basisprincipes 13
2.2 Soorten gedistribueerde databases 15
2.3. Doel en werkingsprincipe van een gedistribueerde database 16
3. VOORBEELDEN VAN GEDISTRIBUEERDE SYSTEMEN 21
CONCLUSIE 25
LITERATUUR 26

INVOERING

De relevantie van dit onderwerp van het essay ligt in het feit dat de processen van globalisering en informatie-integratie plaatsvinden in de wereldeconomie. Ze hadden ook gevolgen voor ons land, dat vanwege zijn geografische ligging en omvang gedwongen is gebruik te maken van gedistribueerde informatiesystemen (IS). Gedistribueerde informatiesystemen maken werk mogelijk met gegevens die zich op verschillende servers, verschillende hardware- en softwareplatforms bevinden en in verschillende formaten zijn opgeslagen. Ze zijn eenvoudig uitbreidbaar op basis van open standaarden en protocollen, zorgen voor de integratie van hun bronnen met andere informatiesystemen en bieden gebruikers eenvoudige interfaces.
Er is een enorme hoeveelheid kant-en-klare informatie- en computerbronnen in de wereld. Ze zijn op verschillende tijdstippen gemaakt en er zijn verschillende benaderingen gebruikt om ze te ontwikkelen. Bijna altijd kunt u bij het ontwikkelen van een nieuw informatiesysteem bestaande systemen vinden die geschikt zijn voor hun functies. kant-en-klare componenten. Het probleem is dat toen ze werden gemaakt, er geen rekening werd gehouden met de incompatibiliteitsvereisten. Deze componenten begrijpen elkaar niet, ze kunnen niet samenwerken. Het is wenselijk om te beschikken over een mechanisme of een reeks mechanismen om dergelijke onafhankelijk ontwikkelde informatie- en computerbronnen interoperabel te maken.
Dit artikel onderzoekt basisinformatie over een gedistribueerd informatiesysteem: beschrijft de voorwaarden voor de ontwikkeling ervan, de manieren om met gegevens te werken, introduceert het concept van een gedistribueerde database, evenals de typen en basisprincipes ervan. Het derde hoofdstuk presenteert voorbeelden van gedistribueerde informatiesystemen, zoals: - Ingres Intelligent Database van Ingres Corp (versie 7) van Oracle Corp;
Het doel van de studie is om de theoretische grondslagen van gedistribueerde informatiesystemen te bestuderen en om kennis te ontwikkelen over de principes van de werking ervan.
Deze distributie van gegevens maakt het bijvoorbeeld mogelijk om in een netwerkknooppunt de gegevens op te slaan die het vaakst in dit knooppunt worden gebruikt. Deze aanpak maakt het gemakkelijker en sneller om met deze gegevens te werken en laat de mogelijkheid open om met de rest van de databasegegevens te werken.

1. HET CONCEPT VAN GEDISTRIBUEERD IS
1.1. Vereisten voor het creëren van gedistribueerde informatiesystemen

Vanaf het allereerste begin van de ontwikkeling van computertechnologie ontstonden er twee hoofdrichtingen voor het gebruik ervan. De eerste richting is het gebruik van computertechnologie om numerieke berekeningen uit te voeren die te lang duren of onmogelijk handmatig uit te voeren zijn. De vorming van deze richting heeft bijgedragen aan de intensivering van methoden voor het numeriek oplossen van complexe wiskundige problemen, de ontwikkeling van een klasse programmeertalen gericht op het gemakkelijk vastleggen van numerieke algoritmen, de vorming feedback met ontwikkelaars van nieuwe computerarchitecturen.
De tweede richting is het gebruik van computertechnologie in automatische of geautomatiseerde informatiesystemen. Doorgaans zijn de hoeveelheden informatie waarmee dergelijke systemen te maken krijgen vrij groot, en de informatie zelf heeft een tamelijk complexe structuur. Een van de natuurlijke vereisten voor dergelijke systemen is de gemiddelde snelheid van operaties en de veiligheid van informatie.
Maar omdat informatiesystemen dit vereisen complexe structuren data waren deze individuele aanvullende tools voor gegevensbeheer een essentieel onderdeel van informatiesystemen en werden ze praktisch van het ene systeem naar het andere herhaald. De wens om het algemene deel van de informatiesystemen dat verantwoordelijk is voor het beheer van complex gestructureerde gegevens te identificeren en te generaliseren was blijkbaar de eerste motiverende reden voor het creëren van verschillende managementsystemen.
Al snel werd duidelijk dat het onmogelijk was om rond te komen met een gemeenschappelijke bibliotheek van programma's die complexere methoden voor gegevensopslag implementeerden bovenop het standaard basisbestandssysteem, bijvoorbeeld door informatie in verschillende bestanden op te slaan. Dit alles heeft dus bijgedragen aan de creatie van gedistribueerde informatiesystemen.
Als een informatiesysteem de consistente opslag van informatie in meerdere bestanden ondersteunt, kan er zelfs worden gezegd dat het een database ondersteunt. Als u met een aanvullend gegevensbeheersysteem met meerdere bestanden kunt werken en de consistentie ervan kunt garanderen, kunt u het een databasebeheersysteem noemen. Alleen al de eis om dataconsistentie over meerdere bestanden heen te handhaven, maakt geen bibliotheek van functies mogelijk: zo'n systeem moet over een aantal eigen data (metadata) beschikken en zelfs over kennis die de integriteit van de data bepaalt.
Er is een enorme hoeveelheid kant-en-klare informatie- en computerbronnen in de wereld. Ze zijn gemaakt in verschillende tijden werden verschillende benaderingen gebruikt om deze te ontwikkelen. Bijna altijd kunt u bij het ontwikkelen van een nieuw informatiesysteem kant-en-klare componenten vinden die geschikt zijn voor hun functies.

1.2. Het concept van gedistribueerde informatiesystemen

Normaal gesproken wordt een systeem waarin meer dan één databaseserver actief is, als gedistribueerd beschouwd. Dit wordt gebruikt om de belasting van de server te verminderen en de werking van geografisch afgelegen afdelingen te garanderen. De variërende complexiteit van creatie, wijziging, onderhoud en integratie met andere systemen maakt het mogelijk om informatiesystemen te verdelen in klassen van kleine, middelgrote en grote gedistribueerde systemen. Kleine IC's hebben een kleine levenscyclus(LC), oriëntatie op massaal gebruik, lage prijs, onmogelijkheid van wijziging zonder de deelname van ontwikkelaars, waarbij voornamelijk desktopdatabasebeheersystemen (DBMS) worden gebruikt, homogene hardware en software die geen beveiligingsfuncties hebben. Grote bedrijfsinformatiesystemen, systemen op federaal niveau en andere hebben een lange levenscyclus, migratie van oudere systemen, diversiteit aan hardware en software, de schaal en complexiteit van de taken die moeten worden opgelost, de kruising van veel vakgebieden, analytische gegevensverwerking en territoriale distributie van componenten.
De functies van dergelijke informatiesystemen omvatten in de eerste plaats het werken met gedistribueerde gegevens die zich op verschillende fysieke servers, verschillende hardware- en softwareplatforms bevinden en in verschillende interne formaten zijn opgeslagen. In dit geval moet het systeem voorzien volledige informatie over uzelf en al uw bronnen, eenvoudig uit te breiden, gebaseerd op open standaarden en protocollen, de mogelijkheid bieden om uw bronnen te integreren met de bronnen van andere informatiesystemen. Voor gebruikers moet het systeem verschillende niveaus van gebruikersrechten bieden en eenvoudige interfaces bieden voor toegang tot informatie.
Gegevens uit heterogene systemen worden meestal gecombineerd in logische groepen waaraan vragen worden geadresseerd. Een abstract querysysteem gaat ervan uit dat het systeem niet werkt met een specifieke querysyntaxis, maar met zijn logische essentie gebaseerd op abstracte attributen.
Bij het bouwen van gedistribueerde informatiesystemen worden in de regel twee basisarchitecturen gebruikt: client/server en internetintranet.
Enterprise IS gebouwd op een client/server-architectuur biedt klanten een breed scala aan toepassingen en ontwikkelingstools die gericht zijn op het maximaliseren van de computermogelijkheden van clientwerkstations. Serverbronnen worden voornamelijk gebruikt voor het opslaan en uitwisselen van documenten, maar ook voor toegang externe omgeving. Met deze architectuur kunt u de serverkant van applicaties beter beschermen, terwijl applicaties de mogelijkheid hebben om elkaar rechtstreeks aan te spreken servertoepassingen of routeer verzoeken ernaar. Frequente clientoproepen naar de server verminderen echter de netwerkprestaties. We moeten problemen oplossen veilig werken op een netwerk omdat applicaties en gegevens over verschillende clients worden verdeeld. Het gedistribueerde karakter van de systeemconstructie maakt het moeilijk te configureren en te onderhouden

De IS gebaseerd op het internetintranet is gebaseerd op het principe van “open architectuur”. IS-software wordt geïmplementeerd in de vorm van applets of servlets (programma's in JAVA-taal) of in de vorm van cgi-modules (Perl- of C-programma's). Het IP-adres van deze architectuur omvat Web-yinh\, geïmplementeerd met behulp van CORBA Enterprise JavaBeans-technologieën, ActiveX 1X"OM, applicaties op meerdere niveaus op Java-gebaseerd en XML, .Net-concept met XML, waarbij de uitwisseling tussen verschillende servers (datawarehouses, bedrijfsapplicaties, servers voor mobiele klanten en meer) wordt geproduceerd met behulp van architectuurneutrale XML.
Een gedistribueerde informatiebasis betekent een onbeperkt aantal databases die op afstand van elkaar liggen en er een aantal hebben algemene kenmerken:
- werken volgens uniforme regels die centraal zijn gedefinieerd voor alle databases die deel uitmaken van de gedistribueerde informatiebasis;
- de gegevensuitwisseling vindt plaats volgens eveneens centraal vastgelegde regels.
De organisatie van een gedistribueerde database is noodzakelijk voor bedrijven die zich bezighouden met verschillende soorten activiteiten als het in hun dagelijkse werk nodig is om de volgende problemen op te lossen:
- de noodzaak om snel informatie te verkrijgen uit databases van op afstand gelegen eenheden (of vestigingen);
- de noodzaak om informatie uit de databases van juridische entiteiten die deel uitmaken van de bedrijfsstructuur in één database te consolideren, voor daaropvolgende gegevensanalyse en het verkrijgen van rapporten uit één database, zowel voor de onderneming als geheel als voor elke juridische entiteit afzonderlijk;
- de noodzaak om een ​​gecentraliseerde verandering door te voeren in de structuur en de werkingsregels van databases voor de werking van alle op afstand gelegen eenheden (filialen) en juridische entiteiten (met de onmogelijkheid om bepaalde regels rechtstreeks in een op afstand gelegen eenheid te wijzigen);
- de noodzaak om wijzigingen in gegevens in op afstand gelegen afdelingen van het bedrijf (filialen) te beperken en te controleren.

1.3. Hulpmiddelen voor het werken met gedistribueerde gegevens

Wanneer u een gedistribueerde IS kiest, moet u allereerst letten op wat besturingssystemen en het ondersteunt netwerkprotocollen. Niet minder belangrijk is echter welke methoden voor gegevensdistributie erin zijn geïmplementeerd.
1) Fragmentatie en duplicatie
Een van de manieren om tabellen te distribueren is fragmentatie. De tabel kan worden opgesplitst in delen die in verschillende knooppunten worden geplaatst. Een andere manier om gegevens te distribueren is duplicatie (replicatie). U kunt duplicaten maken van de gehele database of delen ervan en deze duplicaten in knooppunten plaatsen. Met beide methoden kunt u gegevens precies opslaan op het knooppunt waar deze het meest worden gebruikt. Dit minimaliseert de kosten van datatransmissie via het netwerk en vermindert het gebruik van processors en andere bronnen van andere knooppunten. Met deze applicatiedatabase-architectuur wordt gegevensoverdracht via het netwerk vrij zelden uitgevoerd.
2) Gegevenswoordenboeken en mappen
Zodra de gegevens over verschillende netwerkknooppunten zijn verdeeld, is het belangrijk om deze gegevens te vinden en te gebruiken. Om gegevens te vinden en deze in het gewenste formaat om te zetten, worden globale datadictionaria en directory's gebruikt. Het woordenboek slaat informatie op over gegevens, het gebruik ervan, toegangsrechten voor gegevens en toepassingen. Gegevensmappen worden gebruikt om te definiëren waar gegevens worden opgeslagen en hoe deze kunnen worden opgehaald. Woordenboeken en mappen kunnen globaal of lokaal zijn
3) Fixatie van veranderingen in twee fasen
Methoden voor gegevensdistributie zijn natuurlijk erg belangrijk, maar de kern van moderne gedistribueerde DBMS's is het tweefasige change commit-protocol. Dit protocol beheert de uitvoering van transacties die de gegevens van meerdere knooppunten wijzigen. Het hoofdidee van tweefasige commit is het volgende: het is onaanvaardbaar dat een transactie die gegevens in verschillende knooppunten verandert, in sommige knooppunten wordt uitgevoerd en in andere knooppunten niet wordt uitgevoerd. De transactie moet op alle knooppunten slagen of op elk knooppunt mislukken.
4) Waarborgen van integriteit
Een belangrijk kenmerk van een gedistribueerd informatiesysteem is de manier waarop het de referentiële integriteit handhaaft tussen de gegevens in de hoofdtabel en de gegevens in de bijbehorende tabellen. Laten we eens kijken naar een voorbeeld van referentiële integriteit. Stel dat er drie tabellen in een gedistribueerde database zijn:
- een tabel met gegevens over de kinderen van medewerkers;
- een tabel met informatie over de salarissen van werknemers voor het jaar;
- een tabel met informatie over de door de medewerker ingevulde onderwerpen.
Al deze tabellen bevatten de kolom "Naam van de werknemer". De regels voor het waarborgen van referentiële integriteit vereisen dat wanneer de waarden van de kolom "Volledige naam van de werknemer" in de ene tabel worden gewijzigd, de waarden van deze kolom in andere tabellen automatisch worden aangepast. Om referentiële integriteit te garanderen, worden er 2 gebruikt verschillende methoden- triggers en declaratieve integriteitsbeperkingen van de ANSI-standaard.

2. GEDISTRIBUEERDE DATABASES
2.1. Basisprincipes

Gedistribueerde databases (RDB) zijn een reeks logisch met elkaar verbonden databases, verspreid over een computernetwerk.
De RDB bestaat uit een reeks knooppunten die met elkaar zijn verbonden door een communicatienetwerk waarin:
a) elk knooppunt is op zichzelf een volwaardig DBMS;
b) knooppunten interageren met elkaar op een zodanige wijze dat een gebruiker van een van deze knooppunten toegang heeft tot alle gegevens op het netwerk alsof deze zich op zijn eigen knooppunt bevinden.
Elk knooppunt is zelf een databasesysteem. Elke gebruiker kan zelf bewerkingen op gegevens uitvoeren lokaal knooppunt op dezelfde manier alsof dit knooppunt helemaal geen deel uitmaakte van het gedistribueerde systeem. Een gedistribueerd databasesysteem kan worden gezien als een partnerschap tussen afzonderlijke lokale DBMS'en op afzonderlijke lokale knooppunten.
Fundamenteel principe voor het maken van gedistribueerde databases (“Regel 0”): Voor de gebruiker moet een gedistribueerd systeem er hetzelfde uitzien als een niet-gedistribueerd systeem.
Een fundamenteel beginsel brengt bepaalde aanvullende regels of doeleinden met zich mee. Er zijn slechts twaalf van dergelijke doelen:
1.Lokale onafhankelijkheid. Knooppunten in een gedistribueerd systeem moeten onafhankelijk of autonoom zijn. Lokale onafhankelijkheid betekent dat alle bewerkingen op een knooppunt door dat knooppunt worden bestuurd.
2. Gebrek aan steun voor de centrale eenheid. Lokale onafhankelijkheid impliceert dat alle knooppunten in een gedistribueerd systeem als gelijken moeten worden behandeld. Daarom mogen er geen oproepen plaatsvinden naar het "centrale" of "master"-knooppunt om een ​​gecentraliseerde dienst te verkrijgen.
3. Continue werking. Gedistribueerde systemen zouden meer moeten bieden hoge graad betrouwbaarheid en beschikbaarheid.
4. Onafhankelijkheid van locatie. Gebruikers mogen niet weten waar de gegevens precies fysiek zijn opgeslagen en moeten doen alsof alle gegevens op hun eigen lokale knooppunt zijn opgeslagen.
5. Onafhankelijkheid van fragmentatie. Een systeem ondersteunt fragmentatie-onafhankelijkheid als een gegeven relatievariabele in delen of fragmenten kan worden verdeeld bij het organiseren van de fysieke opslag ervan. In dit geval kunnen gegevens worden opgeslagen op de plaats waar deze het meest worden gebruikt, waardoor lokalisatie van de meeste bewerkingen mogelijk is en het netwerkverkeer wordt verminderd.
6. Onafhankelijkheid van replicatie. Een systeem ondersteunt gegevensreplicatie als een bepaalde opgeslagen relatievariabele - of in het algemeen een bepaald fragment van een bepaalde opgeslagen relatievariabele - kan worden weergegeven door verschillende afzonderlijke kopieën of replica's die op verschillende afzonderlijke knooppunten zijn opgeslagen.
7. Gedistribueerde verzoeken verwerken. Het punt is dat een verzoek mogelijk contact moet opnemen met meerdere knooppunten. In een dergelijk systeem kunnen er veel manieren zijn om gegevens door te sturen om aan het betreffende verzoek te voldoen.
8. Beheer van gedistribueerde transacties. Er zijn 2 hoofdaspecten van transactiebeheer: herstelbeheer en gelijktijdigheidsbeheer. Wat het herstelbeheer betreft, moet het systeem, om de atomiciteit van een transactie in een gedistribueerde omgeving te garanderen, ervoor zorgen dat de hele set agenten die verband houden met een bepaalde transactie (een agent is een proces dat voor een bepaalde transactie op apart knooppunt) heeft de resultaten vastgelegd of een rollback uitgevoerd. Wat betreft gelijktijdigheidscontrole: deze is in de meeste gedistribueerde systemen gebaseerd op een blokkeermechanisme, net als bij niet-gedistribueerde systemen.
enz.............

Architectuur van gedistribueerde informatiesystemen en webapplicaties

Gedistribueerd systeem is een set van onafhankelijke computers, dat voor hun gebruikers lijkt als één enkel verenigd systeem. Ondanks het feit dat alle computers autonoom zijn, lijken ze voor gebruikers één systeem.

De belangrijkste kenmerken van gedistribueerde systemen:

1. De verschillen tussen computers en de communicatiemethoden daartussen zijn voor gebruikers verborgen. Hetzelfde geldt voor de externe organisatie van gedistribueerde systemen.

2. Gebruikers en applicaties ervaren een consistente ervaring op gedistribueerde systemen, ongeacht waar of wanneer ze met elkaar communiceren.

Gedistribueerde systemen moeten ook relatief eenvoudig uit te breiden of te schalen zijn. Dit kenmerk is een direct gevolg van de aanwezigheid van onafhankelijke computers, maar geeft tegelijkertijd niet aan hoe deze computers daadwerkelijk tot één systeem worden gecombineerd.

Om een ​​uniform beeld van het systeem te behouden, bevat een gedistribueerde systeemorganisatie vaak een extra softwarelaag die zich bevindt tussen de bovenste laag van gebruikers en applicaties en de onderste laag van besturingssystemen (Figuur 1.11).

Dienovereenkomstig wordt een dergelijk gedistribueerd systeem gewoonlijk genoemd systeem op gemiddeld niveau (middleware). Merk dat op gemiddeld niveau verdeeld over vele computers.

Kenmerken van het functioneren van gedistribueerde systemen zijn onder meer:

beschikbaarheid grote hoeveelheid voorwerpen;

· vertragingen bij de uitvoering van verzoeken (als lokale oproepen bijvoorbeeld ongeveer een paar honderd nanoseconden duren, dan hebben verzoeken aan een object in gedistribueerde systemen 0,1 tot 10 ms nodig);

· sommige voorwerpen mogen langere tijd niet worden gebruikt;

· gedistribueerde componenten worden parallel uitgevoerd, wat leidt tot de noodzaak om de uitvoering te coördineren;

· verzoeken in gedistribueerde systemen hebben een grote kans op falen;

· verhoogde veiligheidseisen.

Vanwege de aanwezigheid van toegenomen vertragingen kunnen interfaces in gedistribueerd systeem moet worden ontworpen om de uitvoeringstijd van query's te verkorten. Dit kan worden bereikt door de toegangsfrequentie te verminderen en door de uitgevoerde functies uit te breiden.

Om storingen tegen te gaan, moeten clients controleren of verzoeken door de server worden uitgevoerd. Veiligheid erin gedistribueerde applicaties kan worden vergroot door het monitoren van communicatiesessies (authenticatie, autorisatie, gegevenscodering).

De architectuur van webapplicaties (webservices) wordt tegenwoordig veel gebruikt. Webservice is een applicatie die toegankelijk is via internet. Het levert diensten waarvan de vorm niet afhankelijk is van de dienstverlener, aangezien het wordt gebruikt universeel platform functioneren en universeel formaat gegevens (XML). IN Webgebaseerd-services zijn gebaseerd op standaarden die de formaten en taal van zoekopdrachten definiëren, evenals protocollen voor het zoeken naar deze services op internet. Het schema voor toegang tot de database via internet wordt getoond in figuur 1.12.


Figuur 1.12 – Schema van toegang tot de DBMS-server via internet

Momenteel zijn er drie verschillende technologieën die het concept van gedistribueerde objectsystemen ondersteunen: EJB, DCOM CORBA.

Het belangrijkste idee achter de ontwikkeling van EJB-technologie ( Enterprise Java-bonen) – creëer een infrastructuur voor componenten zodat ze gemakkelijk van servers kunnen worden geplaatst en verwijderd, waardoor de functionaliteit van de server wordt vergroot of verkleind. EJB-componenten zijn Java-klassen en kunnen op elke EJB-compatibele server worden uitgevoerd, zelfs zonder hercompilatie. De belangrijkste doelstellingen van EJB-technologie zijn:

1. Maak het voor ontwikkelaars gemakkelijker om applicaties te maken door hen te ontlasten van de noodzaak om services zoals transacties, threads, laadacties, enz. helemaal opnieuw te implementeren. Ontwikkelaars kunnen hun aandacht concentreren op het beschrijven van de logica van hun applicaties, waardoor de opslagtaken kunnen worden verschoven , overdracht en beveiliging van gegevens naar het EJB-systeem.

2. Beschrijf de hoofdstructuren van het EJB-systeem en de interfaces voor interactie tussen de componenten ervan.

3. Bevrijd de ontwikkelaar van het implementeren van EJB-objecten vanwege de aanwezigheid van een speciale codegenerator.

Dankzij het gebruikte Java-model is EJB relatief eenvoudig en op een snelle manier het creëren van gedistribueerde systemen.

DCOM-technologie ( Gedistribueerde component Objectmodel ) - software-architectuur, ontwikkeld door Microsoft voor het distribueren van applicaties over meerdere computers in een netwerk. Een softwarecomponent op de ene computer kan DCOM gebruiken om berichten door te geven aan een component op een andere computer. DCOM brengt automatisch een verbinding tot stand, verzendt een bericht en stuurt een antwoord terug naar de externe component. Dankzij het vermogen van DCOM om componenten met elkaar te verbinden, heeft Microsoft dit kunnen bieden Ramen in de buurt extra functies vooral uit te voeren Microsoft-server Transactieserver, verantwoordelijk voor het uitvoeren van databasetransacties via internet.

Thuis > Document

GEDISTRIBUEERDE INFORMATIESYSTEMEN

Yu.A. Illarionov

HOOFDSTUK 1. ANALYSE VAN DE ONTWIKKELINGSSTAND VAN BASISCONCEPTEN EN CONTROLE-ALGORITMEN VOOR GEDISTRIBUEERDE COMPUTERSYSTEMEN GEBASEERD OP LOKALE NETWERKEN. 1.1. Definitie van het onderzoeksgebied. Een gedistribueerd computersysteem (DCS) is een systeem dat uit twee componenten bestaat: een reeks elektronische computers (computers) en een communicatienetwerk (of datatransmissienetwerk) dat alle computers in het DCS verenigt. Alle nuttige informatieverwerking wordt uitgevoerd door computerprocessen die doorlopen computer gastheer. Alle verwerking van informatie die verband houdt met de noodzaak om deze door te geven communicatie netwerk, voer processen uit die zich bevinden op mededeling computer Communicatiecomputers zijn nodig in communicatienetwerken met een complexe, meervoudig verbonden topologie, op voorwaarde dat deze direct zijn fysieke verbindingen(kanalen) tussen hostcomputers die communiceren via informatieoverdracht ontbreken. Houd er dus rekening mee dat voor effectieve informatieverwerking in een DCS het niet alleen nodig is om effectief te zijn proces op de computerhost, maar ook efficiënt (dat wil zeggen met de minste vertragingen) verzenden via een communicatienetwerk, Het werk op het gebied van RVS was verdeeld in twee groepen: 1. Werkzaam op het gebied van het organiseren van interactie computerprocessen in RVS. In deze werken wordt ervan uitgegaan dat het communicatienetwerk al bestaat en voldoet aan bepaalde eisen die eraan worden gesteld. Het enige dat dus overblijft is het oplossen van het probleem van het organiseren van de interactie van computerprocessen, rekening houdend met het volgende:
    er zijn veel rekenprocessen in de RCS; er zijn veel computerbronnen in de RCS; processen en bronnen kunnen zich op verschillende hostcomputers bevinden; processen kunnen parallel worden uitgevoerd; in het systeem is er concurrentie tussen gedistribueerde parallelle processen om computerbronnen; in RVS bestaat er heterogeniteit tussen hostcomputers en hun computers besturingssystemen; Er is een tendens naar decentralisatie van de controle over de interactie van computerprocessen in DCS's om de betrouwbaarheid van laatstgenoemde te vergroten.
2. Werk op het gebied van het organiseren van processen voor het verzenden van informatie via communicatienetwerken. Deze werken worden gekenmerkt door het idee van een netwerk als een reeks invoer-/uitvoerpoorten, waartussen logische verbindingen bestaan. Wie informatie aan deze havens levert en wie deze daar vandaan haalt, is niet aanwezig in dit geval object van onderzoek. De enige vraag is hoe informatie het meest effectief kan worden overgedragen via een communicatienetwerk van de ene poort naar de andere, op voorwaarde dat:
    verbindingen tussen poorten staan ​​niet vast en de structuur van logische verbindingen in het netwerk kan dynamisch veranderen; het netwerk kan een mesh-topologie hebben waarin er geen directe fysieke verbindingen tussen poorten zijn; informatie kan tijdens de verzending vervormd raken; informatiestromen, inclusief hun volume en richting, zijn niet vooraf bepaald; om de overdracht van informatie via een communicatienetwerk te organiseren, is het noodzakelijk om de verdeling van communicatiemiddelen tussen informatiestromen te organiseren in omstandigheden van een gebrek aan deze middelen; het beheer van het delen van communicatiemiddelen is doorgaans gedecentraliseerd.
Dit proefschrift behoort tot het werk van de eerste groep en is uitsluitend gewijd aan de kwesties van het organiseren van de interactie van computerprocessen in een digitaal computersysteem. Laten we het onderzoeksgebied nauwkeuriger definiëren. Gezien dat in termen van mogelijkheden technische middelen DCS's verschillen voornamelijk in de communicatienetwerken die daarin worden gebruikt; gedistribueerde systemen kunnen in tweeën worden verdeeld grote groepen: DCS gebouwd op basis van netwerken met routing en DCS gebouwd op basis van netwerken met informatieselectie, of netwerken met een gemeenschappelijk communicatiekanaal. Dit werk is gewijd aan de organisatie van de verdeling van computerbronnen in RCS, bedoeld voor het beheer van productieprocessen in realtime en gebouwd op de basis lokale netwerken communicatie met gedecentraliseerde prioriteitscontrole van toegang tot een gemeenschappelijk kanaal. Kwesties van gedecentraliseerde prioritaire toegangscontrole (PAC) worden in de werken besproken. In deze zelfde werken werd voor het eerst het idee tot uitdrukking gebracht dat de aanwezigheid van hulpmiddelen voor afstandsbediening en irechtstreeks in het systeem aanwezig is algemeen kanaal tijdens het overdrachtsproces kan het op een nieuwe manier het beheer van de interactie van gedistribueerde computerprocessen in het DCS organiseren. Met andere woorden: lokale netwerken met afstandsbediening kunnen niet alleen als communicatiesysteem worden beschouwd, maar ook als aanvullende remedie beheer van gedistribueerde systemen. Deze kwestie is echter nog niet volledig onderzocht. Het hoofddoel van dit werk is dus het bestuderen van de kwesties van het verdelen van DCS-bronnen tussen computerprocessen in de omstandigheden van de bestaande verdeling van zowel bronnen als processen, in aanwezigheid van veel verzoeken om het gebruik van bronnen die parallel ontstaan ​​bij onzekere omstandigheden. momenten; Op basis van het uitgevoerde onderzoek moeten nieuwe hogesnelheidsalgoritmen voor het delen van bronnen worden ontwikkeld voor DCS, gebouwd op basis van lokale netwerken met DPU en computerfaciliteiten in een gemeenschappelijk kanaal (COC). gebied van DCS voor industrieel gebruik, d.w.z. voor real-time systemen. Qua rekenkracht is dit systeem voornamelijk op de basis gebouwd microprocessor technologie Daarom zullen we dergelijke DCS's in de toekomst gedistribueerde microprocessorbesturings- en computersystemen (RMCS) noemen. Rekening houdend met de bestaande kenmerken van communicatienetwerken voor de onderzochte systemen, zullen we deze kenmerken analyseren in vergelijking met andere bekende netwerken. 1.2. Kenmerken van lokale netwerken met gedecentraliseerde prioriteitscontrole van toegang tot het kanaal. De eerste publicaties gewijd aan de principes van het verzenden van informatie via een gemeenschappelijk communicatiekanaal in de vorm van verdeling door veel abonnees (vanuit netwerkoogpunt is een abonnee een computerhost die toegang heeft tot het kanaal via netwerkcontroller; meer in brede zin de abonnee kan zijn afzonderlijk proces, uitgevoerd op een computerhost), verscheen begin jaren zeventig. Tegen die tijd was er behoorlijk wat ervaring opgebouwd met het maken van RVS op basis van mondiale netwerken, en dit kwam tot uiting in de oplossingen die later werden gebruikt in DVR's op basis van lokale netwerken (of lokale DVR's LRVS). Sommige werken maken nog steeds geen onderscheid tussen de managementorganisatie in mondiale DVR's en LVRS's, maar er wordt aangenomen dat deze twee klassen alleen verschillen in de lengte van hun communicatielijnen. Verschijning IEEE-standaarden 802 en ECMA brachten enige duidelijkheid in deze kwestie, maar alleen met betrekking tot de organisatie van de communicatie met de LRVS. Daarom houden de meeste werken die zijn gewijd aan het organiseren van de interactie van computerprocessen in LVCS geen rekening met de specifieke kenmerken van dergelijke systemen, die hieronder zullen worden weergegeven. Een aantal auteurs is echter van mening dat LVNS in hun moderne opvatting systemen zijn waarvan de architectonische kenmerken dichter bij multiprocessorsystemen liggen dan bij "computernetwerken" in hun traditionele opvatting. Dit geldt vooral voor de systemen die in dit werk worden bestudeerd - een aantal onderscheidende kenmerken stellen ons in staat ze als volledig te beschouwen nieuwe klasse DCS's gebouwd op basis van lokale communicatienetwerken met unieke mogelijkheden die niet beschikbaar zijn in andere gedistribueerde systemen. Laten we de belangrijkste architecturale kenmerken van lokale communicatienetwerken met DPU en FOC noteren, die belangrijk zullen zijn in verder onderzoek.
    Beschikbaarheid van gemeenschappelijk hogesnelheidskanaal communicatie. De aanwezigheid van een gemeenschappelijk kanaal zorgt ervoor dat de lokale verbinding degenereert in een dergelijk netwerk is het niet nodig om de hoofdnetwerkprocedure uit te voeren: het routeren van pakketten bij het verzenden van informatie. Bovendien maakt, zoals later zal worden aangetoond, de aanwezigheid van een gemeenschappelijk kanaal in verbinding met de DPU en FOC het mogelijk dat het kanaal niet alleen wordt gebruikt als een middel voor het verzenden van informatie, maar ook als een effectief middel voor het beheren van een gedistribueerd systeem. Hoge snelheid Door de overdracht van informatie via een kanaal kunt u netwerkprotocollen bouwen met behulp van headers lange lengte protocollen te vereenvoudigen. Met andere woorden, bij deze snelheid is het niet nodig om de lengte van de verzonden pakketten te minimaliseren. Met grote pakketten kunt u overstappen op een methode voor het schakelen van berichten die eenvoudiger is vanuit het oogpunt van het organiseren van systeemsoftware transport laag. Bovendien maakt de mogelijkheid om headers met lange lengte te verzenden het mogelijk, zoals later zal worden aangetoond, om fundamenteel nieuwe methoden voor informatie-uitwisseling in LRVS te gebruiken, die worden gekenmerkt door hogere efficiëntie en eenvoudiger implementatie vergeleken met bestaande. Kanaaltoegangscontrole. Het bepaalt grotendeels de kenmerken van lokale communicatienetwerken. Tot voor kort was de invloed van toegangscontrolemethoden echter groot doorvoer kanaal. Tegelijkertijd heeft het toegangscontrolemechanisme, zoals opgemerkt in de werken, een veel grotere impact op de LVR. Met name door het gebruik van DPU kunt u dit oplossen lage niveaus een aantal taken die traditioneel op hogere niveaus werden opgelost met behulp van berichtenuitwisseling. Het onderzoek op dit gebied is echter nog maar net begonnen. Berekeningen in een gemeenschappelijk kanaal. Algoritmen voor berekeningen in een gemeenschappelijk kanaal (COC) worden in de werken voorgesteld. Hun essentie is dat informatie die door een communicatiekanaal gaat, door abonnees van een gedistribueerd systeem kan worden verwerkt zonder vertraging in de verwerking ervan. Het gebruik van VOK maakt groepsverwerking mogelijk van informatie in de LRVS door alle abonnees tijdens de verzending ervan en maakt het mogelijk om een ​​groepsantwoord van alle abonnees te ontvangen in één overdracht van informatie via het kanaal, wat niet beschikbaar is in andere gedistribueerde systemen.
De opsomming van de kenmerken van communicatienetwerken met afstandsbedieningscentra en glasvezelnetwerken geeft reden om aan te nemen dat LRVS die op basis van dergelijke netwerken zijn gebouwd, niet kunnen worden beschouwd als ‘dezelfde grote computernetwerken, alleen kleine’, hoewel zo’n netwerk in het algemeen standpunt is momenteel wijdverspreid. Laten we verder gaan met het bekijken van de belangrijkste taken en concepten van controle in gedistribueerde systemen. 1.3. Basistaken en concepten van controle in gedistribueerde computersystemen. De belangrijkste beheertaak in elk computersysteem is het delen van hulpbronnen bij gebrek aan hulpbronnen. In een DCS heeft de taak van verdeling zijn eigen kenmerken die verband houden met de verdeling van bronnen en processen over verschillende abonnees van het systeem. Laten we deze kenmerken opsommen.
    Omdat de RCS veel computers omvat, kan elk van deze zijn eigen bronnen beschikbaar hebben voor processen die zowel lokaal (dat wil zeggen op dezelfde computer) als op afstand (dat wil zeggen op een andere computer) worden uitgevoerd. Als een bron lokaal is (dat wil zeggen volledig eigendom is van een afzonderlijke computer), dan ligt de verantwoordelijkheid voor de juiste synchronisatie van processen bij toegang tot een dergelijke bron volledig bij deze computer. In dit geval doet het synchronisatieprobleem zich niet voor als de bron exclusief wordt gebruikt. Als de hulpbron gemeenschappelijk is, dan ontstaat in de RVS het probleem van het verdelen van een dergelijke hulpbron vanwege het feit dat, indien geconcentreerd gecentraliseerde systemen De meeste overheadkosten voor het organiseren van de verdeling (d.w.z. het toewijzen van geheugen voor buffers, enz.) worden gedragen door de processen zelf volgens het principe 'wie het nodig heeft, betaalt'. In RCS worden deze kosten toegewezen aan de bedienende computer en deze blijkt dat “Wie serveert, ook betaalt.” In een DCS kan een hulpbron zo worden georganiseerd dat om te beslissen of deze aan een bepaald proces moet worden verstrekt, de collectieve toestemming vereist is van alle computers die eigenaar zijn van individuele delen van een dergelijke hulpbron, de zogenaamde gedistribueerde hulpbron. Dit probleem deed zich aanvankelijk voor in gedistribueerde databases, waarin deze, om een ​​hoge betrouwbaarheid van de informatieopslag te garanderen, herhaaldelijk werd gekopieerd en door het hele systeem gedistribueerd. De resulterende synchronisatietaak bij het bijwerken van veel kopieën van gedistribueerde informatie is de basistaak van gedistribueerde besturing in een DCS, en de effectiviteit van de oplossing bepaalt uiteindelijk de efficiëntie van de besturing als geheel.
Traditioneel wordt in elk computersysteem het beheer van het delen van bronnen aan het systeem toegewezen software– besturingssystemen (OS). Dit geldt ook voor DCS; dergelijke software wordt gedistribueerde besturingssystemen (DOS) genoemd. Ondanks de grote verscheidenheid aan momenteel bestaande ROS's en de verschillen in de controlealgoritmen die daarin worden gebruikt, kunnen ze worden geclassificeerd op basis van verschillende basismodellen die hieronder worden gegeven. Model МРММ (veel bronnen - veel monitoren). Het belangrijkste idee dat ten grondslag ligt aan dit model is het autonomieprincipe, volgens hetwelk elke computer die deel uitmaakt van de ROS de “meester” is van zijn eigen lokale bronnen en alleen hij het recht heeft om het probleem van hun verdeling op te lossen. Met deze aanpak beschikt elke computer over een proces dat de bronnen van deze computer bewaakt. Alle andere processen zijn verbonden met monitoren via een berichtenmechanisme via het transportnetwerk volgens de zevenlaagse architectuur |SO/OSI. Het MPMM-model is een model computernetwerk in zijn traditionele zin; systemen gebouwd volgens dit model zijn in de eerste plaats bedoeld om " e-mail"en het organiseren van toegang tot externe computerbronnen. Het probleem van het beheren van de verdeling van gedistribueerde bronnen in dergelijke systemen is niet opgelost. Model MPOM (veel bronnen - één monitor). Volledig gecentraliseerd model. Er wordt een centraal proces in het systeem geïntroduceerd, dat een monitor is van het hele systeem en in het bijzonder een monitor van gedistribueerde bronnen. Alle andere processen hebben alleen toegang tot monitoren via de centrale monitor. Het beheren van de verdeling van gedistribueerde bronnen is in dit geval niet moeilijk, maar de introductie van een centraal proces vermindert de betrouwbaarheid van de DCS sterk. Daarom worden gecentraliseerde besturingsmethoden in de regel alleen gebruikt in de eenvoudigste gedistribueerde systemen die niet bedoeld zijn voor kritische toepassingen. ORMM-model (één bron – veel monitoren). Het model is gebaseerd op de veronderstelling dat het systeem over een bron beschikt waarvan de betrouwbaarheid veel groter is dan de betrouwbaarheid van welke monitor dan ook. In feite worden dergelijke bronnen, zoals reeds vermeld, gevormd door het kopiëren van de belangrijkste systeembronnen en het distribueren van kopieën onder verschillende DCS-abonnees; en elk exemplaar heeft zijn eigen monitor. U kunt informatie parallel lezen uit elke werkkopie van de bron; informatie moet op alle exemplaren worden bijgewerkt. Onder deze omstandigheden moeten bij het bijwerken van informatie alle kopieermonitors communiceren met het doel om een ​​collectieve beslissing te nemen over het ter beschikking stellen van een bron voor de update- of schrijfbewerking. Dergelijke RVS worden systemen met genoemd gedistribueerd(decentraal collectief) beheer; Dit werk is gewijd aan hun ontwikkeling. Het belangrijkste probleem voor dergelijke systemen is het probleem van het synchroniseren van monitoren bij het ontwikkelen van collectieve beslissingen. Afhankelijk van de methoden die momenteel worden gebruikt om monitoren te synchroniseren, kan RVS van deze klasse in twee groepen worden verdeeld. In de eerste groep RVS werken monitoren met elkaar samen door berichten uit te wisselen via het transportnetwerk. Het belangrijkste voordeel van dergelijke systemen is dat de monitorsynchronisatie-algoritmen in dit geval niet afhankelijk zijn van de netwerkstructuur (topologie, toegangsmethoden, enz.) en in elk DCS kunnen worden gebruikt. Zoals later echter zal worden aangetoond, vereisen algoritmen van deze klasse het verzenden van een aanzienlijk aantal berichten via het transportnetwerk, wat leidt tot grote tijdskosten voor synchronisatie. Bij het beoordelen van de effectiviteit van algoritmen moet er rekening mee worden gehouden dat de overhead van het verzenden van één bericht via een transportnetwerk ongeveer 20 ms bedraagt ​​voor een breed scala aan gedistribueerde systemen. Deze synchronisatiebenadering wordt echter veel gebruikt vanwege het huidige gebrek aan geschikte oplossingen alternatieve manieren voor computernetwerken. In de tweede groep RVS worden speciaal speciale communicatielijnen gebruikt om monitoren te synchroniseren, waardoor alleen synchronisatiegegevens kunnen worden verzonden controle informatie(impulsen, potentiëlen op lijnen, enz.). Dit principe wordt gebruikt in multimicroprocessorsystemen met netwerk organisatie met korte communicatielijnen. Voor DCS op basis van lokale langeafstandsnetwerken (tot 2 km) is deze aanpak echter onaanvaardbaar vanwege de aanzienlijke toename kabel producten, aangezien het aantal synchronisatielijnen zowel kan afhangen van het aantal gedistribueerde producten als van het aantal systeemabonnees. Laten we verder gaan met het bekijken van de bekende algoritmen voor het delen van bronnen in een DCS met gedistribueerde controle. 1.4. Algoritmen voor het delen van bronnen voor systemen met gedistribueerde controle. Alle algoritmen voor het delen van bronnen voor systemen met gedistribueerde controle kunnen in drie groepen worden verdeeld: algoritmen die gebruik maken van stemmen, algoritmen die gebruik maken van pre-locking en algoritmen met circulerende privileges die zijn gebaseerd op het proces van het uitwisselen van berichten tussen procescontrollers om tot resultaten te komen een overeenkomst over de volgorde van transacties in een gedistribueerd systeem. Een transactie is een reeks bewerkingen waarbij informatie uit een database wordt gelezen, de gelezen informatie wordt bijgewerkt (veranderd) en de bijgewerkte informatie naar de database wordt geschreven. Als het stemmen en het uitvoeren van producententransacties door dezelfde controllers worden uitgevoerd, wordt stemmen synchroon genoemd; indien verschillend, wordt stemmen asynchroon genoemd. Bij het synchroon stemalgoritme voegt de controller, de controller die het transactieverzoek heeft geaccepteerd, een tag toe: een tijdstempel uit het bericht met daarin de essentie van het verzoek en de identificatie van de abonnee die het verzoek heeft verzonden. Als vervolgens de stemming over de vorige transactie niet is gestart, stuurt deze controller een broadcastbericht met zijn stem naar alle andere controllers (Fig. 1.1.). Als we aannemen dat het mogelijk is om de hogere prioriteit van een transactie T a te onderscheiden van de prioriteit van transactie T c, dan zal het systeem drie controleurs zal als volgt werken. 1. Controller B: als de stem voor transactie T c eerder wordt geaccepteerd dan een stem voor Ta, dan zendt controller B zijn stem uit en geeft deze aan T c (figuur 1.1a). Bij ontvangst van een transactieverzoek vernietigt T a B T c en zendt zijn stem uit voor transactie Ta (Fig. 1.1b). Als de stem voor transactie Ta eerder wordt geaccepteerd, brengt B onmiddellijk zijn stem uit voor T a, waarbij hij de later uitgebrachte stemmen voor T c weggooit. 2. Controller C: brengt zijn stem uit op T wanneer hij een stem op T krijgt. 3. Controller A: gooit alle stemmen voor T s weg. Na het ontvangen van stemmen van alle verwerkingsverantwoordelijken voor dezelfde transactie (in het beschouwde geval Ta), begint elk van de verwerkingsverantwoordelijken met het uitvoeren van deze transactie. Een ander algoritme voor synchroon stemmen wijst expliciet de initiërende controller toe. Als een transactie door de verwerkingsverantwoordelijke is ontvangen voor uitvoering (dat wil zeggen van de gebruiker), dan initieert deze verwerkingsverantwoordelijke het stemmen door een verzoek om te gaan stemmen naar andere verwerkingsverantwoordelijken te sturen. Als alle andere controllers op dit verzoek reageren door een ACK+-bericht te sturen, wordt de transactie geaccepteerd en zendt de initiërende controller een UPD-bericht uit voor lokale transactie-initiaties door alle andere controllers. Controllers die klaar zijn met het lokaal uitvoeren van een transactie (of helemaal niet zijn begonnen met het uitvoeren ervan) signaleren een EIND-reactie aan de initiator. Na ontvangst van END-berichten van alle controllers gaat de initiator naar de beginstatus. Verwerkingsverantwoordelijken die de volgende transactie hebben afgerond, gaan ook naar de beginstatus en zijn klaar voor nieuwe transacties. Elke verwerkingsverantwoordelijke kan, nadat hij een verzoek om een ​​nieuwe transactie heeft geaccepteerd, deze alleen beginnen uit te voeren als dit verenigbaar is met de huidige transactie die door de verwerkingsverantwoordelijke wordt uitgevoerd. Alleen in dit geval kan het ACK+-bericht naar de initiator worden verzonden en begint de uitvoering van een nieuwe transactie na ontvangst van de UPD. Transacties worden als compatibel beschouwd als ze verschillende sets lees- en schrijfbewerkingen vereisen voor de uitvoering ervan. Transactieprioriteiten verschillen afhankelijk van het algoritme dat in het werk wordt gegeven. 1.2. laat zien hoe conflicten verschillen wanneer twee compatibele transacties een stemverzoek initiëren. Controllers A en C stemmen competitief op T a en T c. Controller B stemt voor beide transacties omdat het bevindt zich in de oorspronkelijke staat. A en C stemmen op elkaar nadat ze hebben gecontroleerd of transacties Ta en Tc compatibel zijn (b). Lokale uitvoering van transacties wordt gestart (c) en na voltooiing van lokale uitvoering wordt beëindiging gesignaleerd (d). In de gedistribueerde database SDD 1 zijn asynchrone stemalgoritmen gebruikt. In dit systeem worden transacties gegroepeerd in een reeks transactieklassen op basis van hun lees- en schrijfsets. Transactieklassen worden vooraf gedefinieerd door de databasebeheerder. Om de synchronisatiekosten te verlagen zijn vier verschillende synchronisatieprotocollen ontwikkeld. Het P1-protocol biedt controle over lager niveau, met minimale kosten en hoge efficiëntie, terwijl het P4-protocol dat biedt hoogste niveau beheer, met grote overheadkosten. Protocollen worden geselecteerd op basis van transactieklassen. Het opeenvolgen van lees-/schrijfverzoeken van verschillende gelijktijdige transacties wordt bereikt door tijdstempels aan transacties toe te wijzen en die tijdstempels te schrijven naar alle aangevraagde database-items waartoe een bepaalde transactie toegang heeft. Het wijzigen van een kopie van een database-item wordt alleen aan een transactie toegekend als het verzoek heeft een tijdstempel De wijzigingstransactie is nieuwer dan de tijdstempel van de kopie. Dit zorgt ervoor dat alle kopieën in dezelfde staat aankomen op het moment dat de updateprocedures eindigen. Een transactieklasse in SDD 1 wordt gedefinieerd als een reeks transacties die verband houden met de individuele hostcomputer waarop de nieuwe basis gegevens. Alle bijbehorende transacties worden gekenmerkt door elkaar uitsluitende leessets
en elkaar uitsluitende recordsets
Transacties worden als volgt in twee fasen verwerkt. Tijdens de eerste fase wordt elke transactie lokaal verwerkt op de computerhost waar deze is geïnitieerd; in dit geval wordt gebruik gemaakt van een kopie van de database die bij deze computer hoort. Alle noodzakelijke lees-/schrijfbewerkingen worden lokaal uitgevoerd; Er wordt een lijst met databasewijzigingen gegenereerd en opgeslagen. Het lokaal uitvoeren van een transactie wordt gedefinieerd als een primitieve actie . Zodra de eerste fase van de transactie is voltooid, verzendt de controller de databasewijzigingslijst naar alle andere controllers, die hun kopieën bijwerken op basis van de verzonden lijst. Deze acties worden gedefinieerd als een andere primitieve actie . Primitieven en zijn ondeelbaar, terwijl de combinatie van L- en U-transactie t geen ondeelbaarheid nodig heeft. In SDD 1 is een dergelijke reeks primitieven L en U mogelijk, op voorwaarde dat de uitvoeringsgeschiedenis van drie transacties t1, t2 en t3 behouden blijft. Om de mogelijke wederzijdse invloed van transacties uit verschillende klassen te bepalen, veroorzaakt door de overlap van schrijven en lezen sets, wordt een constructie voorgesteld die een LU-grafiek wordt genoemd. Deze grafiek verbindt paren knooppunten met het label L en U voor elke klasse. De bogen ertussen en andere knooppunten zijn in overeenstemming met de volgende soorten wederzijdse beïnvloeding van transacties: 1 .Boog naar een knooppunt U dat tot dezelfde klasse behoort. 2 .Boog naar knooppunt een andere klasse op dezelfde computerhost m treedt op wanneer aan de voorwaarden is voldaan
,
of
(horizontale boog). 3 .Boog naar knooppunt dezelfde klasse op een andere computerhost vindt plaats als
,
(horizontale boog). 4. Er vindt een boog plaats naar een knooppunt U van een andere klasse op een andere computerhost
, . 5. Bogen tussen knooppunt U en andere knooppunten ontstaan ​​volgens de volgende regel: to, if
en (diagonale boog). In afb. 1.3. toont LU-grafiek voor klassetransacties
onder voorwaarden
,

,
Zodra de LU-grafiek voor een bepaald systeem is samengesteld, wordt een tabel gedefinieerd om één van de vier protocollen P1 P4 voor elke transactieklasse te selecteren in overeenstemming met de LU-topologie volgens de volgende regels. De protocollen P2 en P3 zijn identiek, behalve de regels voor het tijdstempelen van stemberichten die naar alle controllers worden verzonden. Protocol P2 selecteert de meest recente tijdstempel uit , terwijl P3 de tijdstempel met de huidige tijd selecteert. In afb. 1.4. de werking van de P2- en P3-protocollen wordt getoond. Stel dat twee transacties t a en t c met elkaar concurreren, waarbij transactie t c de nieuwere tijdstempel heeft. Vervolgens werken controllers A, B en C tijdens het stemmen als volgt samen:
    Als er een stem op t c bij A terechtkomt, wordt deze in de wachtrij geplaatst.

INLEIDING 4

1. HET CONCEPT VAN GEDISTRIBUEERD IS 6

1.1. Vereisten voor het maken van gedistribueerde IS 6

1.2. Concept van gedistribueerde informatiesystemen 8

1.3. Hulpmiddelen voor het werken met gedistribueerde gegevens 11

2. GEDISTRIBUEERDE DATABASES 13

2.1. Basisprincipes 13

2.2 Soorten gedistribueerde databases 15

2.3. Doel en werkingsprincipe van een gedistribueerde database 16

3. VOORBEELDEN VAN GEDISTRIBUEERDE SYSTEMEN 21

CONCLUSIE 25

LITERATUUR 26

INVOERING

De relevantie van dit onderwerp van het essay ligt in het feit dat de processen van globalisering en informatie-integratie plaatsvinden in de wereldeconomie. Ze hadden ook gevolgen voor ons land, dat vanwege zijn geografische ligging en omvang gedwongen is gebruik te maken van gedistribueerde informatiesystemen (IS). Gedistribueerde informatiesystemen zorgen voor werk met gegevens die zich op verschillende servers, verschillende hardware- en softwareplatforms bevinden en daarin zijn opgeslagen verschillende formaten. Ze zijn gemakkelijk uitbreidbaar, gebaseerd op open standaarden en protocollen, bieden integratie van hun bronnen met andere informatiesystemen en bieden gebruikers eenvoudige interfaces.

Er is een enorme hoeveelheid kant-en-klare informatie- en computerbronnen in de wereld. Ze zijn op verschillende tijdstippen gemaakt en er zijn verschillende benaderingen gebruikt om ze te ontwikkelen. Bijna altijd kunt u bij het ontwikkelen van een nieuw informatiesysteem kant-en-klare componenten vinden die geschikt zijn voor hun functies. Het probleem is dat toen ze werden gemaakt, er geen rekening werd gehouden met de incompatibiliteitsvereisten. Deze componenten begrijpen elkaar niet, ze kunnen niet samenwerken. Het is wenselijk om te beschikken over een mechanisme of een reeks mechanismen om dergelijke onafhankelijk ontwikkelde informatie- en computerbronnen interoperabel te maken.

Dit artikel onderzoekt basisinformatie over een gedistribueerd informatiesysteem: beschrijft de voorwaarden voor de ontwikkeling ervan, de manieren om met gegevens te werken, introduceert het concept van een gedistribueerde database, evenals de typen en basisprincipes ervan. Het derde hoofdstuk presenteert voorbeelden van gedistribueerde informatiesystemen, zoals: - Ingres Intelligent Database van Ingres Corp (versie 7) van Oracle Corp;

Het doel van de studie is om de theoretische grondslagen van gedistribueerde informatiesystemen te bestuderen en om kennis te ontwikkelen over de principes van de werking ervan.

Deze distributie van gegevens maakt het bijvoorbeeld mogelijk om in een netwerkknooppunt de gegevens op te slaan die het vaakst in dit knooppunt worden gebruikt. Deze aanpak maakt het gemakkelijker en sneller om met deze gegevens te werken en laat de mogelijkheid open om met de rest van de databasegegevens te werken.

1. HET CONCEPT VAN GEDISTRIBUEERD IS

1.1. Vereisten voor het creëren van gedistribueerde informatiesystemen

Vanaf het allereerste begin van de ontwikkeling van computertechnologie ontstonden er twee hoofdrichtingen voor het gebruik ervan. De eerste richting is het gebruik van computertechnologie om numerieke berekeningen uit te voeren die te lang duren of onmogelijk handmatig uit te voeren zijn. De opkomst van deze richting heeft bijgedragen aan de intensivering van methoden voor het numeriek oplossen van complexe wiskundige problemen, de ontwikkeling van een klasse programmeertalen gericht op het gemakkelijk vastleggen van numerieke algoritmen en het verkrijgen van feedback van ontwikkelaars van nieuwe computerarchitecturen.

De tweede richting is het gebruik van computertechnologie in automatische of geautomatiseerde informatiesystemen. Doorgaans zijn de hoeveelheden informatie waarmee dergelijke systemen te maken krijgen vrij groot, en de informatie zelf heeft een tamelijk complexe structuur. Een van de natuurlijke vereisten voor dergelijke systemen is de gemiddelde snelheid van operaties en de veiligheid van informatie.

Maar omdat informatiesystemen complexe datastructuren vereisen, vormden deze individuele aanvullende datacontroles een essentieel onderdeel van informatiesystemen en werden ze praktisch van het ene systeem naar het andere herhaald. De wens om het algemene deel van de informatiesystemen dat verantwoordelijk is voor het beheer van complex gestructureerde gegevens te identificeren en te generaliseren was blijkbaar de eerste motiverende reden voor het creëren van verschillende managementsystemen.

Al snel werd duidelijk dat het onmogelijk was om rond te komen gedeelde bibliotheek programma's die complexere methoden voor gegevensopslag implementeren bovenop het standaard basisbestandssysteem, bijvoorbeeld door informatie in verschillende bestanden op te slaan. Dit alles heeft dus bijgedragen aan de creatie van gedistribueerde informatiesystemen.

Als een informatiesysteem de consistente opslag van informatie in meerdere bestanden ondersteunt, kan er zelfs worden gezegd dat het een database ondersteunt. Als u met een aanvullend gegevensbeheersysteem met meerdere bestanden kunt werken en de consistentie ervan kunt garanderen, kunt u het een databasebeheersysteem noemen. Alleen al de eis om dataconsistentie over meerdere bestanden heen te handhaven, maakt geen bibliotheek van functies mogelijk: zo'n systeem moet over een aantal eigen data (metadata) beschikken en zelfs over kennis die de integriteit van de data bepaalt.

Er is een enorme hoeveelheid kant-en-klare informatie- en computerbronnen in de wereld. Ze zijn op verschillende tijdstippen gemaakt en er zijn verschillende benaderingen gebruikt om ze te ontwikkelen. Bijna altijd kunt u bij het ontwikkelen van een nieuw informatiesysteem kant-en-klare componenten vinden die geschikt zijn voor hun functies.

1.2. Het concept van gedistribueerde informatiesystemen

Normaal gesproken wordt een systeem waarin meer dan één databaseserver actief is, als gedistribueerd beschouwd. Dit wordt gebruikt om de belasting van de server te verminderen en de werking van geografisch afgelegen afdelingen te garanderen. De variërende complexiteit van creatie, wijziging, onderhoud en integratie met andere systemen maakt het mogelijk om informatiesystemen te verdelen in klassen van kleine, middelgrote en grote gedistribueerde systemen. Kleine informatiesystemen hebben een korte levenscyclus (levenscyclus), oriëntatie op massaal gebruik, lage prijs, onmogelijkheid van wijziging zonder de deelname van ontwikkelaars, waarbij voornamelijk gebruik wordt gemaakt van desktopdatabasebeheersystemen (DBMS), homogene hardware en software, die geen beveiliging hebben functies. Grote bedrijfsinformatiesystemen, systemen op federaal niveau en andere hebben een lange levenscyclus, migratie van oudere systemen, diversiteit aan hardware en software, de schaal en complexiteit van de taken die moeten worden opgelost, de kruising van veel vakgebieden, analytische gegevensverwerking en territoriale distributie van componenten.

De functies van dergelijke informatiesystemen omvatten in de eerste plaats het werken met gedistribueerde gegevens die zich op verschillende locaties bevinden fysieke servers, verschillende hardware- en softwareplatforms en opgeslagen in verschillende interne formaten. In dit geval moet het systeem volledige informatie over zichzelf en al zijn bronnen verschaffen, gemakkelijk uit te breiden zijn, gebaseerd zijn op open standaarden en protocollen, en de mogelijkheid bieden om zijn bronnen te integreren met de bronnen van andere informatiesystemen. Voor gebruikers moet het systeem verschillende niveaus van gebruikersrechten bieden en eenvoudige interfaces bieden voor toegang tot informatie.

Gegevens uit heterogene systemen worden meestal gecombineerd in logische groepen waaraan vragen worden geadresseerd. Een abstract querysysteem gaat ervan uit dat het systeem niet werkt met een specifieke querysyntaxis, maar met zijn logische essentie gebaseerd op abstracte attributen.
Bij het bouwen van gedistribueerde informatiesystemen worden in de regel twee basisarchitecturen gebruikt: client/server en internetintranet.
Enterprise IS gebouwd op een client/server-architectuur biedt klanten een breed scala aan toepassingen en ontwikkelingstools die gericht zijn op het maximaliseren van de computermogelijkheden van clientwerkstations. Serverbronnen worden voornamelijk gebruikt voor het opslaan en uitwisselen van documenten, maar ook voor toegang tot de externe omgeving. Met deze architectuur kunt u de serverkant van applicaties beter beschermen, terwijl applicaties zich rechtstreeks tot andere serverapplicaties kunnen richten of verzoeken ernaar kunnen routeren. Frequente clientoproepen naar de server verminderen echter de netwerkprestaties. Netwerkbeveiligingsproblemen moeten worden aangepakt omdat applicaties en gegevens over meerdere clients worden gedistribueerd. Het gedistribueerde karakter van de systeemconstructie maakt het moeilijk te configureren en te onderhouden

De IS gebaseerd op het internetintranet is gebaseerd op het principe van “open architectuur”. IS-software wordt geïmplementeerd in de vorm van applets of servlets (programma's in de JAVA-taal) of in de vorm van cgi-modules (programma's in Perl of C). Het IP-adres van deze architectuur omvat Web-yinh\, geïmplementeerd met behulp van CORBA Enterprise JavaBeans, ActiveX 1X"OM-technologieën, multi-level applicaties gebaseerd op Java en XML, .Net-concept met XML, waarin uitwisseling tussen verschillende servers (datawarehouses, zakelijke applicaties, servers voor mobiele clients, enz.) wordt geproduceerd met behulp van XML die neutraal is voor elke architectuur.

Een gedistribueerde informatiebasis betekent een onbeperkt aantal databases die op afstand van elkaar liggen en een aantal gemeenschappelijke kenmerken hebben:

Werken volgens uniforme regels die centraal zijn gedefinieerd voor alle databases die deel uitmaken van de gedistribueerde informatiebasis;

De gegevensuitwisseling vindt plaats volgens eveneens centraal vastgelegde regels.

De organisatie van een gedistribueerde database is noodzakelijk voor bedrijven die zich bezighouden met verschillende soorten activiteiten als het in hun dagelijkse werk nodig is om de volgende problemen op te lossen:

De noodzaak om snel informatie te verkrijgen uit databases van op afstand gelegen eenheden (of vestigingen);

De noodzaak om informatie uit de databases van juridische entiteiten die deel uitmaken van de bedrijfsstructuur in één database te consolideren, voor daaropvolgende gegevensanalyse en het verkrijgen van rapporten uit één database, zowel voor het bedrijf als geheel als voor elke juridische entiteit afzonderlijk;

De noodzaak om een ​​gecentraliseerde verandering door te voeren in de structuur en regels voor het beheer van databases voor de werking van alle op afstand gelegen divisies (filialen) en juridische entiteiten (met de onmogelijkheid om bepaalde regels rechtstreeks in een op afstand gelegen divisie te wijzigen);

De noodzaak om wijzigingen in gegevens in op afstand gelegen afdelingen van het bedrijf (filialen) te beperken en te controleren.

1.3. Hulpmiddelen voor het werken met gedistribueerde gegevens

Wanneer u een gedistribueerde IS kiest, moet u eerst letten op welke besturingssystemen en netwerkprotocollen deze ondersteunt. Niet minder belangrijk is echter welke methoden voor gegevensdistributie erin zijn geïmplementeerd.

1) Fragmentatie en duplicatie

Een van de manieren om tabellen te distribueren is fragmentatie. De tabel kan worden opgesplitst in delen die in verschillende knooppunten worden geplaatst. Een andere manier om gegevens te distribueren is duplicatie (replicatie). U kunt duplicaten maken van de gehele database of delen ervan en deze duplicaten in knooppunten plaatsen. Met beide methoden kunt u gegevens precies opslaan op het knooppunt waar deze het meest worden gebruikt. Dit minimaliseert de kosten van datatransmissie via het netwerk en vermindert het gebruik van processors en andere bronnen van andere knooppunten. Met deze applicatiedatabase-architectuur wordt gegevensoverdracht via het netwerk vrij zelden uitgevoerd.

2) Gegevenswoordenboeken en mappen

Zodra de gegevens over verschillende netwerkknooppunten zijn verdeeld, is het belangrijk om deze gegevens te vinden en te gebruiken. Om gegevens te vinden en deze in het gewenste formaat om te zetten, worden globale datadictionaria en directory's gebruikt. Het woordenboek slaat informatie op over gegevens, het gebruik ervan, toegangsrechten voor gegevens en toepassingen. Gegevensmappen worden gebruikt om te definiëren waar gegevens worden opgeslagen en hoe deze kunnen worden opgehaald. Woordenboeken en mappen kunnen globaal of lokaal zijn

3) Tweefasige fixatie veranderingen

Methoden voor gegevensdistributie zijn natuurlijk erg belangrijk, maar de kern van moderne gedistribueerde DBMS's is het tweefasige change commit-protocol. Dit protocol beheert de uitvoering van transacties die de gegevens van meerdere knooppunten wijzigen. Het hoofdidee van tweefasige commit is het volgende: het is onaanvaardbaar dat een transactie die gegevens in verschillende knooppunten verandert, in sommige knooppunten wordt uitgevoerd en in andere knooppunten niet wordt uitgevoerd. De transactie moet op alle knooppunten slagen of op elk knooppunt mislukken.