Analüütilised süsteemid OLAP. OLAP-tehnoloogiate rakendamine ärianalüütika tööriistana Olap-tehnoloogia eriomaduste hulka kuuluvad

1993. aastal avaldas andmebaasi ehitamise relatsioonilise lähenemise rajaja Edgar Codd ja tema partnerid (matemaatik ja IBM-i teadur Edgar Codd) Arbor Software'i (tänapäeval kuulus firma Hyperion Solutions) algatatud artikli pealkirjaga "OLAP-i pakkumine ( veebipõhine analüütiline töötlemine) analüütilistele kasutajatele", mis sõnastas OLAP-tehnoloogia 12 funktsiooni, mida hiljem täiendati veel kuue funktsiooniga. Nendest sätetest sai uue ja väga paljutõotava tehnoloogia põhisisu.

OLAP-tehnoloogia põhifunktsioonid (Basic):

  • andmete mitmemõõtmeline kontseptuaalne esitus;
  • intuitiivne andmete manipuleerimine;
  • andmete kättesaadavus ja üksikasjalikkus;
  • pakettandmete ekstraheerimine vs tõlgendamine;
  • OLAP analüüsi mudelid;
  • klient-server arhitektuur (OLAP-ile juurdepääsetav töölaualt);
  • läbipaistvus (läbipaistev juurdepääs välisandmetele);
  • mitme kasutaja tugi.

Eriomadused:

  • vormistamata andmete töötlemine;
  • OLAP-i tulemuste salvestamine: lähteandmetest eraldi salvestamine;
  • puuduvate väärtuste välistamine;
  • Puuduvate väärtuste käsitlemine.

Aruande esitluse funktsioonid:

  • paindlikkus aruandluses;
  • standardne aruandlusjõudlus;
  • füüsilise andmete ekstraheerimise kihi automaatne konfigureerimine.

Mõõtmete haldamine:

  • mõõtmiste universaalsus;
  • piiramatu arv mõõtmeid ja koondamistase;
  • piiramatu arv toiminguid dimensioonide vahel.

Ajalooliselt tähendab mõiste "OLAP" tänapäeval mitte ainult lõppkasutaja andmete mitmemõõtmelist vaadet, vaid ka sihtandmebaasis olevate andmete mitmemõõtmelist vaadet. Just seetõttu ilmusid mõisted "relatsiooniline OLAP" (ROLAP) ja "mitmemõõtmeline OLAP" (MOLAP) iseseisvate terminitena.

OLAP-teenus on tööriist suurte andmemahtude reaalajas analüüsimiseks. OLAP-süsteemiga suheldes on kasutajal võimalik paindlikult vaadata teavet, hankida suvalisi andmelõike ja teostada analüütilisi toiminguid, milleks on puurimine, kokkuvõtt, otsast lõpuni jaotamine ja ajas võrdlemine, kasutades samaaegselt paljusid parameetreid. Kogu töö OLAP-süsteemiga toimub ainevaldkonnas ja võimaldab teil luua statistiliselt usaldusväärseid äriolukorra mudeleid.

OLAP-tarkvara on tööriist laos sisalduvate andmete operatiivanalüüsiks. Peamine omadus on see, et need tööriistad on mõeldud kasutamiseks mitte infotehnoloogia valdkonna spetsialistile, mitte ekspertstatistikule, vaid juhtimisvaldkonna professionaalile - osakonna, osakonna, juhtkonna ja juhtkonna juhile. , lõpuks režissöör. Tööriistad on loodud selleks, et võimaldada analüütikul suhelda probleemiga, mitte arvutiga. Joonisel fig. Joonis 6.14 näitab põhilist OLAP-i kuupi, mis võimaldab hinnata andmeid kolmes mõõtmes.


Mitmemõõtmeline OLAP-kuubik ja vastavate matemaatiliste algoritmide süsteem statistiliseks töötlemiseks võimaldavad teil analüüsida mis tahes keerukusega andmeid igal ajaintervallil.

Riis. 6.14. Elementaarne OLAP-kuubik

Kuna tema käsutuses on paindlikud mehhanismid andmete töötlemiseks ja visuaalseks kuvamiseks (joonis 6.15, joon. 6.16), uurib juht esmalt erinevate nurkade alt andmeid, mis võivad (või ei pruugi) olla seotud lahendatava probleemiga.

Järgmisena võrdleb ta erinevaid ärinäitajaid omavahel, püüdes tuvastada varjatud seoseid; oskab andmeid lähemalt, detailsemalt vaadelda, näiteks aja, piirkonna või kliendi järgi komponentideks jaotada või, vastupidi, teabe esitamist veelgi üldistada, et eemaldada segavad üksikasjad. Pärast seda konstrueeritakse statistilise hindamise ja simulatsiooni mooduli abil sündmuste arendamiseks mitu võimalust, mille hulgast valitakse välja sobivaim.

Riis. 6.15.

Ettevõtte juhil võib näiteks olla hüpotees, et varade kasvu levik ettevõtte erinevates harudes sõltub tehnika- ja majandusharidusega spetsialistide suhtarvust neis. Selle hüpoteesi kontrollimiseks saab juhataja laost küsida ja graafikul kuvada intressimäära nende filiaalide kohta, mille varade kasv käesolevas kvartalis vähenes eelmise aastaga võrreldes üle 10% ja nende filiaalide puhul, mis kasvasid rohkem kui 25%. Ta peaks saama kasutada lihtsat valikut pakutavast menüüst. Kui saadud tulemused jagunevad oluliselt kahte vastavasse rühma, peaks see saama stiimuliks püstitatud hüpoteesi edasiseks kontrollimiseks.

Praegu on kiire arengu saanud suund nimega dynamic modeling (Dynamic Simulation), mis rakendab täielikult ülalmainitud FASMI põhimõtet.

Dünaamilise modelleerimise abil koostab analüütik teatud stsenaariumi järgi aja jooksul kujuneva äriolukorra mudeli. Lisaks võib sellise modelleerimise tulemuseks olla mitu uut ärisituatsiooni, mis loob võimalike lahenduste puu koos hinnanguga igaühe tõenäosuse ja väljavaadete kohta.

Riis. 6.16. Analüütiline IS andmete hankimiseks, töötlemiseks ja teabe esitamiseks

Tabelis 6.3 on toodud staatilise ja dünaamilise analüüsi võrdlevad omadused.

OLAP-mehhanism on tänapäeval üks populaarsemaid andmeanalüüsi meetodeid. Selle probleemi lahendamiseks on kaks peamist lähenemisviisi. Neist esimest nimetatakse mitmemõõtmeliseks OLAP-iks (MOLAP) - mehhanismi juurutamine serveri poolel mitmemõõtmelise andmebaasi abil ja teist Relatsiooniline OLAP (ROLAP) - kuubikute ehitamine SQL-päringute põhjal relatsioonilisele DBMS-ile. Igal neist lähenemisviisidest on oma plussid ja miinused. Nende võrdlev analüüs ei kuulu käesoleva artikli ulatusse. Kirjeldame oma töölaua ROLAP-mooduli tuuma rakendamist.

See ülesanne tekkis pärast Borland Delphis sisalduvate Decision Cube'i komponentide baasil ehitatud ROLAP-süsteemi kasutamist. Kahjuks näitas selle komponentide komplekti kasutamine suurte andmemahtude puhul halba jõudlust. Seda probleemi saab leevendada, kui proovite enne kuubikuteks söötmist võimalikult palju andmeid välja lõigata. Kuid sellest ei piisa alati.

Internetist ja ajakirjandusest leiab OLAP-süsteemide kohta palju infot, kuid peaaegu mitte kuskil pole öeldud, kuidas see sees töötab. Seetõttu saime enamiku probleemide lahenduse katse-eksituse meetodil.

Töö skeem

Töölaua OLAP-süsteemi üldise tööskeemi saab esitada järgmiselt:

Tööalgoritm on järgmine:

  1. Andmete vastuvõtmine lameda tabeli kujul või SQL-päringu täitmise tulemusel.
  2. Andmete vahemällu salvestamine ja nende teisendamine mitmemõõtmeliseks kuubikuks.
  3. Konstrueeritud kuubi kuvamine risttabeli või diagrammi vms abil. Üldiselt saab ühe kuubiga ühendada suvalise arvu vaateid.

Mõelgem, kuidas saab sellist süsteemi sisemiselt korraldada. Alustame nähtavalt ja katsutavast küljest, st kuvaritest.

OLAP-süsteemides kasutatavad kuvad on enamasti kahte tüüpi: ristkaardid ja diagrammid. Vaatame risttabelit, mis on põhiline ja kõige levinum viis kuubi kuvamiseks.

Ristlaud

Alloleval joonisel on koondatud tulemusi sisaldavad read ja veerud näidatud kollasena, fakte sisaldavad lahtrid on helehallid ja mõõtmete andmeid sisaldavad lahtrid on tumehallid.

Seega saab tabeli jagada järgmisteks elementideks, millega edaspidi töötame:

Maatriksi täitmisel faktidega peame toimima järgmiselt:

  • Mõõtmisandmete põhjal määrake maatriksis lisatava elemendi koordinaadid.
  • Määrake summade veergude ja ridade koordinaadid, mida lisatud element mõjutab.
  • Lisage maatriksile element ja vastavad veergude ja ridade kogusumma.

Tuleb märkida, et saadud maatriks on väga hõre, mistõttu selle korraldamine kahemõõtmelise massiivi kujul (pinnal asuv valik) pole mitte ainult irratsionaalne, vaid suure tõenäosusega ka võimatu. selle maatriksi dimensioon, mille salvestamiseks ei piisa RAM-ist. Näiteks kui meie kuup sisaldab teavet ühe aasta müügi kohta ja sellel on ainult 3 dimensiooni - Kliendid (250), Tooted (500) ja Kuupäev (365), siis saame järgmiste mõõtmetega faktimaatriksi:

Elementide arv = 250 x 500 x 365 = 45 625 000

Ja seda hoolimata asjaolust, et maatriksis võib olla vaid paar tuhat täidetud elementi. Veelgi enam, mida suurem on mõõtmete arv, seda hõredam on maatriks.

Seetõttu peate selle maatriksiga töötamiseks kasutama spetsiaalseid mehhanisme hõredate maatriksitega töötamiseks. Hõreda maatriksi korraldamiseks on võimalikud erinevad võimalused. Programmeerimiskirjanduses on need üsna hästi kirjeldatud, näiteks Donald Knuthi klassikalise raamatu "The Art of Programming" esimeses köites.

Mõelgem nüüd, kuidas saame määrata fakti koordinaate, teades sellele vastavaid mõõtmeid. Selleks vaatame lähemalt päise struktuuri:

Sel juhul leiate hõlpsalt viisi, kuidas määrata vastava lahtri numbrid ja summad, millesse see langeb. Siin võib välja pakkuda mitu lähenemisviisi. Üks neist on sobivate lahtrite leidmiseks puu abil. Selle puu saab konstrueerida valikut läbides. Lisaks saab vajaliku koordinaadi arvutamiseks hõlpsasti määratleda analüütilise kordumise valemi.

Andmete ettevalmistamine

Tabelis salvestatud andmed tuleb kasutamiseks teisendada. Seega on hüperkuubi ehitamisel jõudluse parandamiseks soovitav leida unikaalsed elemendid, mis on salvestatud veergudesse, mis on kuubi mõõtmed. Lisaks saate samade dimensiooniväärtustega kirjete jaoks teha esialgse faktide koondamise. Nagu eespool mainitud, on mõõtmisväljadel saadaolevad unikaalsed väärtused meie jaoks olulised. Seejärel saab nende säilitamiseks välja pakkuda järgmise struktuuri:

Seda struktuuri kasutades vähendame oluliselt mäluvajadust. Mis on üsna asjakohane, sest... Töökiiruse suurendamiseks on soovitatav salvestada andmed RAM-i. Lisaks saate salvestada ainult elementide massiivi ja nende väärtused kettale kustutada, kuna vajame neid ainult ristvahekaardi kuvamisel.

CubeBase'i komponenditeek

Ülalkirjeldatud ideed olid aluseks CubeBase'i komponentide teegi loomisel.

TCubeSource teostab andmete vahemällu salvestamist ja sisevormingusse teisendamist, samuti andmete esialgset koondamist. Komponent TCubeEngine teeb hüperkuubi arvutusi ja sellega tehteid. Tegelikult on see OLAP-mootor, mis muudab lameda tabeli mitmemõõtmeliseks andmekogumiks. Komponent TCubeGrid kuvab ristvahekaardi ja juhib hüperkuubi kuvamist. TCubeChart võimaldab näha hüperkuubi graafikute kujul ja komponenti TCubePivote juhib kuubiku südamiku tööd.

Toimivuse võrdlus

See komponentide komplekt näitas palju paremat jõudlust kui Decision Cube. Seega kulus 45 tuhande kirjega komplekti otsustuskuubiku komponentidele 8 minutit. pöördetabeli ehitamiseks. CubeBase laadis andmed 7 sekundiga. ja pöördetabeli koostamine 4 sekundiga. 700 tuhande otsusekuubiku kirjega testimisel ei saanud me 30 minuti jooksul vastust, misjärel tühistasime ülesande. CubeBase laadis andmed 45 sekundiga. ja kuubiku ehitamine 15 sekundiga.

Tuhandete kirjete andmemahtude puhul töötles CubeBase kümneid kordi kiiremini kui Decision Cube. Sadade tuhandete rekorditega laudadel – sadu kordi kiiremini. Ja kõrge jõudlus on OLAP-süsteemide üks olulisemaid näitajaid.

1993. aastal avaldas andmebaasi ehitamise relatsioonilise lähenemise rajaja Edgar Codd ja tema partnerid (matemaatik ja IBM-i teadur Edgar Codd) Arbor Software'i (tänapäeval kuulus firma Hyperion Solutions) algatatud artikli pealkirjaga "OLAP-i pakkumine. veebipõhine analüütiline töötlemine) analüütilistele kasutajatele", mis sõnastas OLAP-tehnoloogia 12 funktsiooni, mida hiljem täiendati veel kuue funktsiooniga. Nendest sätetest sai uue ja väga paljutõotava tehnoloogia põhisisu.

Tehnoloogia peamised omadused OLAP (põhiline):

  • andmete mitmemõõtmeline kontseptuaalne esitus;
  • intuitiivne andmete manipuleerimine;
  • andmete kättesaadavus ja üksikasjalikkus;
  • partii andmete väljavõtmine tõlgendamise vastu;
  • OLAP analüüsi mudelid;
  • klient-server arhitektuur (OLAP-ile juurdepääsetav töölaualt);
  • läbipaistvus (läbipaistev juurdepääs välisandmetele);
  • mitme kasutaja tugi.

Eriomadused(Eriline):

  • vormistamata andmete töötlemine;
  • OLAP-i tulemuste salvestamine: lähteandmetest eraldi salvestamine;
  • puuduvate väärtuste välistamine;
  • Puuduvate väärtuste käsitlemine.

Aruandluse omadused(Aruanne):

  • paindlikkus aruandluses;
  • standardne aruandlusjõudlus;
  • füüsilise andmete ekstraheerimise kihi automaatne konfigureerimine.

Mõõtmete juhtimine(Mõõdud):

  • mõõtmiste universaalsus;
  • piiramatu arv mõõtmeid ja koondamistase;
  • piiramatu arv toiminguid dimensioonide vahel.

Ajalooliselt tähendab mõiste "OLAP" tänapäeval mitte ainult lõppkasutaja andmete mitmemõõtmelist vaadet, vaid ka sihtandmebaasis olevate andmete mitmemõõtmelist vaadet. Just seetõttu on sõltumatute terminite tekkimine seotud "Suhteline OLAP"(ROLAP) ja "Mitmemõõtmeline OLAP"(MOLAP).

OLAP-teenus on tööriist suurte andmemahtude reaalajas analüüsimiseks. OLAP-süsteemiga suheldes on kasutajal võimalik paindlikult vaadata teavet, hankida suvalisi andmelõike ja teha analüütilisi toiminguid detailide täpsustamiseks, konvolutsiooniks, otsast lõpuni jaotamiseks ja ajas võrdlemiseks, kasutades samaaegselt palju parameetreid. Kogu töö OLAP-süsteemiga toimub ainevaldkonnas ja võimaldab teil luua statistiliselt usaldusväärseid äriolukorra mudeleid.

OLAP tarkvara - on operatiivandmete analüüsimise tööriist sisaldub hoidlas. Peamine omadus on see, et need tööriistad on mõeldud kasutamiseks mitte infotehnoloogia valdkonna spetsialistile, mitte ekspertstatistikule, vaid juhtimisvaldkonna professionaalile - osakonna, osakonna, juhtkonna ja juhtkonna juhile. , lõpuks režissöör. Tööriistad on mõeldud analüütikute suhtlemiseks probleemiga, mitte arvutiga. Joonisel fig. Joonis 6.14 näitab elementaarset OLAP-i kuupi, mis võimaldab hinnata andmeid kolmes dimensioonis.

Mitmemõõtmeline OLAP-kuubik ja vastavate matemaatiliste algoritmide süsteem statistiliseks töötlemiseks võimaldavad teil analüüsida mis tahes keerukusega andmeid igal ajaintervallil.


Riis. 6.14.

Kuna tema käsutuses on paindlikud mehhanismid andmete töötlemiseks ja visuaalseks kuvamiseks (joonis 6.15, joon. 6.16), uurib juht esmalt andmeid erinevate nurkade alt, mis võivad (või ei pruugi) olla seotud lahendatava probleemiga.

Järgmisena võrdleb ta erinevaid ärinäitajaid omavahel, püüdes tuvastada varjatud seoseid; oskab andmeid lähemalt, detailsemalt vaadelda, näiteks aja, piirkonna või kliendi järgi komponentideks jaotada või, vastupidi, teabe esitamist veelgi üldistada, et eemaldada segavad üksikasjad. Pärast seda mooduli abil statistiline hindamine ja simulatsioonimodelleerimine Konstrueeritakse mitu võimalust sündmuste arendamiseks ja nende hulgast valitakse kõige vastuvõetavam.


Riis. 6.15.

Ettevõtte juhil võib näiteks olla hüpotees, et varade kasvu levik ettevõtte erinevates harudes sõltub tehnika- ja majandusharidusega spetsialistide suhtarvust neis. Selle hüpoteesi kontrollimiseks saab juhataja laost küsida ja graafikul kuvada intressimäära nende filiaalide kohta, mille varade kasv käesolevas kvartalis vähenes eelmise aastaga võrreldes üle 10% ja nende filiaalide puhul, mis kasvasid rohkem kui 25%. Ta peaks saama kasutada lihtsat valikut pakutavast menüüst. Kui saadud tulemused jagunevad oluliselt kahte vastavasse rühma, peaks see saama stiimuliks püstitatud hüpoteesi edasiseks kontrollimiseks.

Praegu on suund nn dünaamiline modelleerimine(Dynamic Simulation), mis rakendab täielikult ülaltoodud FASMI põhimõtet.

Dünaamilise modelleerimise abil koostab analüütik teatud stsenaariumi järgi aja jooksul kujuneva äriolukorra mudeli. Lisaks võib sellise modelleerimise tulemuseks olla mitu uut ärisituatsiooni, mis loob võimalike lahenduste puu koos hinnanguga igaühe tõenäosuse ja väljavaadete kohta.


Riis. 6.16.

Tabelis 6.3 on toodud staatilise ja dünaamilise analüüsi võrdlevad omadused.

Tabel 6.3.
Iseloomulik Staatiline analüüs Dünaamiline analüüs
Küsimuste tüübid WHO? Mida? Kui palju? Kuidas? Millal? Kuhu? Miks nii? Mis juhtuks, kui...? Mis juhtub, kui…?
Reaktsiooniaeg Pole reguleeritud Sekundid
Tüüpilised andmeoperatsioonid Reguleeritud aruanne, diagramm, tabel, joonis Interaktiivsete aruannete, diagrammide, ekraanivormide järjestus. Dünaamiliselt muutuvad koondamistasemed ja andmelõiked
Analüütiliste nõuete tase Keskmine Kõrge
Ekraanivormide tüüp Põhimõtteliselt ettemääratud, reguleeritud Kasutaja määratletud, kohandatav
Andmete koondamise tase Üksikasjalik ja kokkuvõtlik Kasutaja määratletud
Andmete "vanus". Ajalooline ja praegune Ajalooline, praegune ja prognoositav
Taotluste tüübid Enamasti etteaimatav Ettearvamatu – juhtumist juhtumisse
Eesmärk Reguleeritud analüütiline töötlemine Mitmekäiguline analüüs, modelleerimine ja prognoosimine

Peaaegu alati on mitmemõõtmelise andmeanalüüsi jaoks mõeldud analüütilise süsteemi ülesehitamise ülesanne ühtne järjepidevalt toimiv infosüsteem, mis põhineb heterogeensel tarkvaral ja lahendustel. Ja IP juurutamise vahendite valik muutub äärmiselt keeruliseks ülesandeks. Siin tuleb arvesse võtta paljusid tegureid, sealhulgas erinevate omavahelist ühilduvust tarkvara komponendid, nende arendamise, kasutamise ja integreerimise lihtsus, tegevuse efektiivsus, stabiilsus ja ühtlased vormid, erinevate tootmisettevõtete vaheliste suhete tase ja võimalikud väljavaated.

OLAP on rakendatav kõikjal, kus on vaja mitme muutujaga andmeid analüüsida. Üldiselt, kui teil on andmetabel, millel on vähemalt üks kirjeldav veerg ja üks numbritega veerg, on OLAP-tööriist tõhus tööriist aruannete analüüsimiseks ja genereerimiseks. OLAP-tehnoloogia kasutamise näitena kaaluge müügiprotsessi tulemuste uuringut.

Põhiküsimused: "Kui palju müüdi?", "Mis summa eest müüdi?" laieneb, kui äri muutub keerukamaks ja ajaloolised andmed kogunevad teatud arvu tegurite või jaotiste kaupa: "..Peterburis, Moskvas, Uuralites, Siberis...", ".. viimases kvartalis, võrreldes praegune,” “ ..tarnijalt A võrreldes tarnijaga B...” jne.

Vastused sellistele küsimustele on vajalikud juhtimisotsuste tegemiseks: sortimendi, hindade, kaupluste, filiaalide sulgemise ja avamise, edasimüüjatega lepingute lõpetamise ja sõlmimise, reklaamikampaaniate läbiviimise või lõpetamise jms kohta.

Kui proovite ettevõtte äritegevust laiendada või optimeerida püüdes välja tuua peamised arvud (fakte) ja lõike (mõõtmisargumendid), millega analüütik manipuleerib, saate müügianalüüsiks sobiva tabeli, mis on omamoodi malliks, mis nõuab vastavaid korrigeerimisi. iga konkreetne ettevõte.

Aeg. Reeglina on need mitmed perioodid: aasta, kvartal, kuu, kümnend, nädal, päev. Paljud OLAP-i tööriistad arvutavad automaatselt kõrgeimad perioodid alates kuupäevast ja arvutavad nende jaoks kogusummad.

Tootekategooria. Kategooriaid võib olla mitu, need erinevad iga äritüübi puhul: sort, mudel, pakendi tüüp jne. Kui müüakse ainult ühte toodet või sortiment on väga väike, pole kategooriat vaja.

Toode. Mõnikord kasutatakse toote (või teenuse) nime, selle koodi või artiklinumbrit. Juhtudel, kui sortiment on väga suur (ja mõnel ettevõttel on hinnakirjas kümneid tuhandeid kaupu), ei pruugita kõikide kaubaliikide esmast analüüsi teha, vaid üldistada mõnele kokkulepitud kategooriale.

Piirkond. Sõltuvalt ettevõtte globaalsusest võite tähendada kontinenti, riikide rühma, riiki, territooriumi, linna, piirkonda, tänavat, tänava osa. Muidugi, kui on ainult üks väljalaskeava, siis see mõõde puudub.

Müügimees. See mõõtmine sõltub ka ettevõtte struktuurist ja ulatusest. See võib olla: filiaal, kauplus, edasimüüja, müügijuht. Mõnel juhul mõõtmine puudub, näiteks kui müüja müügimahtusid ei mõjuta, on ainult üks pood jne.

Ostja. Mõnel juhul, näiteks jaemüük, on ostja isikupäratu ja mõõtmist ei toimu, mõnel juhul on teave ostja kohta kättesaadav ja müügi jaoks oluline. See dimensioon võib sisaldada ostva ettevõtte nime või paljusid klientide rühmi ja tunnuseid: tööstusharu, ettevõtete grupp, omanik jne. Müügistruktuuri analüüs, et tuvastada huvipakkuva kontekstis kõige olulisemad komponendid. Selleks on mugav kasutada näiteks "Pie" tüüpi diagrammi keerulistel juhtudel, kui korraga uuritakse 3 mõõdet - "Veerud". Näiteks Arvutiseadmete kaupluses müüdi kvartali jooksul arvutiid 100 000 dollarini, fototehnikat 10 000 dollarini ja kulutarvikuid 4500 dollarini. Järeldus: poe käive sõltub suurel määral arvutite müügist (tegelikult on arvutite müügiks kulumaterjale ehk vaja, aga see on sisemiste sõltuvuste analüüs).

Dünaamika analüüs ( regressioonianalüüs– suundumuste tuvastamine). Trendide ja hooajaliste kõikumiste tuvastamine. Dünaamika kuvatakse selgelt "joon" tüüpi graafiku abil. Näiteks Inteli toodete müük langes aastaga, samas kui Microsofti müük kasvas. Võib-olla on paranenud tavakliendi heaolu või muutunud kaupluse kuvand ja koos sellega ka klientide koosseis. Sortimenti tuleb kohendada. Teine näide: 3 aasta jooksul väheneb videokaamerate müük talvel.

Sõltuvuste analüüs(korrelatsioonianalüüs). Erinevate toodete müügimahtude võrdlus aja jooksul, et tuvastada vajalik sortiment – ​​“korv”. Selleks on mugav kasutada ka “Joon” diagrammi. Näiteks kui esimese kahe kuu jooksul printerid valikust eemaldati, leiti, et pulbrikassettide müük langes.

Hiljuti avaldatud artiklite sarjas “Sissejuhatus andmebaasidesse” (vt ComputerPress nr 3'2000 - 3'2001) käsitlesime erinevaid tehnoloogiaid ja tarkvara, mida kasutatakse infosüsteemide loomisel – töölaua ja serveri DBMS-id, andmekujundustööriistad, rakenduste arendus. tööriistad, aga ka Business Intelligence – ettevõtte mastaabis andmeanalüüsi ja -töötluse tööriistad, mis on hetkel muutumas maailmas, sealhulgas ka meil, üha populaarsemaks. Märgime aga, et kodumaises kirjanduses ei ole veel piisavalt käsitletud Business Intelligence'i tööriistade kasutamise küsimusi ja selle klassi rakenduste loomiseks kasutatavaid tehnoloogiaid. Uues artiklite sarjas püüame seda tühimikku täita ja rääkida selliste rakenduste aluseks olevatest tehnoloogiatest. Rakendusnäidetena kasutame peamiselt Microsoft OLAP tehnoloogiaid (peamiselt Microsoft SQL Server 2000 analüüsiteenuseid), kuid loodame, et suurem osa materjalist on kasulik ka teiste tööriistade kasutajatele.

Selle sarja esimene artikkel on pühendatud OLAP-i (On-Line Analytical Processing) – mitmemõõtmelise andmeanalüüsi tehnoloogia – põhitõdedele. Selles vaatleme andmehoidla ja OLAP-i mõisteid, nõudeid andmehoidlale ja OLAP-i tööriistadele, OLAP-i andmete loogilist korraldust ning põhimõisteid ja mõisteid, mida kasutatakse mitmemõõtmelise analüüsi käsitlemisel.

Mis on andmeladu

Ettevõtte mastaabis infosüsteemid sisaldavad reeglina rakendusi, mis on mõeldud andmete, nende dünaamika, suundumuste jms keerukaks mitmemõõtmeliseks analüüsiks. Selline analüüs on lõppkokkuvõttes mõeldud otsuste tegemise toetamiseks. Neid süsteeme nimetatakse sageli otsustustoetussüsteemideks.

Ilma vajaliku, tavaliselt kvantitatiivse teabeta, on võimatu teha ühtegi juhtimisotsust. See eeldab andmehoidlate loomist, st andmete kogumise, sõelumise ja eeltöötlemise protsessi, et edastada saadud teave kasutajatele statistiliseks analüüsiks (ja sageli ka analüütiliste aruannete koostamiseks).

Ralph Kimball, üks andmelao kontseptsiooni algatajaid, kirjeldas andmeladu kui "kohta, kus inimesed saavad oma andmetele juurde pääseda" (vt nt Ralph Kimball, "The Data Warehouse Toolkit: Practical Techniques for Building Dimensions Data Warehouses" ", John Wiley & Sons, 1996 ja "The Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse", John Wiley & Sons, 2000). Samuti sõnastas ta andmeladudele esitatavad põhinõuded:

  • salvestusruumist andmete kiire otsimise tugi;
  • andmete sisemise järjepidevuse säilitamine;
  • nn andmelõikude (slice and dice) hankimise ja võrdlemise oskus;
  • mugavate utiliitide olemasolu andmete vaatamiseks salvestusruumis;
  • salvestatud andmete täielikkus ja usaldusväärsus;
  • kvaliteetse andmete täiendamise protsessi tugi.

Sageli ei ole võimalik kõiki ülaltoodud nõudeid sama toote raames täita. Seetõttu kasutatakse andmeladude juurutamiseks reeglina mitmeid tooteid, millest osad on tegelikud andmete salvestamise tööriistad, teised on tööriistad nende otsimiseks ja vaatamiseks, teised on tööriistad nende täiendamiseks jne.

Tüüpiline andmeladu erineb tavaliselt tüüpilisest relatsiooniandmebaasist. Esiteks on tavalised andmebaasid loodud selleks, et aidata kasutajatel igapäevast tööd teha, andmelaod aga otsuste tegemiseks. Näiteks kaupade müük ja arvete väljastamine toimub tehingute töötlemiseks mõeldud andmebaasi abil ning mitme aasta müügidünaamika analüüs, mis võimaldab planeerida tööd tarnijatega, toimub andmelao abil.

Teiseks, kui traditsioonilised andmebaasid on kasutajate töö käigus pidevas muutumises, siis andmeladu on suhteliselt stabiilne: seal olevaid andmeid uuendatakse tavaliselt graafiku alusel (olenevalt vajadusest näiteks kord nädalas, päevas või tunnis). Ideaalis on rikastamisprotsess lihtsalt uute andmete lisamine teatud aja jooksul, muutmata poes juba olemasolevat teavet.

Ja kolmandaks on lattu sattuvate andmete allikaks enamasti tavalised andmebaasid. Lisaks saab hoidlat täiendada välistest allikatest, näiteks statistilistest aruannetest.

Mis on OLAP

Otsuste tugisüsteemidel on tavaliselt vahendid, et anda kasutajale koondandmed erinevate proovide kohta algsest komplektist tajumiseks ja analüüsimiseks mugaval kujul. Tavaliselt moodustavad sellised koondfunktsioonid mitmemõõtmelise (ja seetõttu mitterelatsioonilise) andmekogumi (mida sageli nimetatakse hüperkuubiks või metakuubiks), mille teljed sisaldavad parameetreid ja mille lahtrid sisaldavad neist sõltuvaid koondandmeid. Mööda iga telge saab andmeid korraldada hierarhiasse, mis esindab erinevaid detailsuse tasemeid. Tänu sellele andmemudelile saavad kasutajad koostada keerulisi päringuid, genereerida aruandeid ja hankida andmete alamhulki.

Kompleksse mitmemõõtmelise andmeanalüüsi tehnoloogiat nimetatakse OLAP-iks (On-Line Analytical Processing). OLAP on andmehoidla põhikomponent. OLAP-i kontseptsiooni kirjeldas 1993. aastal Edgar Codd, tuntud andmebaaside uurija ja relatsiooniandmete mudeli autor (vt E.F. Codd, S.B. Codd ja C.T. Salley, Providing OLAP (on-line analytical processing) kasutajaanalüütikutele: An). IT mandaat Tehniline aruanne, 1993). 1995. aastal koostati Coddi kehtestatud nõuete alusel nn FASMI test (Fast Analysis of Shared Multidimensional Information), mis sisaldab järgmisi nõudeid mitmemõõtmelise analüüsi rakendustele:

  • kasutajale analüüsitulemuste esitamine vastuvõetava aja jooksul (tavaliselt mitte rohkem kui 5 s) isegi vähem üksikasjaliku analüüsi hinnaga;
  • võimalus teostada mis tahes antud rakendusele omast loogilist ja statistilist analüüsi ning salvestada see lõppkasutajale kättesaadaval kujul;
  • mitme kasutaja juurdepääs andmetele koos sobivate lukustusmehhanismide ja volitatud juurdepääsuvahendite toega;
  • andmete mitmemõõtmeline kontseptuaalne esitus, sealhulgas hierarhiate ja mitmete hierarhiate täielik tugi (see on OLAP-i põhinõue);
  • võimalus pääseda juurde mis tahes vajalikule teabele, olenemata selle mahust ja salvestuskohast.

Tuleb märkida, et OLAP-i funktsionaalsust saab realiseerida mitmel viisil, alustades kõige lihtsamatest andmeanalüüsi tööriistadest kontorirakendustes kuni serveritoodetel põhinevate hajutatud analüütiliste süsteemideni. Kuid enne kui räägime selle funktsionaalsuse erinevatest rakendustest, vaatame loogilisest vaatenurgast, mis on OLAP-kuubikud.

Mitmemõõtmelised kuubikud

Selles jaotises vaatleme lähemalt OLAP-i ja mitmemõõtmeliste kuubikute kontseptsiooni. Näitena relatsiooniandmebaasist, mida kasutame OLAP-i põhimõtete illustreerimiseks, kasutame Northwindi andmebaasi, mis on kaasas Microsoft SQL Serveri või Microsoft Accessiga ja on tüüpiline andmebaas, mis salvestab toidu hulgimüügiettevõtte kauplemisteavet. Sellised andmed hõlmavad teavet tarnijate, klientide, tarneettevõtete kohta, tarnitud kaupade ja nende kategooriate loendit, andmeid tellimuste ja tellitud kaupade kohta, ettevõtte töötajate nimekirja. Põhjaliku Northwindi andmebaasi kirjelduse leiab Microsoft SQL Serveri või Microsoft Accessi abisüsteemidest – ruumipuudusel me seda siin ei paku.

OLAP-i kontseptsiooni uurimiseks kasutame vaadet Arved ning Northwindi andmebaasi toodete ja kategooriate tabeleid, et luua päring, mille tulemuseks on üksikasjalik teave kõigi tellitud kaupade ja väljastatud arvete kohta:

SELECT dbo.Arved.Riik, dbo.Arved.Linn, dbo.Arved.Kliendinimi, dbo.Arved.Müügimees, dbo.Arved.Tellimiskuupäev, dbo.Kategooriad.KategooriaNimi, dbo.Arved.Tootenimi, dbo.Inppervoices. dbo.Inppervoices. .Invoices.ExtendedPrice FROM dbo.Products INNER JOIN dbo.Categories ON dbo.Products.CategoryID = dbo.Categories.CategoryID SISEMINE JOIN dbo.Arved ON dbo.Products.ProductID = dbo.TooteID.

Programmis Access 2000 näeb sarnane päring välja järgmine:

Valige Incoices.country, Incoices.city, inkoodid.customers.companyname kui kohandatudName, Incoices.salesperson, Incoices.Orderdate, kategooriad.categoryName, Invoess.productName, InkEice.shippers.Shippers.comPanyName kui ShipperName, Incoexted, InterPrice, InterPrice, InterNacs voices INNER JOIN Products ON Invoices.ProductID = Products.ProductID) ON Categories.CategoryID = Products.CategoryID;

See päring avab vaate Arved, mis sisaldab teavet kõigi väljastatud arvete kohta, samuti tabeleid Kategooriad ja Tooted, mis sisaldavad teavet vastavalt tellitud tootekategooriate ja toodete endi kohta. Selle päringu tulemuseks on tellimuse andmete kogum, mis sisaldab tellitud kauba kategooriat ja nime, tellimuse esitamise kuupäeva, arveldava isiku nime, tellinud ettevõtte linna, riiki ja ettevõtte nime, samuti laevafirma nimena.

Mugavuse huvides salvestame selle päringu vaatena, nimetades selle Arved1. Selle esituse juurdepääsu tulemus on näidatud joonisel fig. 1 .

Milliseid koondandmeid saame sellest vaatest saada? Tavaliselt on need vastused järgmistele küsimustele:

  • Kui suur on Prantsusmaalt pärit klientide tellimuste koguväärtus?
  • Kui suur on Prantsusmaal asuvate klientide poolt Speedy Expressi tarnitud tellimuste koguväärtus?
  • Kui suur on 1997. aastal Prantsusmaal asuvate klientide poolt Speedy Expressi tarnitud tellimuste koguväärtus?

Tõlgime need küsimused SQL-i päringuteks (tabel 1).

Mis tahes ülaltoodud päringu tulemus on arv. Kui asendate esimeses päringus parameetri "Prantsusmaa" parameetriga "Austria" või mõne muu riigi nimega, saate selle päringu uuesti käivitada ja saada teistsuguse numbri. Tehes seda protseduuri kõigi riikidega, saame järgmise andmekogumi (fragment on näidatud allpool):

Riik SUM (laiendatud hind)
Argentina 7327.3
Austria 110788.4
Belgia 28491.65
Brasiilia 97407.74
Kanada 46190.1
Taani 28392.32
Soome 15296.35
Prantsusmaa 69185.48
Saksamaa 209373.6

Saadud koondväärtuste komplekti (antud juhul summasid) saab tõlgendada ühemõõtmelise andmekogumina. Sama andmestiku võib saada ka järgmise vormiga GROUP BY klausliga päringu tulemusel:

VALI riik, SUM (Laiendatud hind) FROM arvetest1 GROUP BY BY

Vaatame nüüd teist ülaltoodud päringut, mis sisaldab WHERE-klauslis kahte tingimust. Kui käivitame selle päringu, ühendades parameetrite Country ja ShipperName kõik võimalikud väärtused, saame kahemõõtmelise andmestiku, mis näeb välja selline (lõik on näidatud allpool):

SaatjaNimi
Riik Föderaalne laevandus Kiire ekspress Ühendatud pakett
Argentina 1 210.30 1 816.20 5 092.60
Austria 40 870.77 41 004.13 46 128.93
Belgia 11 393.30 4 717.56 17 713.99
Brasiilia 16 514.56 35 398.14 55 013.08
Kanada 19 598.78 5 440.42 25 157.08
Taani 18 295.30 6 573.97 7 791.74
Soome 4 889.84 5 966.21 7 954.00
Prantsusmaa 28 737.23 21 140.18 31 480.90
Saksamaa 53 474.88 94 847.12 81 962.58

Sellist andmekogumit nimetatakse pivot-tabeliks või risttabeliks. Paljud arvutustabelid ja töölaua DBMS-id võimaldavad teil selliseid tabeleid luua – alates Paradox for DOS-ist kuni Microsoft Excel 2000-ni. Näiteks näeb sarnane päring välja Microsoft Access 2000-s:

TRANSFORM Sum(Invoices1.ExtendedPrice) AS SumOfExtendedPrice SELECT Arved1.Riik FROM Invoices1 GROUP BY Arved1.Riik PIVOT-arved1.SaatjaNimi;

Sellise liigendtabeli koondandmeid saab hankida ka tavalise GROUP BY päringu abil:

SELECT Riik,SaatjaNimi, SUM (laiendatud hind) FROM arvetest1 GROUP BY COUNTRY,ShipperName Pange tähele, et selle päringu tulemuseks ei ole liigendtabel ise, vaid ainult selle koostamise koondandmete kogum (fragment on näidatud allpool ):

Riik SaatjaNimi SUM (laiendatud hind)
Argentina Föderaalne laevandus 845.5
Austria Föderaalne laevandus 35696.78
Belgia Föderaalne laevandus 8747.3
Brasiilia Föderaalne laevandus 13998.26

Kolmandal eelpool käsitletud päringutest on juba kolm parameetrit tingimuses WHERE. Neid varieerides saame kolmemõõtmelise andmestiku (joonis 2).

Joonisel fig 1 näidatud kuubi rakud. 2 sisaldavad koondandmeid, mis vastavad kuubi telgedel asuva WHERE-klausli päringuparameetrite väärtustele.

Kahemõõtmeliste tabelite komplekti saate, kui lõigate kuubiku, mille tasapinnad on paralleelsed selle külgedega (nende tähistamiseks kasutatakse mõisteid ristlõiked ja viilud).

Ilmselgelt saab kuubiku lahtrites olevaid andmeid hankida ka vastava päringu abil koos klausliga GROUP BY. Lisaks võimaldavad mõned arvutustabelid (eriti Microsoft Excel 2000) teil joonistada kolmemõõtmelise andmestiku ja kuvada kuubi erinevaid ristlõikeid paralleelselt selle esiküljega, nagu on näidatud töövihiku lehel.

Kui WHERE-klausel sisaldab nelja või enamat parameetrit, võib tulemuseks olev väärtuste komplekt (nimetatakse ka OLAP-i kuubiks) olla 4-mõõtmeline, 5-mõõtmeline jne.

Olles vaadanud, mis on mitmemõõtmelised OLAP-kuubikud, liigume edasi mõne mitmemõõtmelises andmeanalüüsis kasutatavate võtmeterminite ja kontseptsioonide juurde.

Mõned terminid ja mõisted

Lisaks summadele võivad OLAP-i kuubi lahtrid sisaldada ka muude SQL-keele koondfunktsioonide (nt MIN, MAX, AVG, COUNT) ja mõnel juhul ka teiste (dispersioon, standardhälve jne) täitmise tulemusi. Lahtrites olevate andmeväärtuste kirjeldamiseks kasutatakse terminit kokkuvõte (üldiselt võib neid ühes kuubis olla mitu), mõistet mõõt kasutatakse lähteandmete tähistamiseks, mille alusel need arvutatakse, ja terminit dimensioon kasutatakse päringu parameetrite tähistamiseks (vene keelde tõlgituna nimetatakse seda OLAP-kuubikutest rääkides tavaliselt "dimensiooniks" ja andmeladudest rääkides "dimensiooniks"). Telgedele joonistatud väärtusi nimetatakse mõõtmete osadeks.

Mõõtmistest rääkides tasub mainida, et telgedele joonistatud väärtused võivad olla erineva detailsusastmega. Näiteks võib meid huvitada eri riikide klientide tehtud tellimuste koguväärtus või linnaväliste klientide või isegi üksikklientide tellimuste koguväärtus. Loomulikult on teisel ja kolmandal juhul saadud koondandmete kogum üksikasjalikum kui esimesel. Pange tähele, et erineva detailsusastmega koondandmete hankimise võimalus vastab ühele andmeladude nõudele – erinevate andmelõikude kättesaadavuse nõudele võrdlemiseks ja analüüsimiseks.

Kuna vaadeldavas näites võib üldiselt igal riigil olla mitu linna ja linnal mitu klienti, siis saame rääkida väärtuste hierarhiatest dimensioonides. Sel juhul asuvad riigid hierarhia esimesel tasemel, linnad teisel ja kliendid kolmandal (joonis 3).

Pange tähele, et hierarhiaid saab tasakaalustada, nagu näiteks joonisel fig. 3, samuti hierarhiad, mis põhinevad kuupäeval-kellaajal ja tasakaalustamata andmetel. Tüüpiline tasakaalustamata hierarhia näide on "ülem-alluv" hierarhia (selle saab üles ehitada näiteks ülalkirjeldatud näite algse andmekogumi välja Müügiesindaja väärtuste abil), mis on näidatud joonisel fig. 4 .

Mõnikord kasutatakse selliste hierarhiate kohta terminit Vanem-laps hierarhia.

Samuti on hierarhiaid, mis asuvad tasakaalus ja tasakaalustamata vahel (neid tähistatakse terminiga räsitud). Tavaliselt sisaldavad need liikmeid, kelle loogilised "vanemad" ei ole vahetult kõrgemal tasemel (näiteks geograafilise hierarhia tasemed on Riik, Linn ja Osariik, kuid andmekogumis on riike, mille riigi ja riigi vahel ei ole riike ega piirkondi. Linnatasandid; joonis 5).

Pange tähele, et kõik OLAP-i tööriistad ei toeta tasakaalustamata ja ebaühtlast hierarhiat. Näiteks Microsoft Analysis Services 2000 toetab mõlemat tüüpi hierarhiat, kuid Microsoft OLAP Services 7.0 toetab ainult tasakaalustatud. Hierarhiatasemete arv, ühe taseme maksimaalne lubatud liikmete arv ja maksimaalne võimalik dimensioonide arv võivad erinevates OLAP-i tööriistades olla erinevad.

Järeldus

Selles artiklis õppisime OLAP-i põhitõdesid. Õppisime järgmist:

  • Andmeladude eesmärk on pakkuda kasutajatele teavet statistilise analüüsi ja juhtimisotsuste tegemiseks.
  • Andmelaod peavad tagama nii suure andmeotsingu kiiruse, nn andmelõikude hankimise ja võrdlemise võimaluse kui ka andmete järjepidevuse, täielikkuse ja usaldusväärsuse.
  • OLAP (On-Line Analytical Processing) on ​​andmeladude loomise ja kasutamise põhikomponent. See tehnoloogia põhineb mitmemõõtmeliste andmehulkade - OLAP-kuubikute - ehitamisel, mille teljed sisaldavad parameetreid ja lahtrid sisaldavad neist sõltuvaid koondandmeid.
  • OLAP-i funktsionaalsusega rakendused peavad andma kasutajale vastuvõetava aja jooksul analüüsitulemused, tegema loogilist ja statistilist analüüsi, toetama mitme kasutaja juurdepääsu andmetele, pakkuma andmete mitmemõõtmelist kontseptuaalset esitust ja saama juurdepääsu kogu vajalikule teabele.

Lisaks vaatasime üle OLAP-kuubikute loogilise organiseerimise põhiprintsiibid ning õppisime ka mitmemõõtmelises analüüsis kasutatavaid põhitermineid ja mõisteid. Lõpuks saime teada, millised on erinevat tüüpi hierarhiad OLAP-i kuubikimensioonides.

Selle sarja järgmises artiklis vaatleme andmeladude tüüpilist ülesehitust, räägime sellest, mis on kliendi ja serveri OLAP, ning keskendume ka mitmemõõtmelise andmesalvestuse mõnele tehnilisele aspektile.

ComputerPress 4"2001

Interneti-analüütiline töötlemine ehk OLAP on tõhus andmetöötlustehnoloogia, mis toodab kokkuvõtlikku teavet, mis põhineb tohutul hulgal igasugustel andmetel. See on võimas toode, mis aitab teil arvutis olevale teabele juurde pääseda, seda hankida ja vaadata, analüüsides seda erinevatest vaatenurkadest.

OLAP on tööriist, mis pakub strateegilist positsiooni pikaajaliseks planeerimiseks ja vaatleb tegevusandmete aluseks olevat teavet 5, 10 või enama aasta tuleviku kohta. Andmed salvestatakse andmebaasi dimensiooniga, mis on selle atribuut. Kasutajad saavad vaadata sama andmekogumit erinevate atribuutidega, olenevalt analüüsi eesmärgist.

OLAP-i ajalugu

OLAP ei ole uus kontseptsioon ja seda on kasutatud aastakümneid. Tegelikult võib tehnoloogia algust otsida 1962. aastast. Kuid selle termini võttis kasutusele alles 1993. aastal andmebaasi autor Ted Coddom, kes kehtestas tootele ka 12 reeglit. Nagu paljude teiste rakenduste puhul, on kontseptsioon läbinud mitu arenguetappi.

OLAP-tehnoloogia enda ajalugu ulatub aastasse 1970, mil ilmusid Expressi inforessursid ja esimene Olapi server. Oracle omandas need 1995. aastal ja hiljem sai neist mitmemõõtmelise arvutimootori veebipõhise analüütilise töötlemise alus, mille kuulus arvutibränd oma andmebaasis esitas. 1992. aastal andis Arbor Software välja teise tuntud veebianalüütika töötlemise toote Essbase (Oracle omandas selle 2007. aastal).

1998. aastal andis Microsoft välja veebipõhise analüütilise andmetöötlusserveri MS Analysis Services. See aitas kaasa tehnoloogia populaarsusele ja ajendas välja töötama teisi tooteid. Tänapäeval pakuvad Olapi rakendusi mitmed maailmakuulsad müüjad, sealhulgas IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.

Online analüütiline töötlemine

OLAP on tööriist, mis võimaldab teha otsuseid planeeritud sündmuste kohta. Ebatüüpiline Olapi arvutus võib olla keerulisem kui lihtsalt andmete koondamine. Analüütilisi päringuid minutis (AQM) kasutatakse standardse võrdlusalusena erinevate tööriistade jõudluse võrdlemiseks. Need süsteemid peaksid kaitsma kasutajaid keeruka päringu süntaksi eest nii palju kui võimalik ja pakkuma kõigile ühtlast reageerimisaega (ükskõik kui keerukas).

OLAP-il on järgmised peamised omadused:

  1. Mitmemõõtmelised andmete esitused.
  2. Toetab keerulisi arvutusi.
  3. Ajutine luure.

Mitmemõõtmeline vaade loob aluse analüütiliseks töötlemiseks tänu paindlikule juurdepääsule ettevõtte andmetele. See võimaldab kasutajatel analüüsida andmeid mis tahes dimensioonis ja mis tahes koondamistasandil.

OLAP-tarkvara tuum on keeruliste arvutuste tugi.

Ajaanalüüsi kasutatakse mis tahes analüütikarakenduse toimivuse hindamiseks teatud aja jooksul. Näiteks see kuu võrreldes eelmise kuuga, see kuu võrreldes eelmise aasta sama kuuga.

Mitmemõõtmeline andmestruktuur

Interneti-analüütilise töötlemise üks peamisi omadusi on andmete mitmemõõtmeline struktuur. Kuubil võib olla mitu mõõdet. Tänu sellele mudelile on kogu OLAP-i kaevandamise protsess juhtide ja juhtide jaoks lihtne, kuna lahtrites kujutatud objektid on reaalse maailma äriobjektid. Lisaks võimaldab see andmemudel kasutajatel töödelda mitte ainult struktureeritud massiive, vaid ka struktureerimata ja poolstruktureeritud massiive. Kõik see muudab need eriti populaarseks andmeanalüüsi ja BI rakenduste jaoks.

OLAP-süsteemide peamised omadused:

  1. Kasutage mitmemõõtmelise andmeanalüüsi meetodeid.
  2. Pakkuge täiustatud andmebaasi tuge.
  3. Looge hõlpsasti kasutatavaid lõppkasutajaliideseid.
  4. Toetab kliendi/serveri arhitektuuri.

Üks OLAP-i kontseptsioonide põhikomponente on kliendipoolne server. Lisaks relatsiooniandmebaasist pärit andmete koondamisele ja eeltöötlemisele pakub see täpsemaid arvutus- ja salvestamisvalikuid, lisafunktsioone, põhilisi täiustatud päringuvõimalusi ja muid funktsioone.

Olenevalt valitud rakenduse näitest on saadaval mitmesuguseid andmemudeleid ja tööriistu, sealhulgas reaalajas hoiatus, mis juhtub, kui-stsenaariumid, optimeerimine ja keerukas OLAP-i aruandlus.

Kuubiku kuju

Kontseptsioon põhineb kuupkujul. Andmete paigutus näitab, kuidas OLAP järgib mitmemõõtmelise analüüsi põhimõtet, mille tulemuseks on andmestruktuur, mis on loodud kiireks ja tõhusaks analüüsiks.

OLAP-kuubikut nimetatakse ka "hüperkuubiks". Seda kirjeldatakse nii, et see koosneb arvulistest faktidest (mõõtudest), mis on liigitatud tahkudeks (mõõtmeteks). Dimensioonid viitavad atribuutidele, mis määratlevad äriprobleemi. Lihtsamalt öeldes on dimensioon silt, mis kirjeldab mõõdet. Näiteks müügiaruannetes oleks mõõdikuks müügimaht ja dimensioonid hõlmaksid müügiperioodi, müüjaid, toodet või teenust ja müügipiirkonda. Tootmistoimingute aruandluses võib mõõta kogu tootmiskulusid ja tootmisühikuid. Mõõtmed on tootmise kuupäev või kellaaeg, tootmise etapp või faas, isegi tootmisprotsessis osalevad töötajad.

OLAP-i andmekuubik on süsteemi nurgakivi. Kuubis olevad andmed on korraldatud kas tähe- või lumehelveskeemi abil. Keskel on faktitabel, mis sisaldab agregaate (mõõte). See on seotud mõõtmete tabelite seeriaga, mis sisaldab teavet meetmete kohta. Mõõtmed kirjeldavad, kuidas neid meetmeid saab analüüsida. Kui kuubis on rohkem kui kolm mõõdet, nimetatakse seda sageli hüperkuubiks.

Üks peamisi kuubi juurde kuuluvaid omadusi on selle staatiline olemus, mis tähendab, et kuubikut ei saa pärast selle väljatöötamist muuta. Seetõttu on kuubi kokkupanemise ja andmemudeli seadistamise protsess OLAP-i arhitektuuris sobiva andmetöötluse suunas kriitiline samm.

Andmete ühendamine

Agregaatide kasutamine on peamine põhjus, miks OLAP-i tööriistades päringuid töödeldakse palju kiiremini (võrreldes OLTP-ga). Agregaadid on andmete kokkuvõtted, mis on töötlemise käigus eelnevalt arvutatud. Kõik OLAP-i dimensioonitabelitesse salvestatud liikmed määravad päringud, mida kuubik saab vastu võtta.

Kuubis salvestatakse teabe akumulatsioonid lahtritesse, mille koordinaadid on määratud konkreetsete mõõtmetega. Agregaatide arv, mida kuubik võib sisaldada, sõltub kõigist võimalikest dimensiooniliikmete kombinatsioonidest. Seetõttu võib rakenduse tüüpiline kuubik sisaldada äärmiselt suurt hulka agregaate. Eelarvestus tehakse ainult peamiste koondnäitajate jaoks, mis on jaotatud kogu võrguanalüütika kuubis. See vähendab oluliselt aega, mis kulub andmemudelis päringu käitamisel mis tahes koondamiste määratlemiseks.

Samuti on koondamistega seotud kaks võimalust, mida saate kasutada oma valmis kuubi jõudluse parandamiseks: luua võime vahemälu koondamine ja kasutada kasutaja päringupõhist koondamist.

Toimimispõhimõte

Tavaliselt saab tehingutest saadud operatiivteabe analüüsi teha lihtsa tabeli abil (andmete väärtused esitatakse ridade ja veergudena). See on andmete kahemõõtmelisuse tõttu hea. OLAP-i puhul on erinevusi, mis on seotud mitmemõõtmelise andmemassiiviga. Kuna need pärinevad sageli erinevatest allikatest, ei saa arvutustabel neid alati tõhusalt töödelda.

Kuubik lahendab selle probleemi ning paneb ka OLAP-i andmelao loogiliselt ja korrapäraselt tööle. Ettevõtted koguvad andmeid paljudest allikatest ja on saadaval erinevates vormingutes, nagu tekstifailid, multimeediumifailid, Exceli arvutustabelid, Accessi andmebaasid ja isegi OLTP andmebaasid.

Kõik andmed kogutakse otse allikatest täidetud lattu. Selles puhastatakse OLTP-st ja muudest allikatest saadud töötlemata teave kõigist ekslikest, mittetäielikest ja ebajärjekindlatest tehingutest.

Pärast puhastamist ja teisendamist salvestatakse teave relatsiooniandmebaasi. Seejärel laaditakse see analüüsimiseks üles mitmemõõtmelisse OLAP-serverisse (või Olapi kuubi). Ärirakenduste, andmekaevanduse ja muude äritoimingute eest vastutavad lõppkasutajad saavad Olapi kuubist juurdepääsu teabele, mida nad vajavad.

Massiivimudeli eelised

OLAP on tööriist, mis pakub kiiret päringu jõudlust, mis saavutatakse optimeeritud salvestusruumi, mitmemõõtmelise indekseerimise ja vahemällu salvestamise kaudu, mis on süsteemi oluliste eeliste hulgas. Lisaks on eelised järgmised:

  1. Väiksem andmemaht kettal.
  2. Kõrgema taseme andmeagregaatide automatiseeritud arvutamine.
  3. Massiivimudelid pakuvad loomulikku indekseerimist.
  4. Tõhus andmete hankimine saavutatakse eelneva struktureerimisega.
  5. Kompaktsus madalamõõtmeliste andmekogumite jaoks.

OLAP-i miinusteks on asjaolu, et mõned otsused (töötlusetapid) võivad võtta üsna kaua aega, eriti suure infomahu korral. Tavaliselt parandatakse seda ainult järkjärgulise töötlemisega (õppides muutunud andmetest).

Põhilised analüütilised toimingud

Konvolutsioon(rull-up/drill-up) on tuntud ka kui "konsolideerimine". Ahendamine hõlmab kõigi saadavate andmete võtmist ja kõike ühes või mitmes dimensioonis arvutamist. Enamasti võib see nõuda matemaatilise valemi kasutamist. OLAP-i näitena võime vaadelda jaeketti, millel on müügipunktid erinevates linnades. Mustrite tuvastamiseks ja tulevaste müügitrendide ennetamiseks koondatakse kõigi asukohtade müügiandmed ettevõtte peamisse müügiosakonda konsolideerimiseks ja arvutamiseks.

Avalikustamine(puurimine). See on kokkurullimise vastand. Protsess algab suure andmekogumiga ja jagab selle seejärel väiksemateks osadeks, võimaldades kasutajatel vaadata üksikasju. Jaeketi näite puhul analüüsib analüütik müügiandmeid ja vaatab üksikuid kaubamärke või tooteid, mida peetakse enimmüüdud eri linnade igas müügipunktis.

jaotis(Viilu ja kuubikuteks). See on protsess, kus analüütilised toimingud hõlmavad kahte toimingut: OLAP-i kuubist konkreetse andmekogumi eraldamine (analüüsi "lõikamise" aspekt) ja selle vaatamine erinevatest vaatenurkadest või nurkade alt. See võib juhtuda siis, kui kõik müügikoha andmed on vastu võetud ja hüperkuubi sisestatud. Analüütik lõikab OLAP-kuubist välja müügiga seotud andmete kogumi. Järgmisena vaadatakse seda iga piirkonna üksikute üksuste müügi analüüsimisel. Selle aja jooksul saavad teised kasutajad keskenduda müügi tasuvuse või turundus- ja reklaamikampaania efektiivsuse hindamisele.

Pöörake(Pivot). See pöörab andmetelgesid, et pakkuda teabe asendusesitust.

Andmebaaside tüübid

Põhimõtteliselt on see tüüpiline OLAP-kuubik, mis rakendab mitmemõõtmeliste andmete analüütilist töötlemist OLAP-kuubi või mis tahes andmekuubi abil, et analüütiline protsess saaks vajadusel dimensioone lisada. Kogu mitmemõõtmelisse andmebaasi laaditud teave salvestatakse või arhiveeritakse ja seda saab vajadusel tagasi kutsuda.

Tähendus

Relatsiooniline OLAP (ROLAP)

ROLAP on täiustatud DBMS koos mitmemõõtmelise andmekaardistusega standardse relatsioonitoimingu tegemiseks

Mitmemõõtmeline OLAP (MOLAP)

MOLAP - rakendab tööd mitmemõõtmeliste andmetega

Hübriidne veebipõhine analüütiline töötlemine (HOLAP)

HOLAP-i lähenemisviisi korral salvestatakse koondsummad mitmemõõtmelisse andmebaasi ja üksikasjalik teave relatsiooniandmebaasi. See tagab nii ROLAP-mudeli tõhususe kui ka MOLAP-mudeli jõudluse

Töölaua OLAP (DOLAP)

Töölaua OLAP-is laadib kasutaja andmebaasist lokaalselt või oma töölauale andmeid alla ja analüüsib seda. DOLAP-i on suhteliselt odavam juurutada, kuna see pakub teiste OLAP-süsteemidega võrreldes väga vähe funktsioone

Veebi OLAP (WOLAP)

Veebi OLAP on OLAP-süsteem, millele pääseb ligi veebibrauseri kaudu. WOLAP on kolmetasandiline arhitektuur. See koosneb kolmest komponendist: klient, vahevara ja andmebaasiserver

Mobiilne OLAP

Mobiilne OLAP aitab kasutajatel oma mobiilseadmete abil OLAP-i andmetele juurde pääseda ja neid analüüsida

Ruumiline OLAP

SOLAP on loodud selleks, et hõlbustada nii ruumiliste kui ka mitteruumiliste andmete haldamist geograafilises teabesüsteemis (GIS)

On vähemtuntud OLAP-süsteeme või -tehnoloogiaid, kuid need on peamised, mida praegu kasutavad suurettevõtted, ettevõtted ja isegi valitsused.

OLAP-i tööriistad

Interneti-analüütika tööriistad on Internetis väga hästi olemas nii tasulises kui ka tasuta versioonis.

Kõige populaarsemad neist:

  1. Dundas Data Visualizationi Dundas BI on brauseripõhine platvorm äriteabe ja andmete visualiseerimiseks, mis sisaldab integreeritud armatuurlaudu, OLAP-i aruandlust ja andmeanalüüsi.
  2. Yellowfin on äriteabe platvorm, mis pakub ühtset integreeritud lahendust, mis on mõeldud erinevate tööstusharude ja suurusega ettevõtetele. See süsteem on kohandatud raamatupidamise, reklaami ja põllumajanduse valdkondade ettevõtetele.
  3. ClicData on ärianalüüsi (BI) lahendus, mis on mõeldud kasutamiseks peamiselt väikestele ja keskmise suurusega ettevõtetele. Tööriist võimaldab lõppkasutajatel luua aruandeid ja armatuurlaudu. Board on loodud integreerima ärianalüüsi, ettevõtte tulemuslikkuse juhtimist ning see on täisfunktsionaalne süsteem, mis teenindab keskmise turuga ettevõtteid ja ettevõtteid.
  4. Domo on pilvepõhine ärijuhtimiskomplekt, mis integreerub mitme andmeallikaga, sealhulgas arvutustabelite, andmebaaside, sotsiaalmeedia ja mis tahes olemasoleva pilve- või kohapealse tarkvaralahendusega.
  5. InetSoft Style Intelligence on ärianalüütikutele mõeldud tarkvaraplatvorm, mis võimaldab kasutajatel luua armatuurlaudu, visuaalset OLAP-i analüüsitehnoloogiat ja aruandeid, kasutades segamismootorit.
  6. Birst ettevõttest Infor on veebipõhine äriteabe ja -analüütika lahendus, mis ühendab erinevate meeskondade teadmisi, et aidata teil teha teadlikke otsuseid. Tööriist võimaldab detsentraliseeritud kasutajatel suurendada ettevõtte meeskonnamudelit.
  7. Halo on kõikehõlmav tarneahela juhtimise ja äriteabe süsteem, mis aitab tarneahela juhtimisel äri planeerida ja varude prognoosimist. Süsteem kasutab andmeid kõikidest allikatest – suurtest, väikestest ja vahepealsetest.
  8. Chartio on pilvepõhine ärianalüüsi lahendus, mis pakub asutajatele, ärimeeskondadele, andmeanalüütikutele ja tootemeeskondadele igapäevaseks tööks organisatsioonilisi tööriistu.
  9. Exago BI on veebipõhine lahendus, mis on loodud juurutamiseks veebirakendustes. Exago BI juurutamine võimaldab igas suuruses ettevõtetel pakkuda oma klientidele kohandatud, õigeaegset ja interaktiivset aruandlust.

Mõju ärile

Kasutaja leiab OLAP-i enamikust ärirakendustest erinevates tööstusharudes. Analüüsi ei kasuta mitte ainult ettevõtjad, vaid ka teised huvilised.

Mõned selle levinumad rakendused hõlmavad järgmist:

  1. Turunduse OLAP-i andmete analüüs.
  2. Finantsaruandlus, mis hõlmab müüki ja kulusid, eelarve koostamist ja finantsplaneerimist.
  3. Äriprotsesside juhtimine.
  4. Müügianalüüs.
  5. Andmebaasi turundus.

Tööstusharud jätkavad kasvu, mis tähendab, et kasutajad näevad peagi rohkem OLAP-i rakendusi. Mitmemõõtmeline adaptiivne töötlemine tagab dünaamilisema analüüsi. Just sel põhjusel kasutatakse neid OLAP-süsteeme ja -tehnoloogiaid mis-kui-stsenaariumide ja alternatiivsete äristsenaariumide hindamiseks.