Uwakilishi wa data wa pande nyingi. Mpango wa jumla wa kuandaa ghala la data. Sifa, aina na tofauti kuu kati ya teknolojia ya OLAP na OLTP. Nyota na mifumo ya theluji. Kujumlisha. Utangulizi wa chaguzi za utekelezaji wa OLAP olap

Masharti ya ushindani wa hali ya juu na mienendo inayokua ya mazingira ya nje inaamuru mahitaji ya kuongezeka kwa mifumo ya usimamizi wa biashara. Ukuzaji wa nadharia na mazoezi ya usimamizi uliambatana na kuibuka kwa mbinu mpya, teknolojia na mifano inayolenga kuongeza ufanisi wa utendaji. Mbinu na mifano, kwa upande wake, zilichangia kuibuka kwa mifumo ya uchambuzi. Mahitaji ya mifumo ya uchambuzi nchini Urusi ni ya juu. Kutoka kwa mtazamo wa maombi, mifumo hii inavutia zaidi katika sekta ya fedha: mabenki, biashara ya bima, makampuni ya uwekezaji. Matokeo ya kazi ya mifumo ya uchambuzi ni muhimu, kwanza kabisa, kwa watu ambao maamuzi ya maendeleo ya kampuni inategemea: mameneja, wataalam, wachambuzi. Mifumo ya uchanganuzi hukuruhusu kutatua shida za ujumuishaji, kuripoti, uboreshaji na utabiri. Hadi sasa, hakujakuwa na uainishaji wa mwisho wa mifumo ya uchanganuzi, kama vile hakuna mfumo wa jumla wa ufafanuzi katika istilahi zinazotumika katika eneo hili. Muundo wa habari wa biashara unaweza kuwakilishwa na mlolongo wa viwango, ambayo kila moja ina sifa ya njia yake ya usindikaji na usimamizi wa habari, na ina kazi yake mwenyewe katika mchakato wa usimamizi. Kwa hivyo, mifumo ya uchanganuzi itapatikana kihierarkia katika viwango tofauti vya miundombinu hii.

Kiwango cha mifumo ya manunuzi

Safu ya Ghala la Data

Safu ya data mart

Kiwango cha mifumo ya OLAP

Safu ya maombi ya uchambuzi

Mifumo ya OLAP - (Uchakataji wa Uchanganuzi wa Mtandaoni, usindikaji wa uchanganuzi katika wakati huu) - ni teknolojia ya uchanganuzi changamano wa data nyingi. Mifumo ya OLAP inatumika pale ambapo kuna kazi ya kuchanganua data ya vipengele vingi. Ni njia madhubuti za uchambuzi na utoaji wa ripoti. Maghala ya data, mifumo ya data na mifumo ya OLAP iliyojadiliwa hapo juu ni ya mifumo ya akili ya biashara (BI).

Mara nyingi, mifumo ya habari na uchanganuzi iliyoundwa kwa matarajio ya matumizi ya moja kwa moja na watoa maamuzi hugeuka kuwa rahisi sana kutumia, lakini ina utendakazi mdogo sana. Mifumo hiyo tuli inaitwa katika fasihi Mifumo ya Taarifa za Utendaji (IIS), au Mifumo ya Taarifa ya Utendaji (EIS). Zina maswali yaliyofafanuliwa awali na, ingawa yanatosha kwa ukaguzi wa kila siku, haziwezi kujibu maswali yote kuhusu data inayopatikana ambayo inaweza kutokea wakati wa kufanya maamuzi. Matokeo ya mfumo kama huo, kama sheria, ni ripoti za kurasa nyingi, baada ya kusoma kwa uangalifu ambayo mchambuzi ana safu mpya ya maswali. Walakini, kila ombi jipya ambalo halikutarajiwa wakati wa kuunda mfumo kama huo lazima kwanza lifafanuliwe rasmi, limeandikwa na mpangaji programu, na kisha kutekelezwa. Wakati wa kusubiri katika kesi hii inaweza kuwa masaa na siku, ambayo haikubaliki kila wakati. Kwa hivyo, unyenyekevu wa nje wa DSS tuli, ambayo wateja wengi wa mifumo ya habari na uchambuzi wanapigana kikamilifu, hugeuka kuwa hasara kubwa ya kubadilika.



Dynamic DSS, kinyume chake, inalenga kuchakata maombi yasiyodhibitiwa (ya dharura) ya data. Mahitaji ya mifumo kama hii yalizingatiwa kwa undani zaidi na E. F. Codd katika makala ambayo iliweka msingi wa dhana ya OLAP. Kazi ya wachambuzi walio na mifumo hii ina mlolongo wa mwingiliano wa kuunda maswali na kusoma matokeo yao.

Lakini DSS yenye nguvu inaweza kufanya kazi sio tu katika uwanja wa usindikaji wa uchambuzi wa mtandaoni (OLAP); msaada wa kufanya maamuzi ya usimamizi kulingana na data iliyokusanywa inaweza kufanywa katika maeneo matatu ya msingi.

Upeo wa data ya kina. Huu ndio upeo wa mifumo mingi ya kurejesha taarifa. Mara nyingi, DBMS za uhusiano hukabiliana vyema na kazi zinazotokea hapa. Kiwango kinachokubalika kwa jumla cha lugha cha kudhibiti data ya uhusiano ni SQL. Mifumo ya urejeshaji taarifa ambayo hutoa kiolesura cha mtumiaji wa mwisho katika kazi za kutafuta maelezo ya kina inaweza kutumika kama nyongeza kwenye hifadhidata mahususi za mifumo ya shughuli na juu ya ghala la jumla la data.

Upeo wa viashiria vya jumla. Mtazamo wa kina wa taarifa iliyokusanywa katika ghala la data, ujumuishaji na ujumlishaji wake, uwakilishi wa hypercube na uchanganuzi wa pande nyingi ni kazi za mifumo ya kuchakata uchambuzi mtandaoni (OLAP). Hapa unaweza kuzingatia DBMS maalum ya multidimensional, au kubaki ndani ya mfumo wa teknolojia za uhusiano. Katika hali ya pili, data iliyokusanywa mapema inaweza kukusanywa katika hifadhidata yenye umbo la nyota, au ujumlishaji wa taarifa unaweza kufanywa kwa njia ya haraka huku ukichanganua majedwali ya kina katika hifadhidata ya uhusiano.

Nyanja ya mifumo. Usindikaji wa kiakili unafanywa kwa kutumia mbinu za uchimbaji wa data (IDA, Uchimbaji Data), kazi kuu ambazo ni kutafuta mifumo ya kiutendaji na kimantiki katika taarifa iliyokusanywa, kuunda miundo na sheria zinazoelezea hitilafu zilizopatikana na/au kutabiri maendeleo ya michakato fulani.

Usindikaji wa data ya uchambuzi wa uendeshaji

Dhana ya OLAP inategemea kanuni ya uwakilishi wa data wa pande nyingi. Katika nakala ya 1993, E. F. Codd alishughulikia mapungufu ya muundo wa uhusiano, akionyesha kimsingi kutoweza "kuchanganya, kutazama na kuchambua data kwa suala la vipimo vingi, ambayo ni, kwa njia inayoeleweka zaidi kwa wachambuzi wa biashara," na akafafanua mahitaji ya jumla kwa mifumo ya OLAP inayopanua utendakazi wa DBMS uhusiano na kujumuisha uchanganuzi wa pande nyingi kama mojawapo ya sifa zake.

Uainishaji wa bidhaa za OLAP kulingana na njia ya uwasilishaji wa data.

Hivi sasa, kuna idadi kubwa ya bidhaa kwenye soko ambazo hutoa utendakazi wa OLAP kwa digrii moja au nyingine. Takriban 30 kati ya maarufu zaidi zimeorodheshwa kwenye seva ya wavuti ya ukaguzi http://www.olapreport.com/. Kutoa mtazamo wa dhana ya pande nyingi kutoka kwa kiolesura cha mtumiaji hadi hifadhidata chanzo, bidhaa zote za OLAP zimegawanywa katika makundi matatu kulingana na aina ya hifadhidata ya chanzo.

Mifumo ya kwanza kabisa ya kuchakata uchanganuzi mtandaoni (kwa mfano, Essbase kutoka Arbor Software, Oracle Express Server kutoka Oracle) ilikuwa ya darasa la MOLAP, yaani, ingeweza kufanya kazi na hifadhidata zao za multidimensional. Zinatokana na teknolojia za umiliki kwa DBMS za multidimensional na ni ghali zaidi. Mifumo hii hutoa mzunguko kamili wa uchakataji wa OLAP. Zinajumuisha, pamoja na sehemu ya seva, kiolesura chao cha mteja kilichojumuishwa, au kutumia programu za lahajedwali za nje kuwasiliana na mtumiaji. Ili kudumisha mifumo kama hii, wafanyikazi maalum wanahitajika kusakinisha, kudumisha mfumo, na kuunda maoni ya data kwa watumiaji wa mwisho.

Mifumo ya uchakataji wa uchanganuzi mtandaoni (ROLAP) huruhusu data iliyohifadhiwa katika hifadhidata ya uhusiano kuwakilishwa katika umbo la pande nyingi, ikitoa mabadiliko ya habari kuwa muundo wa pande nyingi kupitia safu ya metadata ya kati. Mifumo ya ROLAP inafaa kwa kufanya kazi na vifaa vikubwa vya kuhifadhi. Kama mifumo ya MOLAP, inahitaji matengenezo makubwa na wataalamu wa teknolojia ya habari na inahusisha utendakazi wa watumiaji wengi.

Hatimaye, mifumo ya mseto (Mseto OLAP, HOLAP) imeundwa ili kuchanganya manufaa na kupunguza hasara zilizo katika madarasa ya awali. Speedware's Media/MR inaangukia katika darasa hili. Kulingana na wasanidi programu, inachanganya kunyumbulika kwa uchanganuzi na kasi ya majibu ya MOLAP na ufikiaji wa mara kwa mara wa data halisi iliyo katika ROLAP.

Multidimensional OLAP (MOLAP)

Katika DBMS maalum kulingana na uwakilishi wa data nyingi, data hupangwa sio katika mfumo wa majedwali ya uhusiano, lakini katika mfumo wa safu zilizopangwa za multidimensional:

1) hypercubes (seli zote zilizohifadhiwa kwenye hifadhidata lazima ziwe na kipimo sawa, ambayo ni, ziwe katika msingi kamili wa kipimo) au

2) polycubes (kila kutofautiana huhifadhiwa na seti yake ya vipimo, na matatizo yote yanayohusiana na usindikaji huhamishiwa kwenye taratibu za ndani za mfumo).

Matumizi ya hifadhidata nyingi katika mifumo ya usindikaji wa uchambuzi mtandaoni ina faida zifuatazo.

Wakati wa kutumia DBMS za multidimensional, kutafuta na kurejesha data ni haraka zaidi kuliko kwa mtazamo wa dhana wa multidimensional wa hifadhidata ya uhusiano, kwa kuwa hifadhidata ya multidimensional imebadilishwa kuwa ya kawaida, ina hatua zilizojumuishwa awali, na hutoa ufikiaji bora kwa seli zilizoombwa.

DBMS za multidimensional hukabiliana kwa urahisi na kazi za kujumuisha vitendaji kadhaa vilivyojumuishwa katika muundo wa habari, wakati mapungufu yaliyopo ya lugha ya SQL hufanya kutekeleza majukumu haya kulingana na DBMS za uhusiano kuwa ngumu sana na wakati mwingine haiwezekani.

Kwa upande mwingine, kuna mapungufu makubwa.

DBMS za multidimensional haziruhusu kufanya kazi na hifadhidata kubwa. Kwa kuongezea, kwa sababu ya urekebishaji na ujumuishaji uliotekelezwa hapo awali, kiasi cha data katika hifadhidata ya pande nyingi, kama sheria, inalingana (kulingana na makadirio ya Codd) hadi mara 2.5-100 chini ya kiwango cha data ya kina ya asili.

Ikilinganishwa na DBMS za uhusiano, DBMS za multidimensional hutumia kumbukumbu ya nje kwa njia isiyofaa sana. Katika visa vingi, hypercube ya habari ni ndogo sana, na kwa kuwa data imehifadhiwa katika fomu iliyoamriwa, maadili ambayo hayajafafanuliwa yanaweza kuondolewa tu kwa kuchagua mpangilio bora wa aina, ambayo hukuruhusu kupanga data kuwa kubwa zaidi. vikundi vinavyoweza kuunganishwa. Lakini hata katika kesi hii, tatizo linatatuliwa kwa sehemu tu. Kwa kuongezea, mpangilio bora zaidi wa kuhifadhi data chache hautakuwa mpangilio ambao hutumiwa mara nyingi katika maswali. Kwa hiyo, katika mifumo halisi ni muhimu kutafuta maelewano kati ya utendaji na redundancy ya nafasi ya disk ulichukua na database.

Kwa hiyo, matumizi ya DBMS ya multidimensional inahesabiwa haki tu chini ya hali zifuatazo.

Kiasi cha data ya chanzo kwa uchanganuzi sio kubwa sana (si zaidi ya gigabytes chache), ambayo ni, kiwango cha ujumlishaji wa data ni cha juu kabisa.

Seti ya vipimo vya habari ni imara (kwani mabadiliko yoyote katika muundo wao karibu daima inahitaji urekebishaji kamili wa hypercube).

Muda wa kujibu wa mfumo kwa maombi yasiyodhibitiwa ndio kigezo muhimu zaidi.

Inahitaji matumizi makubwa ya vitendaji vilivyojumuishwa ndani ili kufanya hesabu za pande zote kwenye seli za hypercube, ikiwa ni pamoja na uwezo wa kuandika vitendaji maalum.

OLAP ya Uhusiano (ROLAP)

Matumizi ya moja kwa moja ya hifadhidata za uhusiano katika mifumo ya usindikaji wa uchambuzi mtandaoni ina faida zifuatazo.

Mara nyingi, ghala za data za shirika hutekelezwa kwa kutumia zana za DBMS zinazohusiana, na zana za ROLAP huruhusu uchanganuzi juu yao moja kwa moja. Wakati huo huo, saizi ya uhifadhi sio kigezo muhimu kama ilivyo kwa MOLAP.

Katika kesi ya tatizo la mwelekeo wa kutofautiana, wakati mabadiliko ya muundo wa vipimo yanapaswa kufanywa mara nyingi, mifumo ya ROLAP yenye uwakilishi wa nguvu wa vipimo ni suluhisho mojawapo, kwani marekebisho hayo hayahitaji urekebishaji wa kimwili wa hifadhidata.

DBMS za uhusiano hutoa kiwango cha juu zaidi cha ulinzi wa data na uwezo mzuri wa kutofautisha haki za ufikiaji.

Hasara kuu ya ROLAP ikilinganishwa na DBMS za multidimensional ni utendaji wa chini. Ili kutoa utendaji unaolinganishwa na MOLAP, mifumo ya uhusiano inahitaji muundo makini wa schema ya hifadhidata na usanidi wa faharasa, yaani, juhudi nyingi kwa upande wa wasimamizi wa hifadhidata. Ni kwa kutumia tu michoro ya nyota ndipo utendakazi wa mifumo ya uhusiano iliyopangwa vyema kukaribia ule wa mifumo inayotegemea hifadhidata za pande nyingi.

Katika mfululizo wa makala "Utangulizi wa Hifadhidata," iliyochapishwa hivi karibuni (tazama ComputerPress No. 3'2000 - 3'2001), tulijadili teknolojia na programu mbalimbali zinazotumiwa katika kuunda mifumo ya habari - DBMS za desktop na seva, zana za kubuni data , maendeleo ya programu. zana, pamoja na Ushauri wa Biashara - uchambuzi wa data wa kiwango cha biashara na zana za usindikaji, ambazo kwa sasa zinazidi kuwa maarufu ulimwenguni, pamoja na katika nchi yetu. Tunatambua, hata hivyo, kwamba masuala ya kutumia zana za Ujasusi wa Biashara na teknolojia zinazotumiwa kuunda matumizi ya darasa hili bado hayajashughulikiwa vya kutosha katika fasihi ya nyumbani. Katika mfululizo mpya wa makala tutajaribu kujaza pengo hili na kuzungumza juu ya nini teknolojia ya msingi ya maombi hayo ni. Kama mifano ya utekelezaji, tutatumia teknolojia za Microsoft OLAP (hasa Huduma za Uchambuzi katika Seva ya Microsoft SQL 2000), lakini tunatumai kwamba nyenzo nyingi zitakuwa muhimu kwa watumiaji wa zana zingine.

Nakala ya kwanza katika mfululizo huu imejitolea kwa misingi ya OLAP (Uchakataji wa Uchanganuzi wa Mtandao) - teknolojia ya uchanganuzi wa data wa pande nyingi. Ndani yake, tutaangalia dhana za kuhifadhi data na OLAP, mahitaji ya kuhifadhi data na zana za OLAP, mpangilio wa kimantiki wa data ya OLAP, na masharti na dhana za msingi zinazotumiwa wakati wa kujadili uchanganuzi wa pande nyingi.

Je, ghala la data ni nini

Mifumo ya habari ya kiwango cha biashara, kama sheria, ina programu iliyoundwa kwa uchambuzi tata wa data nyingi, mienendo yake, mwelekeo, n.k. Uchambuzi kama huo hatimaye unakusudiwa kusaidia kufanya maamuzi. Mifumo hii mara nyingi huitwa mifumo ya usaidizi wa maamuzi.

Haiwezekani kufanya uamuzi wowote wa usimamizi bila kuwa na taarifa muhimu, kwa kawaida kiasi. Hii inahitaji uundaji wa maghala ya Data, yaani, mchakato wa kukusanya, kuchuja na kuchakata data kabla ili kutoa taarifa zinazotokana na watumiaji kwa uchambuzi wa takwimu (na mara nyingi uundaji wa ripoti za uchanganuzi).

Ralph Kimball, mmoja wa waanzilishi wa dhana ya ghala la data, alielezea ghala la data kama "mahali ambapo watu wanaweza kufikia data zao" (ona, kwa mfano, Ralph Kimball, "The Data Warehouse Toolkit: Mbinu za Kiutendaji za Kujenga Maghala ya Data ya Vipimo. ", John Wiley & Sons, 1996 na "The Data Webhouse Toolkit: Kujenga Ghala la Data Lililowezeshwa na Mtandao", John Wiley & Sons, 2000). Pia aliandaa mahitaji ya msingi ya ghala za data:

  • usaidizi wa kurejesha data ya kasi kutoka kwa hifadhi;
  • kudumisha uthabiti wa data ya ndani;
  • uwezo wa kupata na kulinganisha kinachojulikana vipande vya data (kipande na kete);
  • upatikanaji wa huduma zinazofaa za kutazama data kwenye hifadhi;
  • ukamilifu na uaminifu wa data iliyohifadhiwa;
  • msaada kwa mchakato wa kujaza data wa hali ya juu.

Mara nyingi haiwezekani kukidhi mahitaji yote hapo juu ndani ya bidhaa sawa. Kwa hiyo, kutekeleza maghala ya data, bidhaa kadhaa hutumiwa kawaida, ambazo baadhi yake ni zana halisi za kuhifadhi data, wengine ni zana za kurejesha na kuziangalia, wengine ni zana za kuzijaza, nk.

Ghala la kawaida la data kwa kawaida ni tofauti na hifadhidata ya kawaida ya uhusiano. Kwanza, hifadhidata za kawaida zimeundwa ili kuwasaidia watumiaji kufanya kazi ya kila siku, huku maghala ya data yameundwa kwa ajili ya kufanya maamuzi. Kwa mfano, uuzaji wa bidhaa na utoaji wa ankara unafanywa kwa kutumia database iliyoundwa kwa ajili ya usindikaji wa shughuli, na uchambuzi wa mienendo ya mauzo kwa miaka kadhaa, ambayo inaruhusu kupanga kazi na wauzaji, hufanyika kwa kutumia ghala la data.

Pili, ingawa hifadhidata za kitamaduni zinaweza kubadilika kila wakati watumiaji wanapofanya kazi, ghala la data ni thabiti: data iliyo ndani yake kawaida husasishwa kulingana na ratiba (kwa mfano, kila wiki, kila siku, au kila saa, kulingana na mahitaji). Kwa kweli, mchakato wa uboreshaji ni kuongeza data mpya kwa muda bila kubadilisha maelezo ya awali tayari kwenye duka.

Na tatu, hifadhidata za kawaida mara nyingi ndio chanzo cha data inayoishia kwenye ghala. Kwa kuongeza, hazina inaweza kujazwa tena kutoka kwa vyanzo vya nje, kama vile ripoti za takwimu.

OLAP ni nini

Mifumo ya usaidizi wa maamuzi kwa kawaida huwa na njia ya kumpa mtumiaji data iliyojumlishwa kwa sampuli mbalimbali kutoka kwa seti asili katika fomu inayofaa kwa utambuzi na uchambuzi. Kwa kawaida, utendaji kama huo wa jumla huunda seti ya data ya pande nyingi (na kwa hivyo isiyo ya uhusiano) (ambayo mara nyingi huitwa hypercube au metacube), ambayo shoka zake huwa na vigezo, na seli zake zina data ya jumla inayozitegemea. Pamoja na kila mhimili, data inaweza kupangwa katika daraja, inayowakilisha viwango tofauti vya maelezo. Shukrani kwa muundo huu wa data, watumiaji wanaweza kutunga maswali changamano, kutoa ripoti na kupata vikundi vidogo vya data.

Teknolojia ya uchanganuzi changamano wa data ya pande nyingi inaitwa OLAP (Uchakataji wa Uchanganuzi wa Mtandao). OLAP ni sehemu muhimu ya kuhifadhi data. Dhana ya OLAP ilielezewa mwaka wa 1993 na Edgar Codd, mtafiti wa hifadhidata mashuhuri na mwandishi wa modeli ya data ya uhusiano (ona E.F. Codd, S.B. Codd, na C.T. Salley, Inayotoa OLAP (usindikaji wa uchambuzi wa mtandaoni) kwa wachambuzi wa watumiaji: An Mamlaka ya IT.Ripoti ya kiufundi, 1993). Mnamo 1995, kwa kuzingatia mahitaji yaliyowekwa na Codd, kinachojulikana kama mtihani wa FASMI (Uchambuzi wa Haraka wa Taarifa ya Pamoja ya Multidimensional) iliundwa, ikiwa ni pamoja na mahitaji yafuatayo ya maombi ya uchambuzi wa multidimensional:

  • kumpa mtumiaji matokeo ya uchambuzi kwa wakati unaokubalika (kawaida sio zaidi ya sekunde 5), hata kwa gharama ya uchambuzi wa kina;
  • uwezo wa kufanya uchambuzi wowote wa kimantiki na wa takwimu maalum kwa programu fulani na kuihifadhi katika fomu inayopatikana kwa mtumiaji wa mwisho;
  • ufikiaji wa watumiaji wengi kwa data kwa usaidizi wa njia zinazofaa za kufunga na njia za ufikiaji zilizoidhinishwa;
  • uwakilishi wa dhana nyingi za data, ikijumuisha usaidizi kamili wa madaraja na tabaka nyingi (hili ni hitaji kuu la OLAP);
  • uwezo wa kupata taarifa yoyote muhimu, bila kujali kiasi chake na eneo la kuhifadhi.

Ikumbukwe kwamba utendakazi wa OLAP unaweza kutekelezwa kwa njia mbalimbali, kutoka kwa zana rahisi zaidi za uchambuzi wa data katika maombi ya ofisi hadi mifumo ya uchambuzi iliyosambazwa kulingana na bidhaa za seva. Lakini kabla ya kuzungumza juu ya utekelezaji tofauti wa utendaji huu, hebu tuangalie cubes za OLAP ni nini kutoka kwa mtazamo wa kimantiki.

Cube za multidimensional

Katika sehemu hii, tutaangalia kwa karibu dhana ya OLAP na cubes multidimensional. Kama mfano wa hifadhidata ya uhusiano ambayo tutatumia kuonyesha kanuni za OLAP, tutatumia hifadhidata ya Northwind, ambayo imejumuishwa na Microsoft SQL Server au Microsoft Access na ni hifadhidata ya kawaida ambayo huhifadhi maelezo ya biashara ya kampuni ya jumla ya usambazaji wa chakula. Data hiyo inajumuisha taarifa kuhusu wauzaji, wateja, makampuni ya utoaji, orodha ya bidhaa zinazotolewa na aina zao, data kuhusu maagizo na bidhaa zilizoagizwa, orodha ya wafanyakazi wa kampuni. Maelezo ya kina ya hifadhidata ya Northwind yanaweza kupatikana katika Seva ya Microsoft SQL au mifumo ya usaidizi ya Microsoft Access - hatutoi hapa kwa sababu ya ukosefu wa nafasi.

Ili kugundua dhana ya OLAP, tutatumia mwonekano wa ankara na majedwali ya Bidhaa na Vitengo kutoka kwenye hifadhidata ya Northwind ili kuunda hoja ambayo italeta maelezo ya kina kuhusu bidhaa zote zilizoagizwa na ankara zinazotolewa:

CHAGUA dbo.Invoice.Nchi, dbo.Invoice.City, dbo.Invoice.Jina la Mteja, dbo.Ankara.Muuzaji, dbo.Invoice.Tarehe ya Kuagiza, dbo.CategoryName, dbo.Invoice.Invoice.ProductName,Dbo. .Ankara.Bei Iliyoongezwa KUTOKA kwa dbo.Bidhaa JIUNGE NA dbo.Kategoria KWENYE dbo.Products.CategoryID = dbo.Categories.CategoryID INNER JIUNGE dbo.Invoice KWENYE dbo.Products.ProductID = dbo.ProductIDs.

Katika Access 2000, swali kama hilo linaonekana kama hii:

CHAGUA ankara.Nchi, ankara.Jiji, ankara.Wateja.Jina la Kampuni AS Jina la Mteja, Ankara.Muuzaji, Ankara.Tarehe ya Kuagiza, Jamii.Jina la Kategoria,Jina la Ankara.Jina la Bidhaa, Ankara.Wasafirishaji.KampuniJina la Jina la Msafirishaji.FNJJina la Invoice sauti Bidhaa za JIUNGE NA NDANI KWENYE Invoices.ProductID = Products.ProductID) KWENYE Categories.CategoryID = Products.CategoryID;

Hoja hii inafikia mwonekano wa ankara, ambao una taarifa kuhusu ankara zote zilizotolewa, pamoja na jedwali la Aina na Bidhaa, ambazo zina maelezo kuhusu aina za bidhaa ambazo ziliagizwa na bidhaa zenyewe, mtawalia. Matokeo ya ombi hili ni seti ya data ya agizo inayojumuisha kitengo na jina la bidhaa iliyoagizwa, tarehe ambayo agizo liliwekwa, jina la mtu anayelipa ankara, jiji, nchi na jina la kampuni ya kampuni inayoagiza, vile vile. kama jina la kampuni ya usafirishaji.

Kwa urahisi, hebu tuhifadhi ombi hili kama mtazamo, tukiita Ankara1. Matokeo ya kupata uwakilishi huu yanaonyeshwa kwenye Mtini. 1 .

Je, tunaweza kupata data gani ya jumla kutoka kwa mtazamo huu? Kwa kawaida haya ni majibu ya maswali kama vile:

  • Je, ni thamani gani ya jumla ya maagizo yaliyowekwa na wateja kutoka Ufaransa?
  • Je, ni thamani gani ya jumla ya maagizo yaliyotolewa na wateja nchini Ufaransa na kuletwa na Speedy Express?
  • Je, ni thamani gani ya jumla ya maagizo yaliyowekwa na wateja nchini Ufaransa mwaka wa 1997 na kuwasilishwa na Speedy Express?

Hebu tutafsiri maswali haya kuwa maswali katika SQL (Jedwali 1).

Matokeo ya hoja yoyote kati ya zilizo hapo juu ni nambari. Ikiwa katika hoja ya kwanza utabadilisha kigezo cha 'Ufaransa' na 'Austria' au jina la nchi nyingine, unaweza kutekeleza swali hili tena na upate nambari tofauti. Kwa kufanya utaratibu huu na nchi zote, tunapata seti ifuatayo ya data (kipande kinaonyeshwa hapa chini):

Nchi SUM (Bei Iliyoongezwa)
Argentina 7327.3
Austria 110788.4
Ubelgiji 28491.65
Brazili 97407.74
Kanada 46190.1
Denmark 28392.32
Ufini 15296.35
Ufaransa 69185.48
Ujerumani 209373.6

Seti inayotokana ya thamani za jumla (katika kesi hii, jumla) inaweza kufasiriwa kama seti ya data yenye mwelekeo mmoja. Seti sawa ya data pia inaweza kupatikana kama matokeo ya swali na kifungu cha GROUP BY cha fomu ifuatayo:

CHAGUA Nchi, SUM (ExtendedPrice) KUTOKA kwenye ankara1 KUNDI KWA Nchi

Sasa hebu tuangalie swali la pili hapo juu, ambalo lina masharti mawili katika kifungu cha WHERE. Tukiendesha swali hili, tukichomeka thamani zote zinazowezekana za Vigezo vya Country na ShipperName, tutapata seti ya data ya pande mbili inayoonekana kama hii (kijisehemu kinaonyeshwa hapa chini):

Jina la Mtumaji Shehena
Nchi Usafirishaji wa Shirikisho Speedy Express Kifurushi cha Umoja
Argentina 1 210.30 1 816.20 5 092.60
Austria 40 870.77 41 004.13 46 128.93
Ubelgiji 11 393.30 4 717.56 17 713.99
Brazili 16 514.56 35 398.14 55 013.08
Kanada 19 598.78 5 440.42 25 157.08
Denmark 18 295.30 6 573.97 7 791.74
Ufini 4 889.84 5 966.21 7 954.00
Ufaransa 28 737.23 21 140.18 31 480.90
Ujerumani 53 474.88 94 847.12 81 962.58

Seti kama hiyo ya data inaitwa jedwali la egemeo au jedwali la msalaba. Lahajedwali nyingi na DBMS za mezani hukuruhusu kuunda majedwali kama haya - kutoka Paradox kwa DOS hadi Microsoft Excel 2000. Kwa mfano, hivi ndivyo swali kama hilo linavyoonekana katika Microsoft Access 2000:

BADILISHA Jumla(Invoice1.ExtendedPrice) AS SumOfExtendedBei CHAGUA Ankara1.Nchi KUTOKA ankara1 KUNDI KWA Ankara1.Nchi PIVOT Ankara1.ShipperName;

Data iliyojumlishwa ya jedwali badilifu kama hilo pia inaweza kupatikana kwa hoja ya kawaida ya GROUP BY:

CHAGUA Nchi,Jina la Msafirishaji, SUM (Bei Iliyoongezwa) KUTOKA kwenye ankara1 GROUP BY COUNTRY,ShipperName Kumbuka, hata hivyo, kwamba matokeo ya hoja hii hayatakuwa jedwali la egemeo lenyewe, bali ni seti ya data ya jumla ya ujenzi wake (kipande kinaonyeshwa hapa chini. ):

Nchi Jina la Mtumaji Shehena SUM (Bei Iliyoongezwa)
Argentina Usafirishaji wa Shirikisho 845.5
Austria Usafirishaji wa Shirikisho 35696.78
Ubelgiji Usafirishaji wa Shirikisho 8747.3
Brazili Usafirishaji wa Shirikisho 13998.26

Hoja ya tatu kati ya maswali yaliyojadiliwa hapo juu tayari ina vigezo vitatu katika hali ya WHERE. Kwa kuwatofautisha, tunapata seti ya data tatu-dimensional (Mchoro 2).

Seli za mchemraba zilizoonyeshwa kwenye Mtini. 2 ina data ya jumla inayolingana na maadili ya vigezo vya hoja katika kifungu cha WHERE kilicho kwenye shoka za mchemraba.

Unaweza kupata seti ya meza za pande mbili kwa kukata mchemraba na ndege zinazofanana na nyuso zake (maneno ya sehemu za msalaba na vipande hutumiwa kuashiria).

Ni wazi, data iliyo katika seli za mchemraba pia inaweza kupatikana kwa kutumia hoja inayofaa na kifungu cha GROUP BY. Kwa kuongezea, lahajedwali zingine (haswa Microsoft Excel 2000) pia hukuruhusu kupanga seti ya data ya pande tatu na kutazama sehemu tofauti za mchemraba sambamba na uso wake kama inavyoonyeshwa kwenye karatasi ya kitabu cha kazi.

Ikiwa kifungu cha WHERE kina vigezo vinne au zaidi, seti inayotokana ya maadili (pia inaitwa mchemraba wa OLAP) inaweza kuwa ya 4-dimensional, 5-dimensional, nk.

Baada ya kuangalia cubes za OLAP zenye pande nyingi ni nini, hebu tuendelee na baadhi ya maneno na dhana muhimu zinazotumiwa katika uchanganuzi wa data wa pande nyingi.

Baadhi ya masharti na dhana

Pamoja na hesabu, seli za mchemraba wa OLAP zinaweza kuwa na matokeo ya kutekeleza majukumu mengine ya jumla ya lugha ya SQL, kama vile MIN, MAX, AVG, COUNT, na katika hali nyingine, zingine (tofauti, mkengeuko wa kawaida, n.k.). Ili kuelezea maadili ya data katika seli, muhtasari wa neno hutumiwa (kwa ujumla, kunaweza kuwa na kadhaa katika mchemraba mmoja), neno kipimo hutumiwa kuashiria data ya chanzo kwa msingi wa ambayo imehesabiwa, na urefu wa neno hutumika kuashiria vigezo vya hoja (hufasiriwa kwa Kirusi kwa kawaida hujulikana kama "dimension" wakati wa kuzungumza kuhusu cubes OLAP, na kama "dimension" wakati wa kuzungumza kuhusu ghala za data). Thamani zilizopangwa kwenye shoka huitwa washiriki wa vipimo.

Wakati wa kuzungumza juu ya vipimo, inafaa kutaja kuwa maadili yaliyopangwa kwenye shoka yanaweza kuwa na viwango tofauti vya maelezo. Kwa mfano, tunaweza kupendezwa na jumla ya thamani ya maagizo yaliyotolewa na wateja katika nchi tofauti, au jumla ya thamani ya maagizo yaliyotolewa na wateja walio nje ya jiji au hata wateja binafsi. Kwa kawaida, seti inayotokana ya data ya jumla katika kesi ya pili na ya tatu itakuwa ya kina zaidi kuliko ya kwanza. Kumbuka kuwa uwezo wa kupata data iliyojumlishwa yenye viwango tofauti vya maelezo inakidhi mojawapo ya mahitaji ya maghala ya data - hitaji la upatikanaji wa vipande mbalimbali vya data kwa kulinganisha na kuchanganua.

Kwa kuwa katika mfano unaozingatiwa, kwa ujumla, kila nchi inaweza kuwa na miji kadhaa, na jiji linaweza kuwa na wateja kadhaa, tunaweza kuzungumza juu ya viwango vya maadili katika vipimo. Katika kesi hiyo, nchi ziko katika ngazi ya kwanza ya uongozi, miji iko katika pili, na wateja ni ya tatu (Mchoro 3).

Kumbuka kwamba madaraja yanaweza kusawazishwa, kama vile safu iliyoonyeshwa kwenye Mtini. 3, pamoja na madaraja kulingana na tarehe na data isiyosawazishwa. Mfano wa kawaida wa uongozi usio na usawa ni uongozi wa "juu-chini" (unaweza kujengwa, kwa mfano, kwa kutumia maadili ya uwanja wa Muuzaji wa data ya awali kutoka kwa mfano uliojadiliwa hapo juu), iliyoonyeshwa kwenye Mtini. 4 .

Wakati mwingine neno uongozi wa mzazi na mtoto hutumiwa kwa madaraja kama haya.

Pia kuna madaraja ambayo yanachukua nafasi ya kati kati ya usawa na isiyo na usawa (zinateuliwa na neno chakavu). Kwa kawaida huwa na wanachama ambao "wazazi" wao kimantiki hawako katika kiwango cha juu zaidi (kwa mfano, uongozi wa kijiografia una viwango vya Nchi, Jiji na Jimbo, lakini kuna nchi katika mkusanyiko wa data ambazo hazina majimbo au maeneo kati ya Nchi na Viwango vya jiji; Mchoro 5).

Kumbuka kuwa safu zisizo na usawa na "zisizo sawa" haziauniwi na zana zote za OLAP. Kwa mfano, Huduma za Uchambuzi za Microsoft 2000 zinaauni aina zote mbili za uongozi, lakini Huduma za Microsoft OLAP 7.0 zinaauni zilizosawazishwa pekee. Idadi ya viwango vya daraja, idadi ya juu zaidi inayoruhusiwa ya wanachama wa ngazi moja, na idadi ya juu iwezekanavyo ya vipimo vyenyewe vinaweza kuwa tofauti katika zana tofauti za OLAP.

Hitimisho

Katika makala hii tulijifunza misingi ya OLAP. Tulijifunza yafuatayo:

  • Madhumuni ya maghala ya data ni kuwapa watumiaji taarifa kwa ajili ya uchambuzi wa takwimu na kufanya maamuzi ya usimamizi.
  • Hifadhi za data lazima zihakikishe kasi ya juu ya kurejesha data, uwezo wa kupata na kulinganisha kinachojulikana vipande vya data, pamoja na uthabiti, ukamilifu na uaminifu wa data.
  • OLAP (Uchakataji wa Uchanganuzi wa Mtandao) ni sehemu muhimu ya kujenga na kutumia maghala ya data. Teknolojia hii inategemea ujenzi wa seti za data za multidimensional - cubes za OLAP, shoka ambazo zina vigezo, na seli zina data ya jumla ambayo inategemea yao.
  • Programu zilizo na utendakazi wa OLAP lazima zimpe mtumiaji matokeo ya uchanganuzi kwa wakati unaokubalika, zifanye uchanganuzi wa kimantiki na wa takwimu, zisaidie ufikiaji wa data kwa watumiaji wengi, zitoe uwakilishi wa dhana wa data wa pande nyingi, na uweze kufikia taarifa yoyote muhimu.

Kwa kuongeza, tulipitia kanuni za msingi za shirika la kimantiki la cubes za OLAP, na pia tulijifunza maneno na dhana za msingi zinazotumiwa katika uchambuzi wa multidimensional. Hatimaye, tulijifunza aina tofauti za daraja ni zipi katika vipimo vya mchemraba wa OLAP.

Katika makala inayofuata katika mfululizo huu, tutaangalia muundo wa kawaida wa maghala ya data, kuzungumza juu ya OLAP ya mteja na seva, na pia kuzingatia baadhi ya vipengele vya kiufundi vya uhifadhi wa data wa multidimensional.

KompyutaPress 4"2001

Tofauti kuu kati ya ukweli na habari ni kwamba tunapokea na kuzingatia data, na tunaweza kutumia habari kufaidika. Kwa kusema, habari huchanganuliwa na kupangwa data. Shukrani kwa habari iliyopokelewa kwa wakati unaofaa, kampuni nyingi zinaweza kuishi katika mzozo wa kifedha na ushindani mkali. Haitoshi kukusanya ukweli na kuwa na data zote muhimu. Pia unahitaji kuwa na uwezo wa kuzichambua. Ili iwe rahisi kwa watu ambao wanapaswa kufanya maamuzi muhimu ya biashara, mifumo mbalimbali ya usaidizi imetengenezwa. Ni kwa kusudi hili kwamba mifumo mbalimbali changamano imeundwa ambayo inaruhusu kuchambua kiasi kikubwa cha data tofauti na kuzigeuza kuwa habari muhimu kwa mtumiaji wa biashara. Sehemu mpya ya uchanganuzi wa biashara inalenga kuboresha udhibiti wa mchakato wa mifumo ya biashara kupitia matumizi ya kuhifadhi data na teknolojia.

Soko la mifumo ya habari ya biashara leo hutoa uteuzi tofauti wa suluhisho ambazo husaidia biashara kupanga uhasibu wa usimamizi, kuhakikisha usimamizi wa utendaji wa uzalishaji na uuzaji, na kufanya mwingiliano mzuri na wateja na wauzaji.

Niche tofauti katika soko la mifumo ya biashara inamilikiwa na bidhaa za programu za uchambuzi iliyoundwa kusaidia kufanya maamuzi katika kiwango cha kimkakati cha usimamizi wa biashara. Tofauti kuu kati ya zana kama hizi na mifumo ya usimamizi wa uendeshaji ni kwamba mwisho hutoa usimamizi wa biashara katika "hali ya kufanya kazi," ambayo ni, utekelezaji wa mpango ulioainishwa wa uzalishaji, wakati mifumo ya uchambuzi wa kiwango cha kimkakati husaidia usimamizi wa biashara kukuza maamuzi katika "Njia ya maendeleo."

Kiwango cha mabadiliko yaliyofanywa kinaweza kutofautiana kutoka kwa urekebishaji wa kina hadi uppdatering wa sehemu ya teknolojia katika tovuti za uzalishaji binafsi, lakini, kwa hali yoyote, watoa maamuzi huzingatia njia mbadala za maendeleo ambazo hatima ya biashara kwa muda mrefu inategemea.

Haijalishi mfumo wa habari wa biashara una nguvu na maendeleo gani, hauwezi kusaidia katika kutatua maswala haya, kwanza, kwa sababu imeundwa kwa michakato ya biashara iliyosimama, iliyoanzishwa, na pili, haina na haiwezi kuwa na habari ya kufanya maamuzi kuhusu maeneo mapya ya biashara. biashara, teknolojia mpya, maamuzi mapya ya shirika.

Shukrani kwa teknolojia ya usindikaji na uchanganuzi wa data ya OLAP (On-Line Analytical Processing), shirika lolote linaweza karibu papo hapo (ndani ya sekunde tano) kupata data muhimu kwa kazi. OLAP inaweza kufafanuliwa kwa ufupi kwa maneno muhimu matano.

FAST (Haraka) - hii ina maana kwamba wakati wa kutafuta na kutoa taarifa muhimu huchukua si zaidi ya sekunde tano. Maombi rahisi zaidi yanashughulikiwa kwa sekunde moja, na maombi machache changamano yana muda wa usindikaji wa zaidi ya sekunde ishirini. Ili kufikia matokeo haya, mbinu mbalimbali hutumiwa, kutoka kwa aina maalum za kuhifadhi data hadi mahesabu ya kina ya awali. Kwa njia hii, unaweza kupata ripoti katika dakika ambayo awali ilichukua siku kutayarisha.

UCHAMBUZI (Uchambuzi) unasema kwamba mfumo unaweza kufanya uchambuzi wowote, wa takwimu na wa kimantiki, na kisha uihifadhi katika fomu inayoweza kupatikana.

SHARED inamaanisha kuwa mfumo hutoa faragha inayohitajika hadi kiwango cha seli

MULTIDIMENSIONAL (Muldimensional) ndiyo sifa kuu ya OLAP. Mfumo lazima uunge mkono kikamilifu madaraja na madaraja mengi, kwa kuwa hii ndiyo njia ya kimantiki zaidi ya kuchanganua shughuli za biashara na shirika.

HABARI. Taarifa sahihi lazima ziwasilishwe mahali zinapohitajika.

Wakati shirika linafanya kazi, data inayohusiana na uwanja wake wa shughuli hujilimbikiza kila wakati, ambayo wakati mwingine huhifadhiwa katika sehemu tofauti kabisa, na kuzileta pamoja ni ngumu na hutumia wakati. Ni ili kuharakisha upataji wa data ili kujaribu dhahania za biashara zinazoibuka ndipo teknolojia ya uchakataji shirikishi wa data ya uchanganuzi, au OLAP, iliundwa. Kusudi kuu la mifumo kama hiyo ya OLAP ni kujibu haraka maombi ya kiholela ya watumiaji. Hitaji hili mara nyingi hutokea wakati wa kuendeleza mradi fulani muhimu wa biashara, wakati msanidi anahitaji hypothesis inayofanya kazi ambayo imetokea. Mara nyingi, habari ambayo mtumiaji anahitaji inapaswa kuwasilishwa kwa namna ya aina fulani ya utegemezi - kwa mfano, jinsi kiasi cha mauzo kinategemea aina ya bidhaa, kwenye eneo la mauzo, wakati wa mwaka, na kadhalika. Shukrani kwa OLAP, ana uwezo wa kupata mara moja data muhimu katika mpangilio unaohitajika kwa kipindi kilichochaguliwa.

Teknolojia inayoingiliana ya OLAP hukuruhusu kubadilisha rundo kubwa la ripoti na milima mingi ya data kuwa habari muhimu na sahihi ambayo itasaidia mfanyakazi kufanya uamuzi wa biashara au kifedha kwa wakati unaofaa.

Kwa kuongeza, kutokana na OLAP, ufanisi wa usindikaji huongezeka, na mtumiaji anaweza kupokea habari nyingi zilizopangwa (zilizounganishwa) karibu mara moja. Shukrani kwa OLAP, mtumiaji anaweza kuona wazi jinsi shirika lake linavyofanya kazi kwa ufanisi, lina uwezo wa kujibu kwa haraka na kwa urahisi mabadiliko ya nje, na ina uwezo wa kupunguza hasara za kifedha za shirika lake. OLAP hutoa taarifa sahihi ambayo huboresha ubora wa maamuzi yaliyofanywa.

Upungufu pekee wa mifumo ya uchambuzi wa biashara ni gharama yao kubwa. Kuunda hifadhi ya taarifa za kibinafsi kunahitaji muda na pesa nyingi.

Matumizi ya teknolojia ya OLAP katika biashara hukuruhusu kupata haraka habari muhimu, ambayo, kwa ombi la mtumiaji, inaweza kuwasilishwa kwa fomu ya kawaida - ripoti, grafu au meza.

Taratibu za ujumuishaji wa mfumo wa miundo ya biashara zinatokana na utumiaji wa suluhisho za pamoja za ERP, CRM na SCM. Mara nyingi, mifumo hutolewa na watengenezaji tofauti, na data iliyoagizwa lazima ipitie upatanishi wa data na kuwasilishwa kama data tofauti. Katika mazingira ya biashara, kuna hitaji lisilo na utata - uchambuzi kamili wa data, ambayo inahusisha kutazama ripoti zilizounganishwa kutoka kwa maoni tofauti.

Watengenezaji tofauti wana njia tofauti za kuripoti data. Utaratibu wa uwakilishi tofauti unahusisha dondoo, kubadilisha, na kupakia (ETL). Kwa mfano, katika Huduma za Uchambuzi za Seva ya Microsoft SQL 2005, tatizo la ujumuishaji wa data hutekelezwa kwa kutumia Mionekano ya Chanzo cha Data - aina za vyanzo vya data vinavyoelezea miundo ya uwasilishaji wa uchanganuzi.

Maombi ya biashara kulingana na teknolojia za OLAP, mifano ya bidhaa. Matumizi ya kawaida ya teknolojia ya OLAP ni:

Uchambuzi wa data.

Jukumu ambalo zana maarufu zaidi za OLAP zilitumika hapo awali na bado zimesalia. Muundo wa data wa pande nyingi, uwezo wa kuchanganua kiasi kikubwa cha data na majibu ya haraka kwa maombi hufanya mifumo kama hiyo kuwa muhimu kwa kuchanganua mauzo, shughuli za uuzaji, usambazaji na kazi zingine kwa idadi kubwa ya data ya chanzo.

Mifano ya bidhaa: Microsoft Excel Pivot Tables, Huduma za Uchambuzi wa Microsoft, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Upangaji wa fedha-bajeti.

Mfano wa multidimensional hukuruhusu kuingiza data wakati huo huo na kuchambua kwa urahisi (kwa mfano, panga uchambuzi wa ukweli). Kwa hivyo, idadi ya bidhaa za kisasa za CPM (Usimamizi wa Utendaji wa Biashara) hutumia miundo ya OLAP%. Kazi muhimu ni hesabu ya reverse ya multidimensional (backsolve, breakback, writeback), ambayo inakuwezesha kuhesabu mabadiliko yanayohitajika katika seli za kina wakati thamani ya jumla inabadilika. Ni chombo cha uchambuzi wa nini-ikiwa, i.e. kwa kucheza chaguzi mbalimbali kwa matukio wakati wa kupanga.

Mifano ya bidhaa: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

Uimarishaji wa kifedha.

Ujumuishaji wa data kwa mujibu wa viwango vya kimataifa vya uhasibu, kwa kuzingatia hisa za umiliki, sarafu tofauti na mauzo ya ndani, ni kazi ya dharura kuhusiana na mahitaji yanayozidi kuwa magumu ya mashirika ya ukaguzi (SOX, Basel II) na makampuni kwenda kwa umma. Teknolojia za OLAP zinakuwezesha kuharakisha hesabu ya ripoti zilizounganishwa na kuongeza uwazi wa mchakato mzima.

Mifano ya bidhaa: Oracle FCH, Oracle Hyperion FM, Mdhibiti wa Cognos.

Kuhifadhi Data na teknolojia za Uchanganuzi Mtandaoni (OLAP).
ni vipengele muhimu vya usaidizi wa maamuzi ya biashara, ambayo yanazidi kuwa sehemu muhimu ya sekta yoyote. Utumiaji wa teknolojia za OLAP kama zana ya uchanganuzi wa biashara hutoa udhibiti zaidi na ufikiaji wa kimkakati kwa wakati unaofaa.
habari zinazowezesha kufanya maamuzi kwa ufanisi.
Hii inatoa fursa ya kuiga utabiri wa maisha halisi na kutumia rasilimali kwa ufanisi zaidi. OLAP inaruhusu shirika kujibu kwa haraka zaidi mahitaji ya soko.

Bibliografia:

1. Erik Thomsen. Suluhu za OLAP: Kujenga Mifumo ya Taarifa za Mielekeo mingi Toleo la Pili. Uchapishaji wa Kompyuta ya Wiley John Wiley & Sons, Inc., 2002.

2. Karatasi nyeupe ya baraza la OLAP, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme na Bernhard Ganter. Uchambuzi Rasmi wa Dhana _ Misingi ya Hisabati.

Tuma kazi yako nzuri katika msingi wa maarifa ni rahisi. Tumia fomu iliyo hapa chini

Wanafunzi, wanafunzi waliohitimu, wanasayansi wachanga wanaotumia msingi wa maarifa katika masomo na kazi zao watakushukuru sana.

Iliyotumwa kwenye http://www.allbest.ru/

Kazi ya kozi

nidhamu: Hifadhidata

Mada: TeknolojiaOLAP

Imekamilika:

Chizhikov Alexander Alexandrovich

Utangulizi

1. Uainishaji wa bidhaa za OLAP

2. Mteja wa OLAP - seva ya OLAP: faida na hasara

3. Mfumo wa msingi wa OLAP

3.1 Kanuni za muundo

Hitimisho

Orodha ya vyanzo vilivyotumika

Maombi

KATIKAkuendesha

Ni vigumu kupata mtu katika ulimwengu wa kompyuta ambaye, angalau kwa kiwango cha angavu, haelewi ni hifadhidata gani na kwa nini zinahitajika. Tofauti na DBMS za kimahusiano za kitamaduni, dhana ya OLAP haijulikani sana, ingawa karibu kila mtu labda amesikia neno la kushangaza " cubes za OLAP". Usindikaji wa Uchanganuzi wa Mtandaoni ni nini?

OLAP si bidhaa tofauti ya programu, si lugha ya programu, au hata teknolojia mahususi. Ikiwa tutajaribu kufunika OLAP katika maonyesho yake yote, basi ni seti ya dhana, kanuni na mahitaji ambayo yanasisitiza bidhaa za programu ambazo hufanya iwe rahisi kwa wachambuzi kufikia data. Ingawa hakuna mtu ambaye angepingana na ufafanuzi kama huo, inatia shaka kwamba ingewaleta wasio wataalamu hata chembe moja ya kuelewa somo. Kwa hivyo, katika hamu yako ya kuelewa OLAP, ni bora kuchukua njia tofauti. Kwanza, tunahitaji kujua ni kwa nini wachambuzi wanahitaji kwa namna fulani kuwezesha ufikiaji wa data.

Ukweli ni kwamba wachambuzi ni watumiaji maalum wa habari za ushirika. Kazi ya mchambuzi ni kutafuta ruwaza katika kiasi kikubwa cha data. Kwa hivyo, mchambuzi hatazingatia ukweli mmoja, anahitaji habari kuhusu mamia na maelfu ya matukio. Kwa njia, moja ya pointi muhimu ambayo imesababisha kuibuka kwa OLAP ni tija na ufanisi. Hebu tufikirie nini kinatokea wakati mchambuzi anahitaji kupata taarifa, lakini hakuna zana za OLAP katika biashara. Mchanganuzi kwa kujitegemea (jambo ambalo haliwezekani) au kwa usaidizi wa mpangaji programu hufanya swali linalofaa la SQL na hupokea data ya riba katika mfumo wa ripoti au kuisafirisha kwa lahajedwali. Katika kesi hii, shida nyingi huibuka. Kwanza, mchambuzi analazimika kufanya kitu kingine isipokuwa kazi yake (programu ya SQL) au kungojea waandaaji wa programu kukamilisha kazi yake - yote haya huathiri vibaya tija ya kazi, kiwango cha mshtuko wa moyo na kiharusi huongezeka, na kadhalika. Pili, ripoti moja au meza, kama sheria, haiokoi makubwa ya mawazo na baba wa uchambuzi wa Kirusi - na utaratibu wote utalazimika kurudiwa tena na tena. Tatu, kama tumegundua, wachambuzi hawaulizi juu ya vitapeli - wanahitaji kila kitu mara moja. Hii inamaanisha (ingawa teknolojia inaendelea kwa kasi na mipaka) kwamba seva ya DBMS ya uhusiano inayofikiwa na mchambuzi inaweza kufikiria kwa kina na kwa muda mrefu, kuzuia shughuli zingine.

Wazo la OLAP lilionekana kwa usahihi kutatua shida kama hizo. cubes OLAP kimsingi ni ripoti za meta. Kwa kukata ripoti za meta (cubes, ambayo ni) kulingana na vipimo, mchambuzi hupokea ripoti za "kawaida" za pande mbili ambazo zinamvutia (hizi sio ripoti kwa maana ya kawaida ya neno - tunazungumza juu ya muundo wa data na kazi sawa). Faida za cubes ni dhahiri - data inahitaji kuombwa kutoka kwa DBMS ya uhusiano mara moja tu - wakati wa kujenga mchemraba. Kwa kuwa wachambuzi, kama sheria, hawafanyi kazi na habari ambayo inaongezewa na kubadilishwa kwa kuruka, mchemraba unaozalishwa unafaa kwa muda mrefu sana. Shukrani kwa hili, sio tu usumbufu katika uendeshaji wa seva ya DBMS huondolewa (hakuna maswali na maelfu na mamilioni ya mistari ya majibu), lakini kasi ya upatikanaji wa data kwa mchambuzi mwenyewe pia huongezeka kwa kasi. Kwa kuongezea, kama ilivyoonyeshwa tayari, utendaji pia unaboreshwa kwa kuhesabu subsums ya viwango na maadili mengine yaliyojumuishwa wakati mchemraba unajengwa.

Bila shaka, unapaswa kulipa ili kuongeza tija kwa njia hii. Wakati mwingine inasemekana kuwa muundo wa data "hulipuka" - mchemraba wa OLAP unaweza kuchukua makumi au hata mamia ya nafasi zaidi ya data asili.

Kwa kuwa sasa tuna ufahamu mdogo wa jinsi OLAP inavyofanya kazi na inavyotumika, bado inafaa kurasimisha ujuzi wetu kwa kiasi fulani na kutoa vigezo vya OLAP bila tafsiri ya wakati mmoja katika lugha ya kawaida ya binadamu. Vigezo hivi (12 kwa jumla) vilitungwa mwaka 1993 na E.F. Codd - muundaji wa dhana ya DBMS ya uhusiano na, wakati huo huo, OLAP. Hatutazizingatia moja kwa moja, kwa kuwa baadaye zilifanywa upya katika kile kinachoitwa mtihani wa FASMI, ambao huamua mahitaji ya bidhaa za OLAP. FASMI ni kifupi cha jina la kila kipengee cha jaribio:

Haraka (haraka). Mali hii ina maana kwamba mfumo lazima utoe jibu kwa ombi la mtumiaji kwa wastani wa sekunde tano; hata hivyo, maombi mengi yanashughulikiwa ndani ya sekunde moja, na maombi magumu zaidi yanapaswa kushughulikiwa ndani ya sekunde ishirini. Uchunguzi wa hivi majuzi umeonyesha kuwa mtumiaji huanza kutilia shaka mafanikio ya ombi ikiwa inachukua zaidi ya sekunde thelathini.

Uchambuzi (uchambuzi). Mfumo lazima uweze kushughulikia uchanganuzi wowote wa kimantiki na wa takwimu wa kawaida wa maombi ya biashara, na uhakikishe kuwa matokeo yanahifadhiwa katika fomu inayofikiwa na mtumiaji wa mwisho. Zana za uchanganuzi zinaweza kujumuisha taratibu za kuchanganua mfululizo wa saa, usambazaji wa gharama, ubadilishaji wa sarafu, mabadiliko ya kielelezo katika miundo ya shirika, na baadhi ya mengine.

Imeshirikiwa. Mfumo unapaswa kutoa fursa nyingi za kuzuia upatikanaji wa data na uendeshaji wa wakati mmoja wa watumiaji wengi.

Multidimensional (multidimensional). Mfumo lazima utoe mwonekano wa kimawazo wa data nyingi, ikijumuisha usaidizi kamili kwa safu nyingi.

Habari. Nguvu ya bidhaa mbalimbali za programu ina sifa ya kiasi cha data ya pembejeo iliyochakatwa. Mifumo tofauti ya OLAP ina uwezo tofauti: suluhu za hali ya juu za OLAP zinaweza kushughulikia angalau data mara elfu zaidi kuliko zile zenye nguvu kidogo. Wakati wa kuchagua zana ya OLAP, kuna mambo kadhaa ya kuzingatia, ikiwa ni pamoja na kurudia data, mahitaji ya kumbukumbu, matumizi ya nafasi ya diski, vipimo vya utendaji, ushirikiano na maghala ya habari, na kadhalika.

1. Uainishaji wa bidhaa za OLAP

Kwa hivyo, kiini cha OLAP ni kwamba maelezo ya awali ya uchambuzi yanawasilishwa kwa namna ya mchemraba wa multidimensional, na inawezekana kuibadilisha kiholela na kupata sehemu muhimu za habari - ripoti. Katika hali hii, mtumiaji wa mwisho huona mchemraba kama jedwali linalobadilika la pande nyingi ambalo hutoa muhtasari wa data (ukweli) kiotomatiki katika sehemu mbalimbali (vipimo), na kuruhusu usimamizi shirikishi wa hesabu na fomu ya ripoti. Shughuli hizi hufanywa na injini ya OLAP (au injini ya kukokotoa ya OLAP).

Leo, bidhaa nyingi zimetengenezwa duniani kote zinazotumia teknolojia za OLAP. Ili kurahisisha kuzunguka kati yao, uainishaji wa bidhaa za OLAP hutumiwa: kwa njia ya kuhifadhi data kwa uchambuzi na eneo la mashine ya OLAP. Hebu tuangalie kwa karibu kila aina ya bidhaa za OLAP.

Nitaanza na uainishaji kulingana na njia ya kuhifadhi data. Acha nikukumbushe kwamba cubes za multidimensional zimejengwa kwa msingi wa chanzo na data ya jumla. Data ya chanzo na jumla ya mchemraba inaweza kuhifadhiwa katika hifadhidata za uhusiano na zenye nyanja nyingi. Kwa hiyo, mbinu tatu za kuhifadhi data zinatumika kwa sasa: MOLAP (Multidimensional OLAP), ROLAP (Relational OLAP) na HOLAP (Hybrid OLAP). Ipasavyo, bidhaa za OLAP zimegawanywa katika kategoria tatu zinazofanana kulingana na njia ya uhifadhi wa data:

1.Kwa upande wa MOLAP, data ya chanzo na jumla huhifadhiwa katika hifadhidata yenye pande nyingi au katika mchemraba wa ndani wenye pande nyingi.

2.Katika bidhaa za ROLAP, data chanzo huhifadhiwa katika hifadhidata za uhusiano au katika jedwali tambarare la ndani kwenye seva ya faili. Data ya jumla inaweza kuwekwa kwenye jedwali la huduma katika hifadhidata sawa. Ubadilishaji wa data kutoka kwa hifadhidata ya uhusiano hadi cubes ya multidimensional hutokea kwa ombi la zana ya OLAP.

3. Wakati wa kutumia usanifu wa HOLAP, data ya chanzo inabakia katika hifadhidata ya uhusiano, na majumuisho yanawekwa kwenye multidimensional moja. Mchemraba wa OLAP hujengwa kwa ombi la zana ya OLAP kulingana na data ya uhusiano na ya pande nyingi.

Uainishaji unaofuata unategemea eneo la mashine ya OLAP. Kulingana na kipengele hiki, bidhaa za OLAP zimegawanywa katika seva za OLAP na wateja wa OLAP:

Katika zana za OLAP za seva, mahesabu na uhifadhi wa data ya jumla hufanywa na mchakato tofauti - seva. Programu ya mteja hupokea tu matokeo ya maswali dhidi ya cubes za multidimensional ambazo zimehifadhiwa kwenye seva. Baadhi ya seva za OLAP zinaauni uhifadhi wa data katika hifadhidata za uhusiano pekee, zingine katika hifadhidata nyingi pekee. Seva nyingi za kisasa za OLAP zinatumia mbinu zote tatu za kuhifadhi data: MOLAP, ROLAP na HOLAP.

Kiteja cha OLAP kimeundwa tofauti. Ujenzi wa mchemraba wa multidimensional na mahesabu ya OLAP hufanyika katika kumbukumbu ya kompyuta ya mteja. Wateja wa OLAP pia wamegawanywa katika ROLAP na MOLAP. Na zingine zinaweza kusaidia chaguzi zote mbili za ufikiaji wa data.

Kila moja ya njia hizi ina faida na hasara zake. Kinyume na imani maarufu kuhusu faida za zana za seva juu ya zana za mteja, katika hali kadhaa, kutumia mteja wa OLAP kwa watumiaji kunaweza kuwa na ufanisi zaidi na faida kuliko kutumia seva ya OLAP.

2. Mteja wa OLAP - seva ya OLAP: faida na hasara

Wakati wa kuunda mfumo wa habari, utendakazi wa OLAP unaweza kutekelezwa kwa kutumia seva na zana za mteja za OLAP. Kwa mazoezi, chaguo ni biashara kati ya utendaji na gharama ya programu.

Kiasi cha data imedhamiriwa na mchanganyiko wa sifa zifuatazo: idadi ya rekodi, idadi ya vipimo, idadi ya vipengele vya mwelekeo, urefu wa vipimo na idadi ya ukweli. Inajulikana kuwa seva ya OLAP inaweza kuchakata kiasi kikubwa cha data kuliko mteja wa OLAP na nguvu sawa za kompyuta. Hii ni kwa sababu seva ya OLAP huhifadhi hifadhidata ya pande nyingi iliyo na cubes zilizokokotwa mapema kwenye diski kuu.

Wakati wa kufanya shughuli za OLAP, programu za mteja hutekeleza maswali juu yake kwa lugha inayofanana na SQL, haipokei mchemraba mzima, lakini vipande vyake vilivyoonyeshwa. Kiteja cha OLAP lazima kiwe na mchemraba mzima katika RAM wakati wa operesheni. Katika kesi ya usanifu wa ROLAP, ni muhimu kwanza kupakia kwenye kumbukumbu safu nzima ya data inayotumiwa kuhesabu mchemraba. Zaidi ya hayo, kadiri idadi ya vipimo, ukweli au vipimo inavyoongezeka, idadi ya mijumuisho huongezeka kwa kasi. Kwa hivyo, kiasi cha data iliyochakatwa na mteja wa OLAP inategemea moja kwa moja kiasi cha RAM kwenye PC ya mtumiaji.

Hata hivyo, kumbuka kuwa wateja wengi wa OLAP hutoa kompyuta iliyosambazwa. Kwa hivyo, idadi ya rekodi zilizochakatwa, ambayo huweka kikomo kazi ya zana ya mteja ya OLAP, inaeleweka si kama kiasi cha data msingi katika hifadhidata ya shirika, lakini kama saizi ya sampuli iliyojumlishwa kutoka kwayo. Kiteja cha OLAP hutoa ombi kwa DBMS, ambayo inaelezea masharti ya uchujaji na kanuni ya kuweka data ya msingi katika vikundi. Seva hupata, kuweka rekodi kwa vikundi na kurudisha chaguo fupi kwa hesabu zaidi za OLAP. Ukubwa wa sampuli hii unaweza kuwa makumi au mamia ya mara ndogo kuliko ujazo wa rekodi za msingi, zisizojumlishwa. Kwa hivyo, hitaji la mteja kama huyo wa OLAP katika rasilimali za PC imepunguzwa sana.

Kwa kuongeza, idadi ya vipimo inakabiliwa na mapungufu katika mtazamo wa kibinadamu. Inajulikana kuwa mtu wa kawaida anaweza kufanya kazi wakati huo huo na 3-4, upeo wa vipimo 8. Kwa idadi kubwa ya vipimo katika jedwali la nguvu, mtazamo wa habari unakuwa mgumu zaidi. Sababu hii inapaswa kuzingatiwa wakati wa kuhesabu RAM ambayo inaweza kuhitajika na mteja wa OLAP.

Urefu wa vipimo pia huathiri ukubwa wa nafasi ya anwani ya injini ya OLAP wakati wa kukokotoa mchemraba wa OLAP. Kadiri vipimo virefu, ndivyo rasilimali nyingi zaidi zinahitajika ili kupanga safu ya pande nyingi, na kinyume chake. Vipimo vifupi tu katika data chanzo ni hoja nyingine inayopendelea mteja wa OLAP.

Tabia hii imedhamiriwa na mambo mawili yaliyojadiliwa hapo juu: kiasi cha data iliyochakatwa na nguvu za kompyuta. Kadiri idadi, kwa mfano, ya vipimo inavyoongezeka, utendakazi wa zana zote za OLAP hupungua kutokana na ongezeko kubwa la idadi ya jumla, lakini kasi ya kupungua ni tofauti. Wacha tuonyeshe utegemezi huu kwenye grafu.

Mpango wa 1. Utegemezi wa utendaji wa mteja na seva zana za OLAP juu ya ongezeko la kiasi cha data

Sifa za kasi za seva ya OLAP si nyeti sana kwa ukuaji wa data. Hii inafafanuliwa na teknolojia tofauti za kuchakata maombi ya mtumiaji na seva ya OLAP na mteja wa OLAP. Kwa mfano, wakati wa operesheni ya kuchimba visima, seva ya OLAP hufikia data iliyohifadhiwa na "kuvuta" data kutoka kwa "tawi" hili. Kiteja cha OLAP huhesabu seti nzima ya jumla wakati wa kupakia. Hata hivyo, hadi kiasi fulani cha data, utendaji wa seva na zana za mteja ni kulinganishwa. Kwa wateja wa OLAP wanaotumia kompyuta iliyosambazwa, upeo wa ulinganifu wa utendakazi unaweza kuenea hadi kiasi cha data ambacho kinashughulikia mahitaji ya uchanganuzi wa OLAP ya idadi kubwa ya watumiaji. Hii inathibitishwa na matokeo ya majaribio ya ndani ya Seva ya MS OLAP na mteja wa OLAP "Kontur Standard". Jaribio lilifanywa kwenye IBM PC Pentium Celeron 400 MHz, 256 Mb kwa sampuli ya rekodi milioni 1 za kipekee (yaani, zilizojumlishwa) zenye vipimo 7 vilivyo na wanachama 10 hadi 70. Muda wa upakiaji wa mchemraba katika matukio yote mawili hauzidi sekunde 1, na shughuli mbalimbali za OLAP (kuchimba, kuchimba chini, kusonga, chujio, nk) zinakamilika kwa mia moja ya pili.

Wakati ukubwa wa sampuli unazidi kiasi cha RAM, kubadilishana na diski huanza na utendaji wa mteja wa OLAP hupungua kwa kasi. Ni kutoka wakati huu tu tunaweza kuzungumza juu ya faida ya seva ya OLAP.

Inapaswa kukumbuka kuwa "hatua ya kuvunja" huamua kikomo cha ongezeko kubwa la gharama ya ufumbuzi wa OLAP. Kwa kazi za kila mtumiaji mahususi, hatua hii inabainishwa kwa urahisi na majaribio ya utendaji ya mteja wa OLAP. Vipimo vile vinaweza kupatikana kutoka kwa kampuni ya maendeleo.

Kwa kuongeza, gharama ya suluhisho la OLAP ya seva huongezeka kadri idadi ya watumiaji inavyoongezeka. Ukweli ni kwamba seva ya OLAP hufanya mahesabu kwa watumiaji wote kwenye kompyuta moja. Ipasavyo, idadi kubwa ya watumiaji, ndivyo RAM zaidi na nguvu ya usindikaji. Kwa hivyo, ikiwa idadi ya data inayochakatwa iko katika eneo la utendaji unaolinganishwa wa seva na mifumo ya mteja, basi, vitu vingine kuwa sawa, kutumia mteja wa OLAP itakuwa faida zaidi.

Kutumia seva ya OLAP katika itikadi ya "classical" inahusisha kupakia data ya DBMS ya uhusiano kwenye hifadhidata ya pande nyingi. Upakiaji unafanywa kwa muda fulani, kwa hivyo data ya seva ya OLAP haionyeshi hali ya sasa. Ni seva zile za OLAP tu zinazotumia hali ya uendeshaji ya ROLAP ambazo hazina kasoro hii.

Vile vile, idadi ya wateja wa OLAP hukuruhusu kutekeleza usanifu wa ROLAP na Eneo-kazi kwa ufikiaji wa moja kwa moja kwenye hifadhidata. Hii inahakikisha uchanganuzi wa mtandaoni wa data chanzo.

Seva ya OLAP inaweka mahitaji machache juu ya nguvu za vituo vya mteja. Kwa makusudi, mahitaji ya mteja wa OLAP ni ya juu zaidi, kwa sababu... hufanya mahesabu katika RAM ya PC ya mtumiaji. Hali ya meli ya vifaa vya shirika fulani ni kiashiria muhimu zaidi ambacho kinapaswa kuzingatiwa wakati wa kuchagua chombo cha OLAP. Lakini pia kuna "faida" na "hasara" hapa. Seva ya OLAP haitumii uwezo mkubwa wa kompyuta wa kompyuta za kisasa za kibinafsi. Ikiwa shirika tayari lina kundi la Kompyuta za kisasa, haifai kuzitumia tu kama vituo vya kuonyesha na wakati huo huo huingiza gharama za ziada kwa seva kuu.

Ikiwa nguvu ya kompyuta za watumiaji "itaacha kuhitajika," mteja wa OLAP atafanya kazi polepole au hawezi kufanya kazi kabisa. Kununua seva moja yenye nguvu inaweza kuwa nafuu kuliko kuboresha Kompyuta zako zote.

Hapa ni muhimu kuzingatia mwenendo katika maendeleo ya vifaa. Kwa kuwa kiasi cha data kwa ajili ya uchambuzi ni kivitendo mara kwa mara, ongezeko la kasi la nguvu za Kompyuta litasababisha upanuzi wa uwezo wa wateja wa OLAP na uhamisho wao wa seva za OLAP kwenye sehemu ya hifadhidata kubwa sana.

Unapotumia seva ya OLAP kwenye mtandao, data itakayoonyeshwa pekee ndiyo inayohamishiwa kwa Kompyuta ya mteja, huku mteja wa OLAP akipokea kiasi kizima cha data ya msingi.

Kwa hiyo, ambapo mteja wa OLAP hutumiwa, trafiki ya mtandao itakuwa ya juu.

Lakini, wakati wa kutumia seva ya OLAP, shughuli za mtumiaji, kwa mfano, maelezo, hutoa maswali mapya kwenye hifadhidata ya multidimensional, na, kwa hiyo, uhamisho wa data mpya. Utekelezaji wa shughuli za OLAP na mteja wa OLAP unafanywa katika RAM na, ipasavyo, haisababishi mtiririko mpya wa data kwenye mtandao.

Inapaswa pia kuzingatiwa kuwa vifaa vya kisasa vya mtandao hutoa viwango vya juu vya upitishaji.

Kwa hiyo, katika idadi kubwa ya matukio, kuchambua hifadhidata ya ukubwa wa "wa kati" kwa kutumia mteja wa OLAP haitapunguza kasi ya kazi ya mtumiaji.

Gharama ya seva ya OLAP ni ya juu kabisa. Hii inapaswa pia kujumuisha gharama ya kompyuta iliyojitolea na gharama zinazoendelea za kusimamia hifadhidata ya pande nyingi. Kwa kuongezea, utekelezaji na matengenezo ya seva ya OLAP inahitaji wafanyikazi waliohitimu sana.

Gharama ya mteja wa OLAP ni agizo la ukubwa wa chini kuliko gharama ya seva ya OLAP. Hakuna utawala au vifaa vya ziada vya kiufundi vinavyohitajika kwa seva. Hakuna mahitaji ya juu ya sifa za wafanyikazi wakati wa kutekeleza mteja wa OLAP. Kiteja cha OLAP kinaweza kutekelezwa kwa haraka zaidi kuliko seva ya OLAP.

Uundaji wa programu za uchanganuzi kwa kutumia zana za mteja za OLAP ni mchakato wa haraka na hauhitaji mafunzo maalum. Mtumiaji anayejua utekelezaji halisi wa hifadhidata anaweza kuunda programu ya uchanganuzi kwa kujitegemea, bila kuhusika na mtaalamu wa IT. Unapotumia seva ya OLAP, unahitaji kujifunza mifumo 2 tofauti, wakati mwingine kutoka kwa wauzaji tofauti - kuunda cubes kwenye seva, na kuendeleza maombi ya mteja. Kiteja cha OLAP hutoa kiolesura kimoja cha kuona cha kuelezea cubes na kusanidi violesura vya watumiaji.

Wacha tupitie mchakato wa kuunda programu ya OLAP kwa kutumia zana ya mteja.

Mchoro wa 2. Kuunda programu ya OLAP kwa kutumia zana ya mteja ya ROLAP

Kanuni ya uendeshaji wa wateja wa ROLAP ni maelezo ya awali ya safu ya kisemantiki, nyuma ambayo muundo wa kimwili wa data chanzo umefichwa. Katika kesi hii, vyanzo vya data vinaweza kuwa: meza za mitaa, RDBMS. Orodha ya vyanzo vya data vinavyotumika huamuliwa na bidhaa mahususi ya programu. Baada ya hayo, mtumiaji anaweza kuendesha kwa uhuru vitu ambavyo anaelewa kwa suala la eneo la somo ili kuunda cubes na miingiliano ya uchambuzi.

Kanuni ya uendeshaji wa mteja wa seva ya OLAP ni tofauti. Katika seva ya OLAP, wakati wa kuunda cubes, mtumiaji hubadilisha maelezo ya kimwili ya hifadhidata.

Wakati huo huo, maelezo ya desturi yanaundwa katika mchemraba yenyewe. Kiteja cha seva ya OLAP kimesanidiwa kwa mchemraba pekee.

Hebu tueleze kanuni ya uendeshaji wa mteja wa ROLAP kwa kutumia mfano wa kuunda ripoti ya mauzo ya nguvu (angalia Mchoro 2). Acha data ya awali ya uchanganuzi ihifadhiwe katika jedwali mbili: Uuzaji na Mkataba.

Wakati wa kuunda safu ya kisemantiki, vyanzo vya data - majedwali ya Mauzo na Ofa - hufafanuliwa kwa maneno ambayo mtumiaji wa mwisho anaweza kuelewa na kugeuka kuwa "Bidhaa" na "Ofa". Sehemu ya "Kitambulisho" kutoka kwa jedwali la "Bidhaa" inaitwa jina la "Msimbo", na "Jina" hadi "Bidhaa", nk.

Kisha kitu cha biashara ya Uuzaji kinaundwa. Kitu cha biashara ni meza ya gorofa kwa misingi ambayo mchemraba wa multidimensional huundwa. Wakati wa kuunda kitu cha biashara, meza za "Bidhaa" na "Shughuli" zinaunganishwa na uwanja wa "Msimbo" wa bidhaa. Kwa kuwa sehemu zote za jedwali hazihitajiki kuonyeshwa kwenye ripoti, kitu cha biashara kinatumia sehemu za "Kipengee", "Tarehe" na "Kiasi".

Kisha, ripoti ya OLAP inaundwa kulingana na kitu cha biashara. Mtumiaji huchagua kitu cha biashara na kuburuta sifa zake hadi kwenye safu wima au maeneo ya safu mlalo ya jedwali la ripoti. Katika mfano wetu, kulingana na kitu cha biashara cha "Mauzo", ripoti ya mauzo ya bidhaa kwa mwezi iliundwa.

Wakati wa kufanya kazi na ripoti ya mwingiliano, mtumiaji anaweza kuweka hali ya kuchuja na kuweka kambi kwa miondoko sawa ya panya. Katika hatua hii, mteja wa ROLAP hufikia data kwenye kache. Kiteja cha seva ya OLAP hutoa swali jipya kwa hifadhidata ya pande nyingi. Kwa mfano, kwa kutumia kichujio kulingana na bidhaa katika ripoti ya mauzo, unaweza kupata ripoti ya mauzo ya bidhaa zinazotuvutia.

Mipangilio yote ya programu ya OLAP inaweza kuhifadhiwa katika hazina maalum ya metadata, katika programu, au katika hazina ya mfumo wa hifadhidata nyingi. Utekelezaji unategemea bidhaa maalum ya programu.

Kwa hivyo, ni katika hali gani kutumia mteja wa OLAP kunaweza kuwa na ufanisi zaidi na faida kwa watumiaji kuliko kutumia seva ya OLAP?

Uwezekano wa kiuchumi wa kutumia seva ya OLAP hutokea wakati kiasi cha data ni kikubwa sana na kinamshinda mteja wa OLAP, vinginevyo matumizi ya seva ya pili ni ya haki zaidi. Katika kesi hii, mteja wa OLAP huchanganya sifa za juu za utendaji na gharama ya chini.

Kompyuta zenye nguvu kwa wachambuzi ni hoja nyingine inayounga mkono wateja wa OLAP. Unapotumia seva ya OLAP, uwezo huu hautumiwi. Miongoni mwa faida za wateja wa OLAP ni zifuatazo:

Gharama za kutekeleza na kudumisha mteja wa OLAP ni chini sana kuliko gharama za seva ya OLAP.

Unapotumia mteja wa OLAP na mashine iliyopachikwa, data huhamishwa kwenye mtandao mara moja. Wakati wa kutekeleza shughuli za OLAP, hakuna mitiririko mipya ya data inayotolewa.

Kuweka wateja wa ROLAP hurahisishwa kwa kuondoa hatua ya kati - kuunda hifadhidata ya pande nyingi.

3. Mfumo wa msingi wa OLAP

3.1 Kanuni za muundo

data ya msingi ya mteja wa programu

Kutokana na kile ambacho tayari kimesemwa, ni wazi kwamba utaratibu wa OLAP ni mojawapo ya mbinu maarufu za uchambuzi wa data leo. Kuna njia mbili kuu za kutatua shida hii. Ya kwanza yao inaitwa Multidimensional OLAP (MOLAP) - utekelezaji wa utaratibu kwa kutumia database multidimensional upande wa seva, na ya pili Relational OLAP (ROLAP) - kujenga cubes juu ya kuruka kulingana na maswali ya SQL kwa DBMS ya uhusiano. Kila moja ya njia hizi ina faida na hasara zake. Uchambuzi wao wa kulinganisha uko nje ya upeo wa kazi hii. Utekelezaji wa kimsingi wa moduli ya ROLAP ya eneo-kazi ndiyo pekee ndiyo itakayoelezwa hapa.

Kazi hii ilitokea baada ya kutumia mfumo wa ROLAP uliojengwa kwa misingi ya vipengele vya Decision Cube vilivyojumuishwa katika Borland Delphi. Kwa bahati mbaya, matumizi ya seti hii ya vipengele ilionyesha utendaji duni kwa kiasi kikubwa cha data. Tatizo hili linaweza kupunguzwa kwa kujaribu kukata data nyingi iwezekanavyo kabla ya kulisha kwenye cubes. Lakini hii haitoshi kila wakati.

Unaweza kupata habari nyingi kuhusu mifumo ya OLAP kwenye mtandao na kwenye vyombo vya habari, lakini karibu popote inasemwa kuhusu jinsi inavyofanya kazi ndani.

Mpango wa kazi:

Mpango wa jumla wa uendeshaji wa mfumo wa OLAP wa eneo-kazi unaweza kuwakilishwa kama ifuatavyo:

Mchoro 3. Uendeshaji wa mfumo wa OLAP wa eneo-kazi

Algorithm ya uendeshaji ni kama ifuatavyo:

1. Kupata data katika mfumo wa jedwali bapa au matokeo ya kutekeleza swali la SQL.

2.Kuhifadhi data na kuibadilisha kuwa mchemraba wa multidimensional.

3.Kuonyesha mchemraba uliojengwa kwa kutumia kichupo cha msalaba au chati, nk. Kwa ujumla, idadi ya maoni ya kiholela inaweza kushikamana na mchemraba mmoja.

Hebu fikiria jinsi mfumo huo unaweza kupangwa ndani. Tutaanza kutoka upande ambao unaweza kuonekana na kuguswa, yaani, kutoka kwa maonyesho. Maonyesho yanayotumiwa katika mifumo ya OLAP mara nyingi huja katika aina mbili - tabo mtambuka na chati. Hebu tuangalie crosstab, ambayo ni njia ya msingi na ya kawaida ya kuonyesha mchemraba.

Katika mchoro ulio hapa chini, safu mlalo na safu wima zilizo na matokeo yaliyojumlishwa huonyeshwa kwa rangi ya manjano, seli zilizo na ukweli ziko katika kijivu kisichokolea, na seli zilizo na data ya vipimo ziko katika kijivu iliyokolea.

Kwa hivyo, meza inaweza kugawanywa katika mambo yafuatayo, ambayo tutafanya kazi nayo katika siku zijazo:

Wakati wa kujaza matrix na ukweli, lazima tuendelee kama ifuatavyo:

Kulingana na data ya kipimo, tambua viwianishi vya kipengele kitakachoongezwa kwenye tumbo.

Tambua kuratibu za safuwima na safu za jumla zinazoathiriwa na kipengele kilichoongezwa.

Ongeza kipengele kwenye matrix na jumla ya safu wima na safu mlalo zinazolingana.

Ikumbukwe kwamba matrix inayosababisha itakuwa ndogo sana, ndiyo sababu shirika lake kwa namna ya safu mbili-dimensional (chaguo lililolala juu ya uso) sio tu lisilo na maana, lakini, uwezekano mkubwa, haiwezekani kutokana na kubwa. kipimo cha matrix hii, kwa kuhifadhi ambayo hakuna Hakuna kiasi cha RAM kinatosha. Kwa mfano, ikiwa mchemraba wetu una habari kuhusu mauzo kwa mwaka mmoja, na ikiwa ina vipimo 3 pekee - Wateja (250), Bidhaa (500) na Tarehe (365), basi tutapata matrix ya ukweli ya vipimo vifuatavyo: nambari. ya vipengele = 250 x 500 x 365 = 45,625,000. Na hii licha ya ukweli kwamba kunaweza kuwa na vipengele elfu chache tu vilivyojaa kwenye tumbo. Zaidi ya hayo, idadi kubwa ya vipimo, matrix itakuwa ndogo zaidi.

Kwa hivyo, kufanya kazi na tumbo hili, unahitaji kutumia njia maalum za kufanya kazi na matrices ya sparse. Chaguzi anuwai za kuandaa matrix ya sparse zinawezekana. Wameelezewa vizuri katika fasihi ya programu, kwa mfano, katika juzuu ya kwanza ya kitabu cha classic "Sanaa ya Kupanga" na Donald Knuth.

Acheni sasa tuchunguze jinsi tunaweza kuamua kuratibu za ukweli, tukijua vipimo vinavyoendana nayo. Ili kufanya hivyo, hebu tuangalie kwa karibu muundo wa kichwa:

Katika kesi hii, unaweza kupata urahisi njia ya kuamua nambari za seli inayolingana na jumla ambayo huanguka. Mbinu kadhaa zinaweza kupendekezwa hapa. Moja ni kutumia mti kutafuta seli zinazolingana. Mti huu unaweza kujengwa kwa kupitisha uteuzi. Kwa kuongeza, fomula ya ujirudiaji wa uchambuzi inaweza kufafanuliwa kwa urahisi ili kukokotoa uratibu unaohitajika.

Data iliyohifadhiwa kwenye jedwali inahitaji kubadilishwa ili itumike. Kwa hivyo, ili kuboresha utendaji wakati wa kujenga hypercube, ni kuhitajika kupata vipengele vya kipekee vilivyohifadhiwa kwenye safu ambazo ni vipimo vya mchemraba. Kwa kuongeza, unaweza kufanya muunganisho wa awali wa ukweli kwa rekodi ambazo zina maadili ya vipimo sawa. Kama ilivyoelezwa hapo juu, thamani za kipekee zinazopatikana katika sehemu za vipimo ni muhimu kwetu. Kisha muundo ufuatao unaweza kupendekezwa kwa kuhifadhi:

Mpango 4. Muundo wa kuhifadhi maadili ya kipekee

Kwa kutumia muundo huu, tunapunguza kwa kiasi kikubwa mahitaji ya kumbukumbu. Ambayo ni muhimu sana, kwa sababu ... Ili kuongeza kasi ya uendeshaji, ni vyema kuhifadhi data katika RAM. Kwa kuongezea, unaweza tu kuhifadhi safu ya vitu, na kutupa maadili yao kwenye diski, kwani tutazihitaji tu wakati wa kuonyesha kichupo cha msalaba.

Mawazo yaliyoelezwa hapo juu yalikuwa msingi wa kuunda maktaba ya sehemu ya CubeBase.

Mchoro 5. Muundo wa maktaba ya sehemu ya CubeBase

TСubeSource hufanya akiba na ubadilishaji wa data kuwa umbizo la ndani, pamoja na ujumlishaji wa awali wa data. Sehemu ya TCubeEngine hufanya mahesabu ya hypercube na shughuli nayo. Kwa kweli, ni injini ya OLAP ambayo inabadilisha jedwali la gorofa kuwa seti ya data ya multidimensional. Kipengele cha TCubeGrid kinaonyesha kichupo mtambuka na kudhibiti onyesho la hypercube. TСubeChart inakuwezesha kuona hypercube kwa namna ya grafu, na sehemu ya TСubePivote inadhibiti uendeshaji wa msingi wa mchemraba.

Kwa hiyo, niliangalia usanifu na mwingiliano wa vipengele vinavyoweza kutumika kujenga mashine ya OLAP. Sasa hebu tuangalie kwa karibu muundo wa ndani wa vipengele.

Hatua ya kwanza ya mfumo itakuwa kupakia data na kuibadilisha kuwa umbizo la ndani. Swali la kimantiki litakuwa: kwa nini hii ni muhimu, kwani unaweza kutumia tu data kutoka kwa meza ya gorofa, ukiangalia wakati wa kuunda kipande cha mchemraba. Ili kujibu swali hili, hebu tuangalie muundo wa meza kutoka kwa mtazamo wa mashine ya OLAP. Kwa mifumo ya OLAP, safu wima za jedwali zinaweza kuwa ukweli au vipimo. Walakini, mantiki ya kufanya kazi na safu hizi itakuwa tofauti. Katika hypercube, vipimo kwa kweli ni shoka, na maadili ya vipimo ni kuratibu kwenye shoka hizo. Katika kesi hii, mchemraba utajazwa kwa usawa sana - kutakuwa na mchanganyiko wa kuratibu ambao hautaambatana na rekodi yoyote na kutakuwa na mchanganyiko unaolingana na rekodi kadhaa kwenye jedwali la asili, na hali ya kwanza ni ya kawaida zaidi, ambayo ni. , mchemraba utakuwa sawa na ulimwengu - nafasi tupu, katika baadhi ya maeneo ambayo kuna makundi ya pointi (ukweli). Kwa hivyo, ikiwa tutafanya ujumuishaji wa data wakati wa upakiaji wa awali wa data, ambayo ni, tunachanganya rekodi ambazo zina viwango sawa vya kipimo, wakati wa kuhesabu maadili ya ukweli uliojumlishwa, basi katika siku zijazo tutalazimika kufanya kazi na rekodi chache, ambayo itaongeza kasi ya kazi na kupunguza mahitaji kwa kiasi cha RAM.

Ili kujenga vipande vya hypercube, tunahitaji uwezo wafuatayo - kufafanua kuratibu (maadili ya kipimo halisi) kwa rekodi za meza, pamoja na kufafanua rekodi zilizo na kuratibu maalum (maadili ya kipimo). Hebu fikiria jinsi uwezekano huu unaweza kupatikana. Njia rahisi zaidi ya kuhifadhi hypercube ni kutumia hifadhidata ya umbizo lake la ndani.

Kwa utaratibu, mabadiliko yanaweza kuwakilishwa kama ifuatavyo:

Kielelezo cha 6: Kubadilisha Hifadhidata ya Umbizo la Ndani hadi Hifadhidata Iliyosawazishwa

Hiyo ni, badala ya meza moja, tulipata hifadhidata ya kawaida. Kwa kweli, kuhalalisha hupunguza kasi ya mfumo, wataalam wa hifadhidata wanaweza kusema, na katika hili hakika watakuwa sawa, katika kesi wakati tunahitaji kupata maadili ya vipengele vya kamusi (kwa upande wetu, maadili ya kipimo). Lakini jambo ni kwamba hatuitaji maadili haya hata kidogo katika hatua ya kuunda kipande. Kama ilivyoelezwa hapo juu, tunavutiwa tu na kuratibu kwenye hypercube yetu, kwa hivyo tutafafanua kuratibu kwa maadili ya kipimo. Jambo rahisi kufanya itakuwa kuweka tena nambari za vitu. Ili nambari zisiwe na utata ndani ya kipimo kimoja, kwanza tunapanga orodha za thamani za vipimo (kamusi, katika maneno ya hifadhidata) kwa mpangilio wa alfabeti. Kwa kuongezea, tutahesabu tena ukweli, na ukweli unakusanywa mapema. Tunapata mchoro ufuatao:

Mpango wa 7. Kuweka upya hifadhidata iliyosawazishwa ili kubaini viwianishi vya thamani za vipimo

Sasa kinachobaki ni kuunganisha vipengele vya meza tofauti na kila mmoja. Katika nadharia ya hifadhidata za uhusiano, hii inafanywa kwa kutumia meza maalum za kati. Inatosha kwetu kuhusisha kila kiingilio kwenye jedwali la kipimo na orodha, vitu ambavyo vitakuwa nambari za ukweli katika uundaji ambao vipimo hivi vilitumiwa (ambayo ni, kuamua ukweli wote ambao una thamani sawa. uratibu ulioelezewa na kipimo hiki). Kwa ukweli, kila rekodi italinganishwa na maadili ya kuratibu ambayo iko kwenye hypercube. Katika siku zijazo, kuratibu za rekodi katika hypercube itaeleweka kama nambari za rekodi zinazolingana katika jedwali la maadili ya kipimo. Halafu kwa mfano wetu wa dhahania tunapata seti ifuatayo inayofafanua uwakilishi wa ndani wa hypercube:

Mchoro 8. Uwakilishi wa ndani wa hypercube

Hii itakuwa uwakilishi wetu wa ndani wa hypercube. Kwa kuwa hatufanyi hivyo kwa hifadhidata ya uhusiano, tunatumia sehemu za urefu tofauti kama sehemu za kuunganisha maadili ya kipimo (hatungeweza kufanya hivyo katika RDB, kwani idadi ya safu wima imedhamiriwa hapo awali).

Tunaweza kujaribu kutumia seti ya majedwali ya muda kutekeleza hypercube, lakini njia hii itatoa utendaji wa chini sana (kwa mfano, seti ya vipengele vya Decision Cube), kwa hivyo tutatumia miundo yetu ya kuhifadhi data.

Ili kutekeleza hypercube, tunahitaji kutumia miundo ya data ambayo itahakikisha utendaji wa juu na matumizi ya RAM kidogo. Ni wazi, miundo yetu kuu itakuwa ya kuhifadhi kamusi na meza za ukweli. Wacha tuangalie kazi ambazo kamusi lazima ifanye kwa kasi ya juu:

kuangalia uwepo wa kipengele katika kamusi;

kuongeza kipengele kwenye kamusi;

tafuta nambari za rekodi ambazo zina thamani maalum ya kuratibu;

tafuta kuratibu kwa thamani ya kipimo;

kutafuta thamani ya kipimo kwa kuratibu zake.

Aina na miundo mbalimbali ya data inaweza kutumika kutekeleza mahitaji haya. Kwa mfano, unaweza kutumia safu za miundo. Katika hali halisi, safu hizi zinahitaji njia za ziada za kuorodhesha ambazo zitaongeza kasi ya upakiaji wa data na kurejesha habari.

Ili kuongeza utendakazi wa hypercube, ni muhimu kuamua ni kazi gani zinahitaji kutatuliwa kama suala la kipaumbele, na kwa vigezo gani tunahitaji kuboresha ubora wa kazi. Jambo kuu kwetu ni kuongeza kasi ya programu, wakati ni kuhitajika kuwa sio kiasi kikubwa cha RAM kinachohitajika. Kuongezeka kwa utendaji kunawezekana kupitia kuanzishwa kwa taratibu za ziada za kupata data, kwa mfano, kuanzishwa kwa indexing. Kwa bahati mbaya, hii huongeza juu ya RAM. Kwa hiyo, tutaamua ni shughuli gani tunahitaji kufanya kwa kasi ya juu. Ili kufanya hivyo, fikiria vipengele vya mtu binafsi vinavyotekeleza hypercube. Vipengele hivi vina aina mbili kuu - dimension na ukweli meza. Kwa kipimo, kazi ya kawaida itakuwa:

kuongeza thamani mpya;

kuamua kuratibu kulingana na thamani ya kipimo;

uamuzi wa thamani kwa kuratibu.

Wakati wa kuongeza thamani mpya ya kipengele, tunahitaji kuangalia ikiwa tayari tuna thamani kama hiyo, na ikiwa ni hivyo, basi usiongeze mpya, lakini tumia uratibu uliopo, vinginevyo tunahitaji kuongeza kipengele kipya na kuamua kuratibu kwake. Ili kufanya hivyo, unahitaji njia ya kupata haraka uwepo wa kipengele kinachohitajika (kwa kuongeza, tatizo hilo hutokea wakati wa kuamua kuratibu kwa thamani ya kipengele). Kwa kusudi hili, ni bora kutumia hashing. Katika kesi hii, muundo bora utakuwa kutumia miti ya hashi ambayo tutahifadhi marejeleo ya vipengee. Katika kesi hii, vipengele vitakuwa mistari ya kamusi ya mwelekeo. Kisha muundo wa thamani ya kipimo unaweza kuwakilishwa kama ifuatavyo:

PFactLink = ^TFactLink;

TFactLink = rekodi

UkweliNo: nambari kamili; // faharisi ya ukweli kwenye jedwali

TDimensionRecord = rekodi

Thamani: kamba; // thamani ya kipimo

Index: integer; // kuratibu thamani

FactLink: PFactLink; // pointer kwa mwanzo wa orodha ya vipengele vya meza ya ukweli

Na katika mti wa hashi tutahifadhi viungo vya vipengele vya kipekee. Kwa kuongeza, tunahitaji kutatua tatizo la mabadiliko ya kinyume - kwa kutumia kuratibu ili kuamua thamani ya kipimo. Ili kuhakikisha utendaji wa juu, kushughulikia moja kwa moja inapaswa kutumika. Kwa hiyo, unaweza kutumia safu nyingine, index ambayo ni kuratibu ya mwelekeo, na thamani ni kiungo kwa ingizo sambamba katika kamusi. Walakini, unaweza kuifanya iwe rahisi (na uhifadhi kwenye kumbukumbu) ikiwa utapanga safu ya vitu ipasavyo ili faharisi ya kitu hicho ni kuratibu kwake.

Kupanga safu inayotekelezea orodha ya ukweli haitoi shida zozote kwa sababu ya muundo wake rahisi. Hoja pekee itakuwa kwamba inashauriwa kukokotoa mbinu zote za kujumlisha ambazo zinaweza kuhitajika na ambazo zinaweza kuhesabiwa kwa kuongezeka (kwa mfano, jumla).

Kwa hivyo, tumeelezea njia ya kuhifadhi data kwa namna ya hypercube. Inakuwezesha kuzalisha seti ya pointi katika nafasi ya multidimensional kulingana na taarifa iliyo kwenye ghala la data. Ili mtu aweze kufanya kazi na data hii, lazima iwasilishwe kwa fomu inayofaa kwa usindikaji. Katika kesi hii, jedwali la egemeo na grafu hutumiwa kama aina kuu za uwasilishaji wa data. Kwa kuongezea, njia hizi zote mbili ni makadirio ya hypercube. Ili kuhakikisha ufanisi wa hali ya juu wakati wa kuunda uwakilishi, tutaanza kutoka kwa kile makadirio haya yanawakilisha. Wacha tuanze na jedwali la egemeo, kama lililo muhimu zaidi kwa uchanganuzi wa data.

Hebu tutafute njia za kutekeleza muundo huo. Kuna sehemu tatu zinazounda jedwali la egemeo: vichwa vya safu mlalo, vichwa vya safu wima, na jedwali halisi la thamani za ukweli zilizojumlishwa. Njia rahisi zaidi ya kuwakilisha jedwali la ukweli ni kutumia safu ya pande mbili, kipimo ambacho kinaweza kuamua kwa kuunda vichwa. Kwa bahati mbaya, njia rahisi zaidi itakuwa isiyofaa zaidi, kwa sababu meza itakuwa ndogo sana, na kumbukumbu itatumika kwa ufanisi sana, kwa sababu ambayo itawezekana kujenga cubes ndogo tu, kwani vinginevyo kunaweza kuwa haitoshi. kumbukumbu. Kwa hivyo, tunahitaji kuchagua muundo wa data kwa ajili ya kuhifadhi habari ambayo itahakikisha kasi ya juu ya kutafuta / kuongeza kipengele kipya na wakati huo huo matumizi ya chini ya RAM. Muundo huu utakuwa kinachoitwa matrices ya sparse, ambayo unaweza kusoma kwa undani zaidi kutoka kwa Knuth. Kuna njia mbalimbali za kupanga matrix. Ili kuchagua chaguo linalofaa kwetu, kwanza tutazingatia muundo wa vichwa vya meza.

Vichwa vina muundo wazi wa kihierarkia, kwa hivyo itakuwa kawaida kudhani kutumia mti kuvihifadhi. Katika kesi hii, muundo wa nodi ya mti unaweza kuonyeshwa kimkakati kama ifuatavyo:

Kiambatisho C

Katika kesi hii, ni busara kuhifadhi kiungo kwa kipengele sambamba cha jedwali la vipimo vya mchemraba wa multidimensional kama thamani ya mwelekeo. Hii itapunguza gharama za kumbukumbu kwa kuhifadhi kipande na kuharakisha kazi. Viungo pia hutumiwa kama nodi za mzazi na mtoto.

Ili kuongeza kipengele kwenye mti, lazima uwe na taarifa kuhusu eneo lake katika hypercube. Kama habari kama hiyo, unahitaji kutumia uratibu wake, ambao umehifadhiwa katika kamusi ya maadili ya kipimo. Wacha tuzingatie mpango wa kuongeza kipengee kwenye kichwa cha jedwali la egemeo. Katika kesi hii, tunatumia maadili ya kuratibu za kipimo kama habari ya awali. Mpangilio ambao vipimo hivi vimeorodheshwa huamuliwa na mbinu ya ujumlishaji inayotakikana na inalingana na viwango vya madaraja ya kichwa. Kama matokeo ya kazi, unahitaji kupata orodha ya safu wima au safu za jedwali la egemeo ambalo unahitaji kuongeza kipengee.

MaombiD

Tunatumia viwianishi vya vipimo kama data ya awali ili kubainisha muundo huu. Kwa kuongezea, kwa uhakika, tutafikiria kuwa tunafafanua safu ya riba kwetu kwenye tumbo (tutazingatia jinsi ya kufafanua safu baadaye kidogo, kwani ni rahisi zaidi kutumia miundo mingine ya data hapo; sababu ya chaguo hili pia tazama hapa chini). Kama kuratibu, tunachukua nambari kamili - nambari za maadili ya kipimo ambazo zinaweza kuamuliwa kama ilivyoelezwa hapo juu.

Kwa hiyo, baada ya kufanya utaratibu huu, tutapata safu ya marejeleo kwa safu za matrix ya sparse. Sasa unahitaji kufanya vitendo vyote muhimu na masharti. Ili kufanya hivyo, unahitaji kupata kipengele kinachohitajika ndani ya kila safu na kuongeza thamani inayofanana huko. Kwa kila kipimo katika mkusanyiko, unahitaji kujua idadi ya maadili ya kipekee na seti halisi ya maadili haya.

Sasa hebu tuangalie fomu ambayo maadili ndani ya nguzo yanahitaji kuwakilishwa - yaani, jinsi ya kuamua safu inayohitajika. Kuna mbinu kadhaa unazoweza kutumia kufanikisha hili. Rahisi zaidi itakuwa kuwakilisha kila safu kama vekta, lakini kwa kuwa itakuwa nadra sana, kumbukumbu itatumika vibaya sana. Ili kuepuka hili, tutatumia miundo ya data ambayo itatoa ufanisi zaidi katika kuwakilisha safu chache za mwelekeo mmoja (vekta). Rahisi kati yao itakuwa orodha ya kawaida, iliyounganishwa moja au mbili, lakini haina uchumi kutoka kwa mtazamo wa kufikia vipengele. Kwa hiyo, tutatumia mti, ambayo itatoa upatikanaji wa haraka wa vipengele.

Kwa mfano, unaweza kutumia mti sawa na kwa safuwima, lakini basi utalazimika kuunda mti wako mwenyewe kwa kila safu, ambayo ingesababisha kumbukumbu kubwa na wakati wa usindikaji. Wacha tuifanye kwa ujanja zaidi - tutaunda mti mmoja kuhifadhi michanganyiko yote ya vipimo vinavyotumiwa kwenye kamba, ambayo itakuwa sawa na ile iliyoelezewa hapo juu, lakini vitu vyake havitakuwa viashiria vya kamba (ambazo hazipo hivyo. ), lakini fahirisi zao, na maadili ya fahirisi yenyewe sio ya kupendeza kwetu na hutumiwa tu kama funguo za kipekee. Kisha tutatumia funguo hizi ili kupata kipengele kinachohitajika ndani ya safu. Safu zenyewe zinawakilishwa kwa urahisi zaidi kama mti wa kawaida wa binary. Kielelezo, muundo unaosababishwa unaweza kuwakilishwa kama ifuatavyo:

Mchoro 9. Picha ya jedwali la egemeo kama mti wa jozi

Unaweza kutumia utaratibu sawa na utaratibu uliofafanuliwa hapo juu ili kubainisha safu wima za jedwali la egemeo ili kubaini nambari za safu mlalo zinazofaa. Katika hali hii, nambari za safu mlalo ni za kipekee ndani ya jedwali moja la egemeo na hubainisha vipengele katika vekta ambazo ni safu wima za jedwali egemeo. Chaguo rahisi zaidi kwa kutengeneza nambari hizi itakuwa kudumisha kihesabu na kuiongeza kwa moja wakati wa kuongeza kipengee kipya kwenye mti wa kichwa cha safu. Vekta hizi za safu wima zenyewe huhifadhiwa kwa urahisi zaidi kama miti ya jozi, ambapo thamani ya nambari ya safu mlalo hutumiwa kama ufunguo. Kwa kuongeza, inawezekana pia kutumia meza za hashi. Kwa kuwa taratibu za kufanya kazi na miti hii zinajadiliwa kwa undani katika vyanzo vingine, hatutakaa juu ya hili na tutazingatia mpango wa jumla wa kuongeza kipengele kwenye safu.

Kwa ujumla, mlolongo wa vitendo vya kuongeza kipengee kwenye tumbo unaweza kuelezewa kama ifuatavyo:

1. Tambua nambari za mstari ambazo vipengele vinaongezwa

2.Fafanua seti ya safu wima ambazo vipengele vinaongezwa

3. Kwa safu wima zote, pata vipengee vilivyo na nambari za safu zinazohitajika na uongeze kipengee cha sasa kwao (kuongeza ni pamoja na kuunganisha nambari inayohitajika ya maadili ya ukweli na kuhesabu maadili yaliyojumlishwa, ambayo yanaweza kuamua kwa kuongezeka).

Baada ya kutekeleza algorithm hii, tutapata matrix, ambayo ni jedwali la muhtasari ambalo tulihitaji kujenga.

Sasa maneno machache kuhusu kuchuja wakati wa kujenga kipande. Njia rahisi zaidi ya kufanya hivyo ni katika hatua ya kujenga matrix, kwa kuwa katika hatua hii kuna upatikanaji wa nyanja zote zinazohitajika, na, kwa kuongeza, mkusanyiko wa maadili unafanywa. Katika kesi hii, wakati wa kurejesha kuingia kutoka kwa cache, kufuata kwake kwa masharti ya kuchuja ni kuchunguzwa, na ikiwa haijafikiwa, kuingia hutupwa.

Kwa kuwa muundo ulioelezwa hapo juu unaelezea kikamilifu meza ya pivot, kazi ya kuibua itakuwa ndogo. Katika kesi hii, unaweza kutumia vipengele vya kawaida vya meza ambavyo vinapatikana karibu na zana zote za programu za Windows.

Bidhaa ya kwanza kutekeleza maswali ya OLAP ilikuwa Express (IRI). Walakini, neno OLAP lenyewe liliundwa na Edgar Codd, "baba wa hifadhidata za uhusiano." Na kazi ya Codd ilifadhiliwa na Arbor, kampuni ambayo ilikuwa imetoa bidhaa yake ya OLAP, Essbase (baadaye ilinunuliwa na Hyperion, ambayo ilinunuliwa na Oracle mwaka wa 2007) mwaka uliopita. Bidhaa zingine zinazojulikana za OLAP ni pamoja na Huduma za Uchambuzi wa Microsoft (zamani ziliitwa Huduma za OLAP, sehemu ya Seva ya SQL), Chaguo la Oracle OLAP, Seva ya DB2 OLAP ya IBM (kimsingi EssBase na nyongeza kutoka IBM), SAP BW, bidhaa za Brio, BusinessObjects, Cognos, MicroStrategy. na wazalishaji wengine.

Kutoka kwa mtazamo wa kiufundi, bidhaa kwenye soko zimegawanywa katika "OLAP ya kimwili" na "virtual". Katika kesi ya kwanza, kuna programu ambayo hufanya hesabu ya awali ya aggregates, ambayo huhifadhiwa kwenye hifadhidata maalum ya multidimensional ambayo hutoa kurejesha haraka. Mifano ya bidhaa hizo ni Huduma za Uchambuzi wa Microsoft, Chaguo la Oracle OLAP, Oracle/Hyperion EssBase, Cognos PowerPlay. Katika hali ya pili, data huhifadhiwa katika DBMS za uhusiano, na hesabu zinaweza zisiwepo kabisa au zinaweza kuundwa kwa ombi la kwanza katika DBMS au kache ya programu ya uchanganuzi. Mifano ya bidhaa hizo ni SAP BW, BusinessObjects, Microstrategy. Mifumo kulingana na "OLAP halisi" hutoa nyakati bora zaidi za majibu kwa maswali kuliko mifumo ya "OLAP pepe". Wachuuzi wa mtandaoni wa OLAP wanadai uwezekano mkubwa wa bidhaa zao kuhimili data nyingi.

Katika kazi hii, ningependa kuangalia kwa karibu bidhaa ya BaseGroup Labs - Deductor.

Deductor ni jukwaa la uchanganuzi, i.e. msingi wa kuunda suluhisho kamili za maombi. Teknolojia zilizotekelezwa katika Deductor zinakuwezesha kupitia hatua zote za kujenga mfumo wa uchambuzi kwa misingi ya usanifu mmoja: kutoka kwa kuunda ghala la data ili kuchagua mifano moja kwa moja na kuibua matokeo yaliyopatikana.

Muundo wa mfumo:

Studio ya Deductor ndio msingi wa uchanganuzi wa jukwaa la Deductor. Studio ya Deductor inajumuisha seti kamili ya mifumo ambayo hukuruhusu kupata habari kutoka kwa chanzo cha data kiholela, kutekeleza mzunguko mzima wa usindikaji (kusafisha, kubadilisha data, miundo ya ujenzi), onyesha matokeo kwa njia rahisi zaidi (OLAP, meza, chati. , miti ya maamuzi...) na matokeo ya kuuza nje.

Deductor Viewer ni kituo cha kazi cha mtumiaji wa mwisho. Mpango huo unakuwezesha kupunguza mahitaji ya wafanyakazi, kwa sababu shughuli zote zinazohitajika hufanywa kiotomatiki kwa kutumia hati za usindikaji zilizotayarishwa hapo awali; hakuna haja ya kufikiria juu ya njia ya kupata data na mifumo ya usindikaji wake. Mtumiaji wa Dedustor Viewer anahitaji tu kuchagua ripoti inayomvutia.

Deductor Warehouse ni ghala la data la mfumo mtambuka lenye pande nyingi ambalo hukusanya taarifa zote muhimu kwa ajili ya kuchanganua eneo la somo. Utumiaji wa hazina moja huruhusu ufikiaji rahisi, kasi ya juu ya usindikaji, uthabiti wa habari, uhifadhi wa kati na usaidizi wa kiotomatiki kwa mchakato mzima wa uchambuzi wa data.

4. Mteja-Seva

Seva ya Deductor imeundwa kwa usindikaji wa uchanganuzi wa mbali. Inatoa uwezo wa "kuendesha" data kiotomatiki kupitia hati zilizopo kwenye seva na kutoa tena miundo iliyopo. Kutumia Seva ya Deductor hukuruhusu kutekeleza usanifu kamili wa viwango vitatu ambamo hutumika kama seva ya programu. Ufikiaji wa seva hutolewa kwa kutumia Deductor Client.

Kanuni za kazi:

1. Leta data

Uchambuzi wa taarifa yoyote katika Deductor huanza na uingizaji wa data. Kama matokeo ya uagizaji, data huletwa katika fomu inayofaa kwa uchambuzi unaofuata kwa kutumia njia zote zinazopatikana katika programu. Asili ya data, umbizo, DBMS, nk haijalishi, kwa sababu taratibu za kufanya kazi na kila mtu zimeunganishwa.

2. Hamisha data

Uwepo wa taratibu za usafirishaji hukuruhusu kutuma matokeo yaliyopatikana kwa programu za watu wengine, kwa mfano, kuhamisha utabiri wa mauzo kwenye mfumo ili kutoa agizo la ununuzi au kuchapisha ripoti iliyoandaliwa kwenye wavuti ya shirika.

3. Usindikaji wa data

Kuchakata katika Kipunguzi maana yake ni kitendo chochote kinachohusishwa na aina fulani ya mabadiliko ya data, kwa mfano, kuchuja, kujenga muundo, kusafisha n.k. Kweli, katika kizuizi hiki vitendo muhimu zaidi kutoka kwa mtazamo wa uchambuzi hufanywa. Kipengele muhimu zaidi cha taratibu za usindikaji zinazotekelezwa katika Deductor ni kwamba data iliyopatikana kutokana na usindikaji inaweza kuchakatwa tena na mbinu zozote zinazopatikana kwa mfumo. Kwa hivyo, unaweza kuunda hali ngumu za usindikaji kiholela.

4. Taswira

Unaweza kuona data katika Deductor Studio (Mtazamaji) katika hatua yoyote ya usindikaji. Mfumo huamua kwa kujitegemea jinsi unavyoweza kufanya hivyo, kwa mfano, ikiwa mtandao wa neural umefunzwa, basi kwa kuongeza meza na michoro, unaweza kutazama grafu ya mtandao wa neural. Mtumiaji anahitaji kuchagua chaguo taka kutoka kwenye orodha na kusanidi vigezo kadhaa.

5. Taratibu za kuunganisha

Deductor haitoi zana za kuingiza data - jukwaa linalenga tu usindikaji wa uchanganuzi. Ili kutumia taarifa zilizohifadhiwa katika mifumo tofauti tofauti, mbinu rahisi za kuagiza-usafirishaji nje hutolewa. Mwingiliano unaweza kupangwa kwa kutumia utekelezaji wa kundi, kufanya kazi katika hali ya seva ya OLE na kufikia Seva ya Deductor.

6.Kurudufu maarifa

Deductor inakuwezesha kutekeleza moja ya kazi muhimu zaidi ya mfumo wowote wa uchambuzi - usaidizi wa mchakato wa kuiga ujuzi, i.e. kutoa fursa kwa wafanyikazi ambao hawaelewi njia za uchambuzi na njia za kupata matokeo fulani kupokea jibu kulingana na mifano iliyoandaliwa na mtaalam.

Zhitimisho

Karatasi hii ilichunguza eneo la teknolojia ya kisasa ya habari kama mifumo ya uchambuzi wa data. Chombo kikuu cha usindikaji wa habari za uchambuzi - OLAP - teknolojia inachambuliwa. Kiini cha dhana ya OLAP na umuhimu wa mifumo ya OLAP katika mchakato wa kisasa wa biashara hufunuliwa kwa undani. Muundo na mchakato wa uendeshaji wa seva ya ROLAP imeelezewa kwa kina. Kama mfano wa utekelezaji wa teknolojia za data za OLAP, jukwaa la uchanganuzi la Deductor limetolewa. Nyaraka zilizowasilishwa zimetengenezwa na zinakidhi mahitaji.

Teknolojia za OLAP ni zana yenye nguvu ya kuchakata data kwa wakati halisi. Seva ya OLAP hukuruhusu kupanga na kuwasilisha data katika maeneo mbalimbali ya uchanganuzi na kubadilisha data kuwa taarifa muhimu ambayo husaidia makampuni kufanya maamuzi yenye ufahamu zaidi.

Utumiaji wa mifumo ya OLAP hutoa viwango vya juu vya utendakazi na upanuzi wa hali ya juu, vinavyosaidia wingi wa data wa gigabyte nyingi ambazo zinaweza kufikiwa na maelfu ya watumiaji. Kwa msaada wa teknolojia za OLAP, upatikanaji wa habari unafanywa kwa wakati halisi, i.e. Uchakataji wa hoja haupunguzi tena mchakato wa uchanganuzi, na kuhakikisha kasi na ufanisi wake. Vyombo vya usimamizi vinavyoonekana vinakuwezesha kuendeleza na kutekeleza hata maombi magumu zaidi ya uchambuzi, na kufanya mchakato rahisi na wa haraka.

Nyaraka zinazofanana

    Msingi wa dhana ya OLAP (Uchakataji wa Uchambuzi wa Mtandao) ni usindikaji wa uchambuzi wa data, vipengele vya matumizi yake kwa mteja na kwenye seva. Tabia za jumla za mahitaji ya msingi ya mifumo ya OLAP, pamoja na njia za kuhifadhi data ndani yao.

    muhtasari, imeongezwa 10/12/2010

    OLAP: sifa za jumla, madhumuni, malengo, malengo. Uainishaji wa bidhaa za OLAP. Kanuni za kujenga mfumo wa OLAP, maktaba ya vipengele vya CubeBase. Utegemezi wa utendaji wa mteja na seva zana za OLAP juu ya ongezeko la kiasi cha data.

    kazi ya kozi, imeongezwa 12/25/2013

    Uhifadhi wa data wa milele. Kiini na umuhimu wa zana ya OLAP (Uchanganuzi wa Mtandaoni). Hifadhidata na ghala za data, sifa zao. Muundo, usanifu wa kuhifadhi data, wauzaji wao. Vidokezo vingine vya kuboresha utendaji wa cubes za OLAP.

    mtihani, umeongezwa 10/23/2010

    Ujenzi wa mifumo ya uchambuzi wa data. Kuunda kanuni za kubuni mchemraba wa OLAP na kuunda maswali kwa jedwali la egemeo lililoundwa. Teknolojia ya OLAP ya uchambuzi wa data wa pande nyingi. Kuwapa watumiaji taarifa kwa ajili ya kufanya maamuzi ya usimamizi.

    kazi ya kozi, imeongezwa 09/19/2008

    Maelezo ya msingi kuhusu OLAP. Usindikaji wa data ya uchambuzi wa uendeshaji. Uainishaji wa bidhaa za OLAP. Mahitaji ya zana za usindikaji wa uchambuzi mtandaoni. Matumizi ya hifadhidata za multidimensional katika mifumo ya usindikaji wa uchambuzi, faida zao.

    kazi ya kozi, imeongezwa 06/10/2011

    Uundaji wa mifumo ndogo ya uchanganuzi wa tovuti kwa kutumia teknolojia ya Microsoft Access na Olap. Vipengele vya kinadharia vya kuunda mfumo mdogo wa uchambuzi wa data katika mfumo wa habari wa lango la muziki. Teknolojia za Olap katika mfumo mdogo wa uchanganuzi wa kitu cha utafiti.

    kazi ya kozi, imeongezwa 11/06/2009

    Kuzingatia zana za OLAP: uainishaji wa mbele za duka na maghala ya habari, dhana ya mchemraba wa data. Usanifu wa mfumo wa usaidizi wa maamuzi. Utekelezaji wa programu ya mfumo wa "Abitura". Kuunda ripoti ya Wavuti kwa kutumia teknolojia za Huduma za Kuripoti.

    kazi ya kozi, imeongezwa 12/05/2012

    Uhifadhi wa data, kanuni za shirika. Taratibu za kufanya kazi na data. Muundo wa OLAP, vipengele vya kiufundi vya uhifadhi wa data wa pande nyingi. Huduma za Ujumuishaji, kujaza maghala ya data na mifumo ya data. Uwezo wa mifumo inayotumia teknolojia za Microsoft.

    kazi ya kozi, imeongezwa 12/05/2012

    Ujenzi wa mchoro wa ghala la data kwa biashara ya biashara. Maelezo ya michoro ya uhusiano wa uhifadhi. Inaonyesha maelezo ya bidhaa. Uundaji wa mchemraba wa OLAP kwa uchambuzi zaidi wa habari. Maendeleo ya maswali ya kutathmini ufanisi wa duka kuu.

    mtihani, umeongezwa 12/19/2015

    Kusudi la kuhifadhi data. Usanifu wa SAP BW. Kuunda ripoti za uchanganuzi kulingana na cubes za OLAP katika mfumo wa SAP BW. Tofauti kuu kati ya ghala la data na mfumo wa OLTP. Muhtasari wa maeneo ya kazi ya BEx. Kuunda swali katika Mbuni wa Maswali ya BEx.

Madhumuni ya ripoti

Ripoti hii itaangazia mojawapo ya kategoria za teknolojia mahiri ambazo ni zana rahisi ya uchanganuzi - teknolojia za OLAP.

Madhumuni ya ripoti: kufichua na kuangazia masuala 2: 1) dhana ya OLAP na umuhimu wake unaotumika katika usimamizi wa fedha; 2) utekelezaji wa utendaji wa OLAP katika ufumbuzi wa programu: tofauti, uwezo, faida, hasara.

Ningependa kutambua mara moja kwamba OLAP ni zana ya ulimwengu wote ambayo inaweza kutumika katika eneo lolote la maombi, na sio tu katika kifedha (kama inavyoweza kueleweka kutoka kwa kichwa cha ripoti), ambayo inahitaji uchambuzi wa data kwa kutumia mbinu mbalimbali.

Usimamizi wa fedha

Usimamizi wa fedha ni eneo ambalo uchambuzi ni muhimu zaidi kuliko nyingine yoyote. Uamuzi wowote wa kifedha na usimamizi hutokea kama matokeo ya taratibu fulani za uchambuzi. Leo, usimamizi wa kifedha unakuwa muhimu kwa utendakazi mzuri wa biashara. Licha ya ukweli kwamba usimamizi wa kifedha ni mchakato msaidizi katika biashara, inahitaji umakini maalum, kwani maamuzi potofu ya kifedha na usimamizi yanaweza kusababisha hasara kubwa.

Usimamizi wa fedha unalenga kutoa biashara na rasilimali za kifedha kwa kiasi kinachohitajika, kwa wakati unaofaa na mahali pazuri ili kupata athari ya juu kutoka kwa matumizi yao kwa njia ya usambazaji bora.

Labda ni ngumu kufafanua kiwango cha "ufanisi wa juu wa rasilimali", lakini kwa hali yoyote,

CFO inapaswa kujua kila wakati:

  • Ni rasilimali ngapi za kifedha zinapatikana?
  • Je, fedha zitatoka wapi na kwa kiasi gani?
  • wapi kuwekeza kwa ufanisi zaidi na kwa nini?
  • na ni kwa wakati gani haya yote yanahitaji kufanywa?
  • ni kiasi gani kinahitajika ili kuhakikisha uendeshaji wa kawaida wa biashara?

Ili kupata majibu yanayofaa kwa maswali haya, ni muhimu kuwa na, kuchambua na kujua jinsi ya kuchambua idadi kubwa ya kutosha ya viashiria vya utendaji. Kwa kuongezea, FU inashughulikia idadi kubwa ya maeneo: uchambuzi wa mtiririko wa pesa (mtiririko wa pesa), uchambuzi wa mali na dhima, uchanganuzi wa faida, uchanganuzi wa ukingo, uchanganuzi wa faida, uchambuzi wa urval.

Maarifa

Kwa hivyo, jambo kuu katika ufanisi wa mchakato wa usimamizi wa fedha ni upatikanaji wa maarifa:

  • Maarifa ya kibinafsi katika eneo la somo (mtu anaweza kusema kinadharia na mbinu), ikiwa ni pamoja na uzoefu, uvumbuzi wa mfadhili/mkurugenzi wa fedha.
  • Ujuzi wa jumla (wa ushirika) au habari ya kimfumo juu ya ukweli wa shughuli za kifedha katika biashara (yaani, habari kuhusu hali ya zamani, ya sasa na ya baadaye ya biashara, iliyotolewa katika viashiria na vipimo mbalimbali)

Ikiwa ya kwanza iko katika wigo wa vitendo vya mfadhili huyu (au mkurugenzi wa HR ambaye aliajiri mfanyakazi huyu), basi ya pili inapaswa kuundwa kwa makusudi katika biashara na jitihada za pamoja za wafanyakazi wa huduma za kifedha na habari.

Kuna nini sasa

Hata hivyo, sasa hali ya paradoxical ni ya kawaida katika makampuni ya biashara: kuna habari, kuna mengi yake, mengi sana. Lakini iko katika hali ya machafuko: haijaundwa, haiendani, imegawanyika, sio ya kuaminika kila wakati na mara nyingi ina makosa, karibu haiwezekani kuipata. Kizazi kirefu na kisicho na maana cha mlima wa taarifa za kifedha hufanywa, ambayo ni ngumu kwa uchambuzi wa kifedha na ni ngumu kuelewa, kwani haijaundwa kwa usimamizi wa ndani, lakini kwa kuwasilisha kwa mamlaka ya udhibiti wa nje.

Kulingana na matokeo ya utafiti uliofanywa na kampuni hiyo Reuters Miongoni mwa mameneja 1,300 wa kimataifa, 38% ya waliohojiwa walisema wanatumia muda mwingi kutafuta taarifa wanazohitaji. Inabadilika kuwa mtaalamu aliyehitimu sana hutumia wakati wa kulipwa sana sio kwa uchambuzi wa data, lakini kwa kukusanya, kutafuta na kupanga habari muhimu kwa uchambuzi huu. Wakati huo huo, wasimamizi wamejaa data ambayo mara nyingi haifai, ambayo inapunguza tena ufanisi wa kazi zao. Sababu ya hali hii: habari ya ziada na ukosefu wa ujuzi.

Nini cha kufanya

Habari lazima igeuzwe kuwa maarifa. Kwa biashara ya kisasa, habari muhimu, upatikanaji wake wa kimfumo, usanisi, kubadilishana, matumizi ni aina ya sarafu, lakini ili kuipokea, ni muhimu kudhibiti habari, kama mchakato wowote wa biashara.

Ufunguo wa usimamizi wa habari ni kuwasilisha taarifa sahihi katika mfumo sahihi kwa washikadau ndani ya shirika kwa wakati ufaao. Lengo la usimamizi kama huo ni kusaidia watu kufanya kazi vizuri zaidi kwa kutumia viwango vinavyoongezeka vya habari.

Teknolojia ya habari katika kesi hii hufanya kama njia ambayo itawezekana kupanga habari katika biashara, kutoa watumiaji fulani ufikiaji wake na kuwapa zana za kubadilisha habari hii kuwa maarifa.

Dhana za kimsingi za teknolojia za OLAP

Teknolojia za OLAP (kutoka kwa Kiingereza cha Uchanganuzi wa Mtandaoni) ni jina si la bidhaa mahususi, bali la teknolojia nzima ya uchanganuzi wa uendeshaji wa data ya pande nyingi iliyokusanywa katika ghala. Ili kuelewa kiini cha OLAP, ni muhimu kuzingatia mchakato wa jadi wa kupata taarifa kwa ajili ya kufanya maamuzi.

Mfumo wa usaidizi wa maamuzi ya jadi

Hapa, kwa kweli, kunaweza pia kuwa na chaguzi nyingi: machafuko kamili ya habari au hali ya kawaida wakati biashara ina mifumo ya kufanya kazi kwa msaada ambao ukweli wa shughuli fulani hurekodiwa na kuhifadhiwa kwenye hifadhidata. Ili kupata data kutoka kwa hifadhidata kwa madhumuni ya uchanganuzi, mfumo wa maswali kwa sampuli maalum za data umeundwa.

Lakini njia hii ya usaidizi wa uamuzi haina kubadilika na ina shida nyingi:

  • kiasi kidogo cha data kinatumika ambacho kinaweza kuwa muhimu kwa kufanya maamuzi
  • wakati mwingine ripoti ngumu za kurasa nyingi huundwa, ambazo mistari 1-2 hutumiwa (iliyobaki ni kama tu) - upakiaji wa habari.
  • mwitikio wa polepole wa mchakato kwa mabadiliko: ikiwa uwasilishaji mpya wa data unahitajika, ombi lazima lifafanuliwe rasmi na kurekodiwa na mtayarishaji programu, kisha tu litekelezwe. Wakati wa kusubiri: masaa, siku. Au labda suluhisho linahitajika sasa, mara moja. Lakini baada ya kupokea habari mpya, swali jipya litatokea (kufafanua)

Ikiwa ripoti za hoja zitawasilishwa katika muundo wa mwelekeo mmoja, basi matatizo ya biashara kwa kawaida huwa ya pande nyingi na yenye pande nyingi. Ikiwa unataka kupata picha wazi ya biashara ya kampuni, basi unahitaji kuchambua data kutoka kwa mitazamo mbalimbali.

Makampuni mengi huunda hifadhidata bora za uhusiano, ikipanga vyema milima ya habari isiyotumiwa, ambayo yenyewe haitoi jibu la haraka au la kutosha kwa hafla za soko. NDIYO - hifadhidata za uhusiano zilikuwa, ziko na zitakuwa teknolojia inayofaa zaidi kuhifadhi data ya shirika. Hatuzungumzii kuhusu teknolojia mpya ya hifadhidata, bali kuhusu zana za uchanganuzi zinazokamilisha utendakazi wa DBMS zilizopo na zinaweza kunyumbulika vya kutosha kutoa na kufanyia kazi aina mbalimbali za uchanganuzi wa kiakili ulio katika OLAP otomatiki.

Kuelewa OLAP

OLAP inatoa nini?

  • Zana za ufikiaji wa data za uhifadhi wa hali ya juu
  • Udanganyifu wa mwingiliano wa data (kuzungusha, ujumuishaji au kuchimba chini)
  • Futa onyesho la kuona la data
  • Haraka - uchambuzi unafanywa kwa wakati halisi
  • Uwasilishaji wa data wa pande nyingi - uchambuzi wa wakati mmoja wa idadi ya viashiria pamoja na vipimo kadhaa

Ili kupata athari za kutumia teknolojia za OLAP, lazima: 1) kuelewa kiini cha teknolojia yenyewe na uwezo wao; 2) fafanua wazi ni michakato gani inahitajika kuchambuliwa, ni viashiria gani watakuwa na sifa na kwa vipimo gani inashauriwa kuviona, i.e. kuunda mfano wa uchambuzi.

Dhana za kimsingi ambazo teknolojia za OLAP zinafanya kazi ni kama ifuatavyo:

Multidimensionality

Ili kuelewa wingi wa data, unapaswa kwanza kuwasilisha jedwali linaloonyesha, kwa mfano, utendaji wa Gharama za Biashara kulingana na vipengele vya kiuchumi na vitengo vya biashara.

Data hii imewasilishwa katika vipimo viwili:

  • makala
  • kitengo cha Biashara

Jedwali hili si la taarifa, kwani linaonyesha mauzo kwa kipindi kimoja cha muda. Kwa vipindi tofauti vya muda, wachambuzi watalazimika kulinganisha majedwali kadhaa (kwa kila kipindi):

Takwimu inaonyesha mwelekeo wa 3, Wakati, pamoja na mbili za kwanza. (Kifungu, kitengo cha biashara)

Njia nyingine ya kuonyesha data ya multidimensional ni kuiwakilisha katika mfumo wa mchemraba:

Miche ya OLAP huruhusu wachambuzi kupata data katika vipande mbalimbali ili kupata majibu kwa maswali yanayoulizwa na biashara:

  • Ni gharama gani ni muhimu katika vitengo gani vya biashara?
  • Gharama za kitengo cha biashara hubadilikaje kwa wakati?
  • Je, vitu vya gharama hubadilikaje kwa wakati?

Majibu ya maswali kama haya ni muhimu kwa kufanya maamuzi ya usimamizi: juu ya kupunguzwa kwa vitu fulani vya gharama, athari kwenye muundo wao, kutambua sababu za mabadiliko ya gharama kwa wakati, kupotoka kutoka kwa mpango na uondoaji wao - kuboresha muundo wao.

Katika mfano huu, vipimo 3 tu vinazingatiwa. Ni vigumu kuonyesha zaidi ya vipimo 3, lakini inafanya kazi kwa njia sawa na kwa vipimo 3.

Kwa kawaida, programu za OLAP hukuruhusu kupata data ya vipimo 3 au zaidi, kwa mfano, unaweza kuongeza kipimo kimoja zaidi - Mpango-Halisi, Kitengo cha Gharama: moja kwa moja, isiyo ya moja kwa moja, kwa Maagizo, kwa Miezi. Vipimo vya ziada hukuruhusu kupata vipande vya uchanganuzi zaidi na kutoa majibu kwa maswali yenye hali nyingi.

Utawala

OLAP pia inaruhusu wachanganuzi kupanga kila mwelekeo katika safu ya vikundi, vikundi vidogo na jumla zinazoakisi kipimo katika shirika zima—njia ya kimantiki zaidi ya kuchanganua biashara.

Kwa mfano, inashauriwa kuweka gharama za kikundi kwa mpangilio:

OLAP huwaruhusu wachanganuzi kuangalia kipimo cha jumla cha muhtasari (katika kiwango cha juu) na kisha kuteremka hadi ngazi za chini na zinazofuata ili kugundua sababu hasa iliyofanya kipimo hicho kibadilike.

Kwa kuruhusu wachanganuzi kutumia vipimo vingi katika mchemraba wa data, wenye uwezo wa kuunda vipimo kwa mpangilio, OLAP hutoa picha ya biashara ambayo haijabanwa na muundo wa ghala la habari.

Kubadilisha mwelekeo wa uchambuzi katika mchemraba (data inayozunguka)

Kama sheria, hufanya kazi kwa dhana: vipimo vilivyoainishwa kwenye safu, safu (kunaweza kuwa na kadhaa), vipande vya fomu iliyobaki, yaliyomo kwenye vipimo vya fomu ya jedwali (mauzo, gharama, pesa taslimu)

Kwa kawaida, OLAP inakuwezesha kubadilisha mwelekeo wa vipimo vya mchemraba, na hivyo kuwasilisha data katika maoni tofauti.

Maonyesho ya data ya mchemraba inategemea:

  • mwelekeo wa mwelekeo: ambayo vipimo vinatajwa katika safu, safu, vipande;
  • vikundi vya viashiria, vilivyoonyeshwa kwenye safu, safu, sehemu.
  • Kubadilisha vipimo ni ndani ya wigo wa vitendo vya mtumiaji.

Kwa hivyo, OLAP inakuwezesha kufanya aina mbalimbali za uchambuzi na kuelewa uhusiano wao na matokeo yao.

  • Uchambuzi wa kupotoka ni uchambuzi wa utekelezaji wa mpango, ambao huongezewa na uchambuzi wa sababu za kupotoka kwa kuelezea viashiria.
  • Uchambuzi wa utegemezi: OLAP inakuwezesha kutambua utegemezi mbalimbali kati ya mabadiliko mbalimbali, kwa mfano, wakati bia iliondolewa kutoka kwa urval wakati wa miezi miwili ya kwanza, kushuka kwa mauzo ya roach kuligunduliwa.
  • Ulinganisho (uchambuzi wa kulinganisha). Ulinganisho wa matokeo ya mabadiliko katika kiashiria kwa muda, kwa kikundi fulani cha bidhaa, katika mikoa tofauti, nk.
  • Uchambuzi wa mienendo huturuhusu kutambua mwelekeo fulani wa mabadiliko katika viashiria kwa wakati.

Ufanisi: tunaweza kusema kwamba OLAP inategemea sheria za saikolojia: uwezo wa kushughulikia maombi ya habari katika "wakati halisi" - kwa kasi ya mchakato wa ufahamu wa uchambuzi wa data na mtumiaji.

Ikiwa hifadhidata ya uhusiano inaweza kusoma kuhusu rekodi 200 kwa sekunde na kuandika 20, basi seva nzuri ya OLAP, kwa kutumia safu mlalo na safu wima zilizokokotwa, inaweza kuunganisha seli 20,000-30,000 (sawa na rekodi moja katika hifadhidata ya uhusiano) kwa sekunde.

Mwonekano: Inapaswa kusisitizwa kuwa OLAP hutoa njia za kina za uwasilishaji wa picha wa data kwa mtumiaji wa mwisho. Ubongo wa mwanadamu una uwezo wa kuona na kuchambua habari ambayo hutolewa kwa namna ya picha za kijiometri, kwa kiasi ambacho ni maagizo kadhaa ya ukubwa zaidi kuliko maelezo yaliyotolewa katika fomu ya alphanumeric. Mfano: Hebu tuseme unahitaji kupata sura inayojulikana katika mojawapo ya picha mia moja. Ninaamini mchakato huu hautakuchukua zaidi ya dakika moja. Sasa fikiria kwamba badala ya picha utapewa maelezo mia ya maneno ya watu sawa. Nadhani hautaweza kutatua shida iliyopendekezwa hata kidogo.

Urahisi: Sifa kuu ya teknolojia hizi ni kwamba imekusudiwa kutumiwa sio na mtaalamu katika uwanja wa teknolojia ya habari, sio na mtaalamu wa takwimu, lakini na mtaalamu katika uwanja uliotumika - meneja wa idara ya mkopo, meneja wa idara ya bajeti, na hatimaye mkurugenzi. Zimeundwa kwa ajili ya mchambuzi kuwasiliana na tatizo, si kwa kompyuta..

Licha ya uwezo mkubwa wa OLAP (kwa kuongeza, wazo hilo ni la zamani - miaka ya 60), matumizi yake halisi haipatikani kamwe katika makampuni yetu ya biashara. Kwa nini?

  • hakuna habari au uwezekano hauko wazi
  • tabia ya kufikiri pande mbili
  • kizuizi cha bei
  • maudhui ya kiteknolojia kupita kiasi ya makala yaliyotolewa kwa OLAP: maneno yasiyo ya kawaida yanatisha - OLAP, "uchimbaji na kukata data", "maswali ya dharula", "kutambua uwiano muhimu"

Mtazamo wetu na wa Magharibi kwa matumizi ya OLAP

Kwa kuongezea, pia tuna ufahamu mahususi wa matumizi ya matumizi ya OLAP hata tunapoelewa uwezo wake wa kiteknolojia.

Waandishi wetu na wa Urusi wa nyenzo mbali mbali zilizotolewa kwa OLAP wanaelezea maoni yafuatayo kuhusu umuhimu wa OLAP: wengi wanaona OLAP kama zana inayokuruhusu kupanua na kukunja data kwa urahisi na kwa urahisi, ukifanya udanganyifu unaokuja akilini mwa mchambuzi wakati wa uchanganuzi. mchakato. "Vipande" zaidi na "sehemu" za data mchambuzi anaona, mawazo zaidi anayo, ambayo, kwa upande wake, yanahitaji "vipande" zaidi na zaidi kwa uthibitishaji. Sio sawa.

Uelewa wa Magharibi wa manufaa ya OLAP unatokana na modeli ya uchanganuzi wa kimbinu ambayo lazima ijumuishwe wakati wa kuunda suluhu za OLAP. Mchambuzi hapaswi kucheza na mchemraba wa OLAP na kubadilisha bila mwelekeo vipimo na viwango vyake vya undani, mwelekeo wa data, onyesho la picha la data (na hii inachukua kweli!), lakini aelewe wazi ni maoni gani anayohitaji, katika mlolongo upi na kwa nini (bila shaka. , vipengele " kunaweza kuwa na uvumbuzi hapa, lakini sio msingi kwa manufaa ya OLAP).

Maombi ya OLAP

  • Bajeti
  • Mtiririko wa fedha

Moja ya maeneo yenye rutuba zaidi ya matumizi ya teknolojia ya OLAP. Sio bure kwamba hakuna mfumo wa kisasa wa bajeti unachukuliwa kuwa kamili bila uwepo wa zana za OLAP za uchambuzi wa bajeti. Ripoti nyingi za bajeti hujengwa kwa urahisi kwa misingi ya mifumo ya OLAP. Wakati huo huo, ripoti hujibu maswali mengi sana: uchambuzi wa muundo wa gharama na mapato, kulinganisha gharama za vitu fulani katika mgawanyiko tofauti, uchambuzi wa mienendo na mwenendo wa gharama kwa vitu fulani, uchambuzi wa gharama na faida.

OLAP itakuruhusu kuchanganua uingiaji na utokaji wa pesa taslimu katika muktadha wa shughuli za biashara, washirika, sarafu na wakati ili kuboresha mtiririko wao.

  • Ripoti ya fedha na usimamizi (pamoja na uchanganuzi ambao usimamizi unahitaji)
  • Masoko
  • Kadi ya alama iliyosawazishwa
  • Uchambuzi wa Faida

Ikiwa una data inayofaa, unaweza kupata matumizi mbalimbali ya teknolojia ya OLAP.

Bidhaa za OLAP

Sehemu hii itajadili OLAP kama suluhisho la programu.

Mahitaji ya jumla kwa bidhaa za OLAP

Kuna njia nyingi za kutekeleza programu za OLAP, kwa hivyo hakuna teknolojia mahususi iliyopaswa kuhitajika, au hata kupendekezwa. Chini ya hali na hali tofauti, njia moja inaweza kuwa bora kuliko nyingine. Mbinu za utekelezaji zinajumuisha mawazo mengi tofauti ya wamiliki ambayo wachuuzi wanajivunia sana: tofauti za usanifu wa mteja-server, uchambuzi wa mfululizo wa muda, mwelekeo wa kitu, uboreshaji wa kuhifadhi data, michakato sambamba, nk. Lakini teknolojia hizi haziwezi kuwa sehemu ya ufafanuzi wa OLAP.

Kuna sifa ambazo lazima zizingatiwe katika bidhaa zote za OLAP (ikiwa ni bidhaa ya OLAP), ambayo ndiyo bora ya teknolojia. Hizi ndizo fasili 5 muhimu zinazoonyesha OLAP (kinachojulikana kama mtihani wa FASMI): Uchambuzi wa Haraka wa Taarifa za Pamoja za Multidimensional.

  • Haraka(FAST) inamaanisha kuwa mfumo unapaswa kuwa na uwezo wa kutoa majibu mengi kwa watumiaji ndani ya takriban sekunde tano. Hata kama mfumo huonya kwamba mchakato utachukua muda mrefu zaidi, watumiaji wanaweza kukengeushwa na kupoteza mawazo yao, na ubora wa uchanganuzi utaharibika. Kasi hii si rahisi kufikia kwa kiasi kikubwa cha data, hasa ikiwa mahesabu maalum ya kuruka yanahitajika. Wachuuzi hutumia mbinu mbalimbali ili kufikia lengo hili, ikiwa ni pamoja na njia maalum za kuhifadhi data, kompyuta nyingi za awali, au mahitaji magumu ya maunzi. Walakini, kwa sasa hakuna suluhisho zilizoboreshwa kikamilifu. Kwa mtazamo wa kwanza, inaweza kuonekana kuwa ya kushangaza kwamba wakati wa kupokea ripoti kwa dakika ambayo si muda mrefu uliopita ilichukua siku, mtumiaji hupata kuchoka haraka wakati wa kusubiri, na mradi unageuka kuwa na mafanikio kidogo zaidi kuliko katika kesi ya papo hapo. majibu, hata kwa gharama ya uchambuzi wa kina kidogo.
  • Imeshirikiwa inamaanisha kuwa mfumo unawezesha kutimiza mahitaji yote ya ulinzi wa data na kutekeleza ufikiaji uliosambazwa na wakati huo huo wa data kwa viwango tofauti vya watumiaji. Mfumo lazima uweze kushughulikia mabadiliko mengi ya data kwa wakati na kwa njia salama. Huu ni udhaifu mkubwa wa bidhaa nyingi za OLAP, ambazo huwa na kudhani kuwa programu zote za OLAP ni za kusoma tu na hutoa vidhibiti vya usalama vilivyorahisishwa.
  • Multidimensional ni hitaji kuu. Iwapo ungelazimika kufafanua OLAP kwa neno moja, ungeichagua. Mfumo lazima utoe mtazamo wa dhana wa data wa pande nyingi, ikijumuisha usaidizi kamili wa madaraja na madaraja mengi, kwa kuwa hii huamua njia ya kimantiki zaidi ya kuchanganua biashara. Hakuna idadi ya chini kabisa ya vipimo ambavyo lazima vichakatwa, kwani hii pia inategemea ombi, na bidhaa nyingi za OLAP zina idadi ya kutosha ya vipimo kwa masoko ambayo yanalenga. Tena, hatuelezi ni teknolojia gani msingi ya hifadhidata inapaswa kutumika ikiwa mtumiaji atapata mtazamo wa kweli wa kimawazo wa habari. Kipengele hiki ni moyo wa OLAP
  • Habari. Taarifa muhimu lazima ipatikane ambapo inahitajika, bila kujali kiasi chake na eneo la kuhifadhi. Walakini, mengi inategemea maombi. Nguvu ya bidhaa mbalimbali hupimwa kwa kuzingatia ni data ngapi ya pembejeo wanaweza kusindika, lakini sio gigabytes ngapi wanaweza kuhifadhi. Nguvu ya bidhaa inatofautiana sana - bidhaa kubwa zaidi za OLAP zinaweza kushughulikia angalau data mara elfu zaidi kuliko ndogo zaidi. Kuna mambo mengi ya kuzingatia katika suala hili, ikiwa ni pamoja na kurudia data, mahitaji ya RAM, matumizi ya nafasi ya diski, vipimo vya utendaji, ushirikiano na maghala ya habari, nk.
  • Uchambuzi inamaanisha kuwa mfumo unaweza kushughulikia uchambuzi wowote wa kimantiki na wa takwimu mahususi kwa programu fulani na kuhakikisha kuwa imehifadhiwa katika fomu inayofikiwa na mtumiaji wa mwisho. Mtumiaji anapaswa kuwa na uwezo wa kufafanua hesabu mpya maalum kama sehemu ya uchanganuzi bila hitaji la kupanga programu. Hiyo ni, utendakazi wote wa uchanganuzi unaohitajika lazima utolewe kwa njia angavu kwa watumiaji wa mwisho. Zana za uchanganuzi zinaweza kujumuisha taratibu fulani, kama vile uchanganuzi wa mfululizo wa saa, mgao wa gharama, uhamisho wa sarafu, utafutaji lengwa, n.k. Uwezo kama huo hutofautiana sana kati ya bidhaa, kulingana na mwelekeo lengwa.

Kwa maneno mengine, fasili hizi 5 muhimu ni malengo ambayo bidhaa za OLAP zimeundwa kufikia.

Vipengele vya teknolojia ya OLAP

Mfumo wa OLAP unajumuisha vipengele fulani. Kuna mipango mbalimbali ya uendeshaji wao ambayo hii au bidhaa hiyo inaweza kutekeleza.

Vipengele vya mifumo ya OLAP (mfumo wa OLAP unajumuisha nini?)

Kwa kawaida, mfumo wa OLAP unajumuisha vipengele vifuatavyo:

  • Chanzo cha data
    Chanzo ambacho data ya uchambuzi inachukuliwa (ghala la data, hifadhidata ya mifumo ya uhasibu ya uendeshaji, seti ya meza, mchanganyiko wa hapo juu).
  • Seva ya OLAP
    Data kutoka kwa chanzo huhamishwa au kunakiliwa hadi kwenye seva ya OLAP, ambapo hupangwa na kutayarishwa kwa ajili ya utoaji wa haraka wa majibu kwa hoja.
  • Mteja wa OLAP
    Kiolesura cha mtumiaji kwa seva ya OLAP ambamo mtumiaji anafanya kazi

Ikumbukwe kwamba sio vipengele vyote vinavyohitajika. Kuna mifumo ya OLAP ya eneo-kazi inayokuruhusu kuchanganua data iliyohifadhiwa moja kwa moja kwenye kompyuta ya mtumiaji na haihitaji seva ya OLAP.

Hata hivyo, ni kipengele gani kinachohitajika ni chanzo cha data: upatikanaji wa data ni suala muhimu. Ikiwa zipo, kwa namna yoyote, kama vile jedwali la Excel, katika hifadhidata ya mfumo wa uhasibu, au katika mfumo wa ripoti zilizopangwa kutoka kwa matawi, mtaalamu wa IT ataweza kuunganishwa na mfumo wa OLAP moja kwa moja au kwa ubadilishaji wa kati. Mifumo ya OLAP ina zana maalum kwa hili. Ikiwa data hii haipatikani, au haina ukamilifu na ubora wa kutosha, OLAP haitasaidia. Hiyo ni, OLAP ni muundo mkuu tu juu ya data, na ikiwa hakuna, inakuwa kitu kisicho na maana.

Data nyingi za programu za OLAP hutoka katika mifumo mingine. Hata hivyo, katika baadhi ya programu (kwa mfano, kupanga au kupanga bajeti), data inaweza kuundwa moja kwa moja katika programu za OLAP. Data inapotoka kwa programu zingine, kwa kawaida ni muhimu kwa data kuhifadhiwa katika fomu tofauti, iliyorudiwa kwa programu ya OLAP. Kwa hiyo, ni vyema kuunda maghala ya data.

Ikumbukwe kwamba neno "OLAP" linaunganishwa kwa njia isiyoweza kutenganishwa na neno "ghala la data" (Ghala la data). Ghala la data ni mkusanyiko mahususi wa kikoa, kulingana na wakati, na usiobadilika wa data ili kusaidia kufanya maamuzi ya usimamizi. Data katika ghala hutoka kwa mifumo ya uendeshaji (OLTP mifumo), ambayo imeundwa kufanyia shughuli za biashara kiotomatiki; ghala linaweza kujazwa tena kutoka kwa vyanzo vya nje, kwa mfano, ripoti za takwimu.

Licha ya ukweli kwamba zina habari isiyohitajika ambayo tayari iko kwenye hifadhidata au faili za mfumo wa uendeshaji, ghala za data ni muhimu kwa sababu:

  • kugawanyika kwa data, kuihifadhi katika miundo mbalimbali ya DBMS;
  • utendakazi wa kurejesha data unaboresha
  • ikiwa katika biashara data zote zimehifadhiwa kwenye seva kuu ya hifadhidata (ambayo ni nadra sana), mchambuzi labda hataelewa muundo wao ngumu, wakati mwingine unaochanganya.
  • maswali magumu ya uchambuzi kwa habari ya uendeshaji hupunguza kasi ya kazi ya sasa ya kampuni, kuzuia meza kwa muda mrefu na kuchukua rasilimali za seva.
  • uwezo wa kusafisha na kuoanisha data
  • haiwezekani au vigumu sana kuchambua data moja kwa moja kutoka kwa mifumo ya uendeshaji;

Madhumuni ya hifadhi ni kutoa "malighafi" kwa ajili ya uchambuzi katika sehemu moja na katika muundo rahisi, unaoeleweka. Hiyo ni, dhana ya Uhifadhi Data si dhana ya uchanganuzi wa data, bali ni dhana ya kuandaa data kwa ajili ya uchambuzi. Inahusisha utekelezaji wa chanzo kimoja cha data kilichounganishwa.

Bidhaa za OLAP: usanifu

Unapotumia bidhaa za OLAP, maswali mawili ni muhimu: jinsi gani na wapi Weka Na mchakato data. Kulingana na jinsi michakato hii miwili inatekelezwa, usanifu wa OLAP hutofautishwa. Kuna njia 3 za kuhifadhi data kwa OLAP na njia 3 za kuchakata data hii. Wazalishaji wengi hutoa chaguo kadhaa, wengine hujaribu kuthibitisha kwamba mbinu yao ni moja ya busara zaidi. Huu, bila shaka, ni upuuzi. Hata hivyo, bidhaa chache sana zinaweza kufanya kazi kwa njia zaidi ya moja kwa ufanisi.

Chaguo za kuhifadhi data za OLAP

Hifadhi katika muktadha huu inamaanisha kuweka data katika hali iliyosasishwa kila mara.

  • Hifadhidata za uhusiano: Hili ni chaguo la kawaida ikiwa biashara itahifadhi data ya uhasibu katika RDB. Katika hali nyingi, data inapaswa kuhifadhiwa katika muundo usio na kawaida (inayofaa zaidi ni schema ya nyota). Hifadhidata iliyosawazishwa haikubaliki kwa sababu ya utendaji wa chini sana wa hoja wakati wa kutengeneza mijumlisho ya OLAP (mara nyingi data inayotokana huhifadhiwa katika majedwali ya jumla).
  • Faili za hifadhidata kwenye kompyuta ya mteja (kioski au mifumo ya data): Data hii inaweza kusambazwa mapema au kuundwa kwa hoja kwenye kompyuta za mteja.

Hifadhidata za Multidimensional: Hii inadhania kuwa data imehifadhiwa katika hifadhidata ya multidimensional kwenye seva. Inaweza kujumuisha data iliyotolewa na muhtasari kutoka kwa mifumo mingine na hifadhidata za uhusiano, faili za watumiaji wa mwisho, n.k. Mara nyingi, hifadhidata za aina nyingi huhifadhiwa kwenye diski, lakini baadhi ya bidhaa hukuruhusu kutumia RAM, kuhesabu data inayotumiwa mara kwa mara kwenye nzi. " Bidhaa chache sana kulingana na hifadhidata nyingi huruhusu uhariri wa data nyingi; bidhaa nyingi huruhusu uhariri mmoja lakini usomaji wa data nyingi, wakati zingine zina kikomo cha kusoma tu.

Maeneo haya matatu ya kuhifadhi yana uwezo tofauti wa kuhifadhi, na yamepangwa kwa mpangilio wa kushuka wa uwezo. Pia zina sifa tofauti za utendaji wa hoja: hifadhidata za uhusiano ni polepole zaidi kuliko chaguzi mbili za mwisho.

Chaguo za kuchakata data ya OLAP

Kuna chaguzi 3 za usindikaji sawa wa data:

  • Kutumia SQL: Chaguo hili, bila shaka, hutumiwa wakati wa kuhifadhi data katika RDB. Hata hivyo, SQL hairuhusu mahesabu ya pande nyingi katika swala moja, kwa hivyo inahitaji kuandika maswali changamano ya SQL ili kufikia zaidi ya utendakazi wa msingi wa multidimensional. Walakini, hii haizuii watengenezaji kujaribu. Mara nyingi, hufanya idadi ndogo ya hesabu zinazofaa katika SQL, na matokeo ambayo yanaweza kupatikana kutoka kwa usindikaji wa data wa pande nyingi au kutoka kwa mashine ya mteja. Pia inawezekana kutumia RAM inayoweza kuhifadhi data kwa kutumia zaidi ya ombi moja: hii inaboresha majibu kwa kiasi kikubwa.
  • Uchakataji wa pande nyingi kwa mteja: Bidhaa ya mteja ya OLAP hufanya hesabu yenyewe, lakini uchakataji kama huo unapatikana tu ikiwa watumiaji wana Kompyuta zenye nguvu kiasi.

Uchakataji wa pande nyingi za seva: Hapa ni mahali maarufu pa kufanya hesabu za pande nyingi katika programu za OLAP za seva ya mteja na hutumiwa katika bidhaa nyingi. Utendaji kawaida huwa juu kwa sababu hesabu nyingi tayari zimefanywa. Walakini, hii inahitaji nafasi nyingi za diski.

Matrix ya usanifu wa OLAP

Ipasavyo, kwa kuchanganya chaguzi za uhifadhi/uchakataji, inawezekana kupata matrix ya usanifu wa mfumo wa OLAP. Ipasavyo, kinadharia kunaweza kuwa na mchanganyiko 9 wa njia hizi. Walakini, kwa kuwa 3 kati yao hawana akili ya kawaida, kwa kweli kuna chaguzi 6 tu za kuhifadhi na kusindika data ya OLAP.

Chaguo za uhifadhi wa multidimensional
data

Chaguo
ya multidimensional
usindikaji wa data

Database ya uhusiano

Hifadhidata ya pande nyingi za seva

Kompyuta ya mteja

Ukubwa wa Cartesis

Usindikaji wa seva nyingi

Crystal Holos (Njia ya ROLAP)

Seva ya IBM DB2 OLAP

CA EUREKA:Mkakati

Informix MetaCube

Speedware Media/MR

Huduma za Uchambuzi wa Microsoft

Oracle Express (hali ya ROLAP)

Seva ya Uchambuzi wa Majaribio

Tumia iTM1

Holo za Crystal

Uamuzi wa Kushiriki

Hyperion Essbase

Oracle Express

Speedware Media/M

Huduma za Uchambuzi wa Microsoft

Seva ya Biashara ya PowerPlay

Seva ya Uchambuzi wa Majaribio

Tumia iTM1

Usindikaji wa multidimensional kwenye kompyuta ya mteja

Mgunduzi wa Oracle

Informix MetaCube

Dimensional Insight

Biashara ya Hyperion

Cognos PowerPlay

Express ya kibinafsi

Mitazamo ya iTM1

Kwa kuwa ni uhifadhi ambao huamua usindikaji, ni kawaida kupanga kwa chaguzi za uhifadhi, ambayo ni:

  • Bidhaa za ROLAP katika sekta ya 1, 2, 3
  • Eneo-kazi OLAP - katika sekta ya 6

Bidhaa za MOLAP - katika sekta ya 4 na 5

Bidhaa za HOLAP (zinazoruhusu chaguzi za uhifadhi wa data zenye pande nyingi na uhusiano) - katika 2 na 4 (katika italiki)

Aina za bidhaa za OLAP

Kuna zaidi ya wachuuzi 40 wa OLAP, ingawa hawawezi wote kuchukuliwa kuwa washindani kwa sababu uwezo wao ni tofauti sana na, kwa kweli, wanafanya kazi katika sehemu tofauti za soko. Wanaweza kuunganishwa katika makundi 4 ya msingi, tofauti kati ya ambayo ni msingi wa dhana zifuatazo: utendaji tata - utendaji rahisi, utendaji - nafasi ya disk. Ni muhimu kuonyesha kategoria katika umbo la mraba kwa sababu inaonyesha wazi uhusiano kati yao. Kipengele tofauti cha kila aina kinawakilishwa kwa upande wake, na kufanana na wengine kunawakilishwa kwa pande za karibu, kwa hiyo, makundi ya pande tofauti ni tofauti kimsingi.

Upekee

Faida

Mapungufu

Wawakilishi

Imetumika OLAP

Kamilisha programu zilizo na utendaji mzuri. Karibu zote zinahitaji hifadhidata ya pande nyingi, ingawa zingine hufanya kazi na moja ya uhusiano. Nyingi za aina hii ya programu ni maalum, kama vile mauzo, utengenezaji, benki, bajeti, ujumuishaji wa kifedha, uchambuzi wa mauzo.

Uwezekano wa kuunganishwa na maombi mbalimbali

Kiwango cha juu cha utendaji

Kiwango cha juu cha kubadilika na kubadilika

Utata wa maombi (mafunzo ya mtumiaji yanahitajika)

Bei ya juu

Suluhisho la Hyperion

Maamuzi ya Kioo

Habari Wajenzi

Bidhaa hiyo inategemea muundo wa data usio na uhusiano ambao hutoa uhifadhi wa aina nyingi, usindikaji na uwasilishaji wa data. Wakati wa mchakato wa uchambuzi, data huchaguliwa pekee kutoka kwa muundo wa multidimensional. Licha ya kiwango cha juu cha uwazi, wasambazaji huwashawishi wanunuzi kununua zana zao wenyewe

Utendaji wa juu (mahesabu ya haraka ya viashiria vya muhtasari na mabadiliko mbalimbali ya multidimensional kwa vipimo vyovyote). Wastani wa muda wa kujibu swali la uchanganuzi wa dharula unapotumia hifadhidata ya pande nyingi kwa kawaida ni oda 1-2 za ukubwa chini ya katika kesi ya RDB.

Kiwango cha juu cha uwazi: idadi kubwa ya bidhaa ambazo ushirikiano unawezekana

Wanakabiliana kwa urahisi na kazi za kujumuisha kazi mbalimbali zilizojengwa ndani ya mfano wa habari, kufanya uchambuzi maalum na mtumiaji, nk.

Haja ya nafasi kubwa ya diski kuhifadhi data (kutokana na upungufu wa data ambayo imehifadhiwa). Haya ni matumizi yasiyofaa sana ya kumbukumbu - kwa sababu ya urekebishaji na ujumuishaji uliotekelezwa hapo awali, kiasi cha data kwenye hifadhidata ya anuwai inalingana na mara 2.5-100 chini ya kiwango cha data ya kina ya asili. Kwa hali yoyote, MOLAP hairuhusu kufanya kazi na hifadhidata kubwa. Kikomo halisi ni hifadhidata ya gigabytes 10-25

Uwezo wa "mlipuko" wa hifadhidata ni ongezeko lisilotarajiwa, kali, lisilo na usawa la ujazo wake.

Ukosefu wa kubadilika linapokuja suala la kurekebisha miundo ya data. Mabadiliko yoyote katika muundo wa vipimo karibu daima inahitaji urekebishaji kamili wa hypercube

Kwa hifadhidata za multidimensional, kwa sasa hakuna viwango sawa vya kiolesura, lugha za kuelezea na kudhibiti data.

Hyperion (Essbase)

DOLAP ( OLAP ya Eneo-kazi)

Bidhaa za OLAP za mteja ambazo ni rahisi kutekeleza na zina gharama ya chini kwa kila kiti

Tunazungumza juu ya usindikaji kama huo wa uchambuzi ambapo hypercubes ni ndogo, mwelekeo wao ni mdogo, mahitaji ni ya kawaida, na kwa usindikaji kama huo wa uchambuzi mashine ya kibinafsi kwenye desktop inatosha.

Lengo la wazalishaji wa soko hili ni kufanya mamia na maelfu ya kazi kiotomatiki, lakini watumiaji lazima wafanye uchanganuzi rahisi. Wanunuzi mara nyingi wanahimizwa kununua kazi zaidi kuliko lazima

Ushirikiano mzuri na hifadhidata: multidimensional, uhusiano

Uwezekano wa kufanya manunuzi magumu, ambayo hupunguza gharama za utekelezaji wa miradi

Urahisi wa matumizi ya maombi

Utendaji mdogo sana (hauwezi kulinganishwa katika suala hili na bidhaa maalum)

Nguvu ndogo sana (idadi ndogo za data, idadi ndogo ya vipimo)

Cognos (PowerPlay)

Vitu vya Biashara

Maamuzi ya Kioo

Hii ndiyo sekta ndogo zaidi ya soko.

Data ya kina inabaki pale ilipokuwa awali - katika hifadhidata ya uhusiano; baadhi ya aggregates huhifadhiwa katika hifadhidata sawa katika jedwali za huduma iliyoundwa mahususi

Ina uwezo wa kushughulikia kiasi kikubwa sana cha data (uhifadhi wa gharama nafuu)

Toa hali ya uendeshaji ya watumiaji wengi, ikijumuisha hali ya uhariri, na sio kusoma tu

Kiwango cha juu cha ulinzi wa data na chaguo nzuri za kutofautisha haki za ufikiaji

Mabadiliko ya mara kwa mara kwa muundo wa kipimo yanawezekana (hauhitaji upangaji upya wa hifadhidata)

Utendaji wa chini, duni sana katika suala la kasi ya majibu kwa yale ya pande nyingi (majibu kwa maswali changamano hupimwa kwa dakika au hata saa badala ya sekunde). Hawa ni waundaji wa ripoti bora kuliko zana shirikishi za uchanganuzi

Utata wa bidhaa. Inahitaji gharama kubwa za matengenezo kutoka kwa wataalamu wa teknolojia ya habari. Ili kutoa utendaji unaolinganishwa na MOLAP, mifumo ya uhusiano inahitaji muundo makini wa schema ya hifadhidata na usanidi wa faharasa, yaani, juhudi nyingi kwa upande wa wasimamizi wa hifadhidata.

Ghali kutekeleza

Vizuizi vya SQL vinabaki kuwa ukweli, ambayo inazuia utekelezaji katika RDBMS wa kazi nyingi zilizojengwa ndani ambazo hutolewa kwa urahisi katika mifumo kulingana na uwakilishi wa data nyingi.

Faida ya Habari

Informix (MetaCube)

Ikumbukwe kwamba watumiaji wa bidhaa mseto zinazoruhusu uchaguzi wa hali ya ROLAP na MOLAP, kama vile Huduma za Uchambuzi wa Microsoft, Oracle Express, Crystal Holos, IBM DB2 OLAPServer, karibu kila wakati huchagua hali ya MOLAP.

Kila moja ya kategoria zilizowasilishwa ina nguvu na udhaifu wake; hakuna chaguo moja bora. Uchaguzi huathiri vipengele 3 muhimu: 1) utendaji; 2) nafasi ya disk kwa kuhifadhi data; 3) uwezo, utendakazi na haswa uzani wa suluhisho la OLAP. Katika kesi hiyo, ni muhimu kuzingatia kiasi cha data kinachosindika, nguvu ya vifaa, mahitaji ya watumiaji na kutafuta maelewano kati ya kasi na upungufu wa nafasi ya disk iliyochukuliwa na database, unyenyekevu na ustadi.

Uainishaji wa Maghala ya Data kwa mujibu wa ujazo wa hifadhidata lengwa

Hasara za OLAP

Kama teknolojia yoyote, OLAP pia ina vikwazo vyake: mahitaji ya juu ya vifaa, mafunzo na ujuzi wa wafanyakazi wa utawala na watumiaji wa mwisho, gharama kubwa za utekelezaji wa mradi wa utekelezaji (fedha na wakati, kiakili).

Kuchagua bidhaa OLAP

Kuchagua bidhaa sahihi ya OLAP ni vigumu, lakini ni muhimu sana ikiwa unataka mradi usifaulu.

Kama unaweza kuona, tofauti za bidhaa ziko katika maeneo mengi: kazi, usanifu, kiufundi. Baadhi ya bidhaa ni chache sana katika mipangilio. Baadhi zimeundwa kwa maeneo maalum ya somo: uuzaji, mauzo, fedha. Kuna bidhaa kwa madhumuni ya jumla, ambayo haina matumizi maalum ya maombi, ambayo lazima iwe rahisi kabisa. Kama sheria, bidhaa kama hizo ni za bei rahisi kuliko zile maalum, lakini gharama za utekelezaji ni kubwa zaidi. Bidhaa mbalimbali za OLAP ni pana sana - kutoka kwa zana rahisi zaidi za kujenga majedwali egemeo na chati ambazo ni sehemu ya bidhaa za ofisi, hadi zana za kuchanganua data na kutafuta ruwaza, zinazogharimu makumi ya maelfu ya dola.

Kama ilivyo katika uwanja mwingine wowote, katika uwanja wa OLAP hakuwezi kuwa na miongozo wazi ya kuchagua zana. Unaweza kuzingatia tu idadi ya pointi muhimu na kulinganisha uwezo wa programu iliyopendekezwa na mahitaji ya shirika. Jambo moja ni muhimu: bila kufikiria vizuri jinsi utakavyotumia zana za OLAP, una hatari ya kujitengenezea maumivu ya kichwa.

Wakati wa mchakato wa uteuzi, kuna maswali 2 ya kuzingatia:

  • kutathmini mahitaji na uwezo wa biashara
  • tathmini toleo lililopo kwenye soko, mwelekeo wa maendeleo pia ni muhimu

Kisha kulinganisha haya yote na, kwa kweli, fanya uchaguzi.

Inahitaji tathmini

Huwezi kufanya chaguo la busara la bidhaa bila kuelewa itatumika kwa matumizi gani. Makampuni mengi yanataka "bidhaa bora zaidi" bila ufahamu wazi wa jinsi inapaswa kutumika.

Ili mradi utekelezwe kwa ufanisi, mkurugenzi wa kifedha lazima, kwa kiwango cha chini, kuunda matakwa na mahitaji yake kwa meneja na wataalam wa huduma ya automatisering. Shida nyingi huibuka kwa sababu ya utayarishaji na ufahamu wa kutosha wa kuchagua OLAP; Wataalamu wa IT na watumiaji wa mwisho hupata shida za mawasiliano kwa sababu tu wanabadilisha dhana na istilahi tofauti wakati wa mazungumzo na kuweka mbele mapendeleo yanayokinzana. Kuna haja ya kuwa na uthabiti katika malengo ndani ya kampuni.

Baadhi ya mambo tayari yamedhihirika baada ya kusoma muhtasari wa aina za bidhaa za OLAP, ambazo ni:

Vipengele vya kiufundi

  • Vyanzo vya data: ghala la data la shirika, mfumo wa OLTP, faili za jedwali, hifadhidata za uhusiano. Uwezekano wa kuunganisha zana za OLAP na DBMS zote zinazotumiwa katika shirika. Kama inavyoonyesha mazoezi, ujumuishaji wa bidhaa nyingi katika mfumo wa uendeshaji thabiti ni moja wapo ya maswala muhimu, na suluhisho lake katika hali zingine linaweza kuhusishwa na shida kubwa. Ni muhimu kuelewa jinsi inavyowezekana kwa urahisi na kwa uhakika kujumuisha zana za OLAP na DBMS zilizopo katika shirika. Ni muhimu pia kutathmini uwezekano wa kuunganishwa sio tu na vyanzo vya data, lakini pia na programu zingine ambazo unaweza kuhitaji kusafirisha data: barua pepe, maombi ya ofisi.
  • Tofauti ya data kuzingatiwa
  • Mfumo wa seva: NT, Unix, AS/400, Linux - lakini usisisitize kuwa bidhaa za ubainishaji wa OLAP zitumike kwenye majukwaa ya kutiliwa shaka au yanayokufa ambayo bado unatumia.
  • Viwango vya upande wa mteja na kivinjari
  • Usanifu unaoweza kutekelezwa: mtandao wa ndani na muunganisho wa modemu ya Kompyuta, mteja/seva ya kasi ya juu, intraneti, nje, Mtandao
  • Sifa za Kimataifa: Usaidizi wa sarafu nyingi, uendeshaji wa lugha nyingi, kushiriki data, ujanibishaji, utoaji leseni, sasisho la Windows

Kiasi cha taarifa ya pembejeo ambayo inapatikana na ambayo itaonekana katika siku zijazo

Watumiaji

  • Eneo la maombi: uchambuzi wa mauzo/uuzaji, bajeti/mipango, uchanganuzi wa utendaji kazi, uchanganuzi wa ripoti ya uhasibu, uchanganuzi wa ubora, hali ya kifedha, uzalishaji wa nyenzo za uchambuzi (ripoti)
  • Idadi ya watumiaji na eneo lao, mahitaji ya mgawanyiko wa haki za ufikiaji wa data na kazi, usiri (usiri) wa habari.
  • Aina ya mtumiaji: usimamizi mkuu, fedha, masoko, HR, mauzo, uzalishaji, nk.
  • Uzoefu wa mtumiaji. Kiwango cha ujuzi wa mtumiaji. Fikiria kutoa mafunzo. Ni muhimu sana kwamba programu ya mteja wa OLAP imeundwa ili watumiaji wajiamini na waweze kuitumia kwa ufanisi.

Sifa Muhimu: Mahitaji ya Kuandika Urejeshaji Data, Kompyuta Iliyosambazwa, Ubadilishaji wa Sarafu Changamano, Mahitaji ya Uchapishaji wa Ripoti, Kiolesura cha Lahajedwali, Utata wa Mantiki ya Programu, Vipimo Vinavyohitajika, Aina za Uchambuzi: Takwimu, Utafutaji wa Lengo, Uchambuzi wa Nini-Kama

Utekelezaji

  • Nani atahusika katika utekelezaji na uendeshaji: washauri wa nje, kazi ya ndani ya IT au watumiaji wa mwisho
  • Bajeti: programu, maunzi, huduma, uhamisho wa data. Kumbuka kwamba kulipia leseni za bidhaa za OLAP ni sehemu ndogo tu ya jumla ya gharama ya mradi. Gharama za utekelezaji na maunzi zinaweza kuwa zaidi ya ada ya leseni, na gharama za usaidizi wa muda mrefu, uendeshaji na usimamizi ni karibu zaidi. Na ikiwa utafanya uamuzi mbaya wa kununua bidhaa isiyo sahihi kwa sababu tu ni ya bei nafuu, unaweza kuishia na gharama ya juu zaidi ya mradi kutokana na matengenezo ya juu, usimamizi na/au gharama za vifaa kwa kile ambacho utapata kiwango cha chini cha manufaa ya biashara. . Unapokadiria jumla ya gharama, hakikisha umeuliza maswali yafuatayo: Je, ni kwa upana gani vyanzo vya utekelezaji, mafunzo na usaidizi vinapatikana? Je, mfuko wa jumla unaowezekana (wafanyakazi, wakandarasi, washauri) una uwezekano wa kukua au kupungua? Je, unaweza kutumia uzoefu wako wa kitaaluma wa kiviwanda kwa upana gani?

Licha ya ukweli kwamba gharama ya mifumo ya uchambuzi inabaki juu sana hata leo, na mbinu na teknolojia za kutekeleza mifumo kama hiyo bado ni changa, leo athari ya kiuchumi ambayo hutoa kwa kiasi kikubwa inazidi athari za mifumo ya jadi ya uendeshaji.

Athari za shirika sahihi, mipango ya kimkakati na uendeshaji wa maendeleo ya biashara ni vigumu kuhesabu mapema, lakini ni dhahiri kwamba inaweza kuzidi gharama za kutekeleza mifumo hiyo kwa makumi na hata mamia ya nyakati. Hata hivyo, mtu haipaswi kuwa na makosa. Athari haihakikishwa na mfumo yenyewe, lakini na watu wanaofanya kazi nao. Kwa hivyo, matamko kama vile: "mfumo wa Data Warehousing na teknolojia ya OLAP itasaidia meneja kufanya maamuzi sahihi" si sahihi kabisa." Mifumo ya kisasa ya uchanganuzi sio mifumo ya akili ya bandia na haiwezi kusaidia au kuzuia kufanya maamuzi. Lengo lao ni kumpa meneja mara moja taarifa zote muhimu ili kufanya uamuzi katika fomu rahisi. Na ni habari gani itaombwa na uamuzi gani utafanywa kulingana na inategemea tu mtu maalum anayetumia.

Kinachobaki kusema ni kwamba mifumo hii inaweza kusaidia kutatua shida nyingi za biashara na inaweza kuwa na athari chanya kubwa. Inabakia kuonekana ni nani atakuwa wa kwanza kutambua faida za njia hii na kuwa mbele ya wengine.