teknologi analisis olap. Membuat aplikasi olap

Tujuan kerja kursus adalah untuk mengkaji teknologi OLAP, konsep pelaksanaan dan strukturnya.

Dalam dunia moden, rangkaian komputer dan sistem pengkomputeran memungkinkan untuk menganalisis dan memproses sejumlah besar data.

Sebilangan besar maklumat sangat merumitkan pencarian untuk penyelesaian, tetapi memungkinkan untuk mendapatkan pengiraan dan analisis yang lebih tepat. Untuk menyelesaikan masalah ini, terdapat keseluruhan kelas sistem maklumat yang melakukan analisis. Sistem sedemikian dipanggil sistem sokongan keputusan (DSS) (Sistem Sokongan Keputusan).

Untuk melakukan analisis, DSS mesti mengumpul maklumat, mempunyai cara untuk input dan penyimpanannya. Secara keseluruhan, kita boleh membezakan tiga tugas utama yang diselesaikan dalam DSS:

· input data;

· simpanan data;

· analisis data.

Kemasukan data ke dalam DSS dijalankan secara automatik daripada penderia yang mencirikan keadaan persekitaran atau proses, atau oleh pengendali manusia.

Jika input data dijalankan secara automatik daripada penderia, maka data terkumpul oleh isyarat kesediaan yang berlaku apabila maklumat muncul atau melalui pengundian kitaran. Sekiranya input dijalankan oleh seseorang, maka mereka mesti menyediakan pengguna dengan cara yang mudah untuk memasukkan data, menyemaknya untuk ketepatan input, serta melakukan pengiraan yang diperlukan.

Apabila memasukkan data secara serentak oleh beberapa pengendali, adalah perlu untuk menyelesaikan masalah pengubahsuaian dan akses selari data yang sama.

DSS menyediakan penganalisis dengan data dalam bentuk laporan, jadual, graf untuk kajian dan analisis, itulah sebabnya sistem sedemikian menyediakan fungsi sokongan keputusan.

Subsistem kemasukan data, dipanggil OLTP (Pemprosesan transaksi dalam talian), melaksanakan pemprosesan data operasi. Untuk melaksanakannya, sistem pengurusan pangkalan data konvensional (DBMS) digunakan.

Subsistem analisis boleh dibina berdasarkan:

· subsistem analisis perolehan semula maklumat berdasarkan DBMS hubungan dan pertanyaan statik menggunakan bahasa SQL;

· subsistem analisis operasi. Untuk melaksanakan subsistem sedemikian, teknologi pemprosesan data analisis operasi OLAP digunakan, menggunakan konsep perwakilan data berbilang dimensi;

· subsistem analisis intelek. Subsistem ini melaksanakan kaedah dan algoritma DataMining.

Dari sudut pandangan pengguna, sistem OLAP menyediakan alat untuk melihat maklumat yang fleksibel dalam pelbagai bahagian, mendapatkan data agregat secara automatik, melaksanakan operasi analitik konvolusi, menggerudi ke bawah dan perbandingan dari semasa ke semasa. Terima kasih kepada semua ini, sistem OLAP adalah penyelesaian dengan kelebihan besar dalam bidang penyediaan data untuk semua jenis pelaporan perniagaan, yang melibatkan pembentangan data dalam pelbagai bahagian dan tahap hierarki yang berbeza, seperti laporan jualan, pelbagai bentuk belanjawan dan yang lain. Sistem OLAP mempunyai kelebihan hebat daripada perwakilan sedemikian dalam bentuk analisis data lain, termasuk peramalan.

1.2 Definisi OLAP -sistem

Teknologi untuk analisis data multidimensi kompleks dipanggil OLAP. OLAP ialah komponen utama organisasi gudang data.

Fungsi OLAP boleh dilaksanakan dalam pelbagai cara, kedua-dua yang mudah, seperti analisis data dalam aplikasi pejabat dan yang lebih kompleks - sistem analisis teragih berdasarkan produk pelayan.

OLAP (On-LineAnalyticalProcessing) ialah teknologi untuk pemprosesan data analisis operasi yang menggunakan alat dan kaedah untuk mengumpul, menyimpan dan menganalisis data berbilang dimensi untuk menyokong proses membuat keputusan.

Tujuan utama sistem OLAP adalah untuk menyokong aktiviti analisis dan pertanyaan sewenang-wenangnya penganalisis pengguna. Tujuan analisis OLAP adalah untuk menguji hipotesis yang muncul.

Laporan OLAP berbeza daripada laporan biasa kerana anda sendiri yang menentukan parameter yang anda ingin dapatkan maklumat. Dalam sistem iiko, laporan tersebut boleh dibina untuk menganalisis sebarang data. Contohnya, tentang jumlah hasil, hidangan popular, prestasi pekerja, penggunaan barangan, dsb.

Jika pedagang adalah sebahagian daripada rangkaian yang diurus menggunakan iikoChain, maka laporan OLAP boleh dikonfigurasikan secara berpusat dalam Rantaian dan kemudian direplikasi kepada RMS. Mengedit dan memadamkan laporan OLAP "berpusat" sedemikian di peruncit individu tidak boleh dilakukan.

Semasa replikasi, laporan dalam iikoRMS digantikan dengan laporan "berpusat" yang dinamakan serupa yang dimuat turun daripada iikoChain.

Terdapat dua jenis laporan OLAP dalam sistem:

  • Laporan Jualan OLAP untuk menganalisis apa-apa maklumat yang melalui cek tebuk. Apakah maksud parameter laporan dan cara ia dikira, lihat artikel Medan Laporan Jualan OLAP.
  • Laporan Penyiaran OLAP untuk menganalisis maklumat mengenai transaksi berdaftar. Penyiaran adalah gambaran mana-mana operasi yang menyebabkan pergerakan dana melalui akaun dalaman sistem.

Contohnya, dalam laporan jualan anda boleh melihat maklumat tentang bilangan hidangan yang dijual dan bilangan tetamu yang membelinya setiap hari, tetapi untuk melihat cara bahan-bahan hidangan yang dijual telah dihapuskan, anda perlu menggunakan Menyiarkan laporan. Ini disebabkan oleh fakta bahawa untuk sistem, jualan bermakna, sebagai tambahan kepada wang yang diterima daripada tetamu, hapus kira barangan yang merupakan ramuan hidangan dari gudang. Setiap hapus kira adalah entri yang berasingan.

Laporan ini terdapat dalam item menu Laporan. Di samping itu, Laporan Jualan OLAP boleh dibina daripada senarai anjakan daftar tunai. Untuk melakukan ini, dalam item menu Jualan runcit Juruwang syif tandakan syif yang anda minati dan dalam menu Tindakan pilih barang Buat laporan OLAP baharu.

Laporan Jualan OLAP sudah diprakonfigurasikan dengan laporan untuk menganalisis jumlah hasil. Untuk membina salah satu daripada laporan ini, anda hanya perlu memilih namanya dalam medan Format Laporan.

Untuk menambah laporan baharu:

  1. Seret parameter ke kawasan data.
  2. Klik butang Simpan sebagai.
  3. Masukkan tajuk dan pilih jenis laporan:
  • “Untuk semua pengguna” – laporan tersedia untuk semua pengguna.
  • "Hanya untuk saya" - laporan hanya tersedia kepada pencipta.
  1. Klik butang Jimat.

Pengguna dengan hak "Edit laporan OLAP umum" ( B_ESOR) boleh membuat dan mengedit semua laporan, termasuk yang tersedia untuk semua pengguna.

Jika kebenaran ialah "Edit laporan OLAP umum" ( B_ESOR) pengguna tidak mempunyai, maka dia boleh membuat dan menyimpan laporan peribadi sahaja. Yang umum tersedia hanya untuk membaca dan mengedit tanpa menyimpan perubahan

Penunjuk yang boleh ditambah pada laporan terletak di sebelah kiri dalam susunan abjad. Di bawah nama setiap daripada mereka ditunjukkan kumpulan di mana penunjuk ini tergolong.

Untuk membina laporan, seret parameter minat ke dalam baris, lajur atau kawasan data jadual. Kawasan di mana anda boleh meletakkan parameter akan diserlahkan dengan warna biru.

Untuk memudahkan mencari penunjuk yang diingini, masukkan namanya dalam bar carian:

Semua parameter dibahagikan kepada kumpulan. Butang dengan nama kumpulan diserlahkan dengan warna biru. Jika anda mengklik padanya, dengan itu mengalih keluar lampu latar, butang dengan parameter yang berkaitan dengan kumpulan ini akan hilang daripada senarai. Sebagai contoh, jika, semasa membina laporan tertentu, anda tidak berminat dengan maklumat tentang lokasi perkhidmatan (cawangan) kedudukan itu diletakkan dan di tempat daftar tunai pesanan ditutup, maka anda boleh menyembunyikan parameter "Organisasi" kumpulan.

Sebagai penapis tambahan, data laporan boleh dihadkan kepada satu atau lebih nilai parameter yang diminati. Untuk ini:


Anda boleh memilih nilai parameter dengan cara tertentu menggunakan jenis penapisan:

  • termasuk: laporan akan membentangkan data hanya untuk nilai yang disemak dalam penapis. Nilai yang tiada dalam senarai semasa menetapkan penapis tidak akan disertakan dalam laporan kemudian (contohnya, jika hidangan baharu muncul, ia tidak akan dipaparkan dalam laporan jualan).
  • Eksklusif: laporan akan membentangkan data untuk semua nilai kecuali yang disemak dalam penapis ini. Untuk memilih jenis ini, klik pada butang termasuk, akibatnya, tulisan di atasnya akan berubah dan jenis penapis akan digunakan Eksklusif.

Penunjuk yang mana penapis telah digunakan diserlahkan dalam warna gelap dan diletakkan pada permulaan senarai jika ia belum ditambahkan pada baris, lajur atau kawasan data jadual.

Jika anda sedang membina atau membina semula laporan yang mengandungi banyak data, anda disyorkan supaya menyahtanda Kemas kini automatik, jadi ini boleh meningkatkan masa yang diperlukan untuk menghasilkan laporan. Jika medan ini disemak, maka semua perubahan dalam data yang dibentangkan dalam laporan akan dijejaki dalam masa nyata dan serta-merta dipaparkan di dalamnya.

Anda juga boleh mendapatkan maklumat jualan dan transaksi yang didaftarkan di iiko melalui Internet menggunakan

Tujuan laporan

Laporan ini akan menumpukan pada salah satu kategori teknologi pintar yang merupakan alat analisis yang mudah - teknologi OLAP.

Tujuan laporan: untuk mendedahkan dan mengetengahkan 2 isu: 1) konsep OLAP dan kepentingan penggunaannya dalam pengurusan kewangan; 2) pelaksanaan fungsi OLAP dalam penyelesaian perisian: perbezaan, keupayaan, kelebihan, keburukan.

Saya ingin ambil perhatian segera bahawa OLAP ialah alat universal yang boleh digunakan dalam mana-mana kawasan aplikasi, dan bukan hanya dalam kewangan (seperti yang boleh difahami daripada tajuk laporan), yang memerlukan analisis data menggunakan pelbagai kaedah.

Pengurusan kewangan

Pengurusan kewangan adalah bidang di mana analisis adalah lebih penting daripada yang lain. Sebarang keputusan kewangan dan pengurusan timbul akibat prosedur analisis tertentu. Hari ini, pengurusan kewangan menjadi penting untuk kejayaan sesebuah perusahaan berfungsi. Walaupun pengurusan kewangan adalah proses tambahan dalam perusahaan, ia memerlukan perhatian khusus, kerana keputusan kewangan dan pengurusan yang salah boleh menyebabkan kerugian besar.

Pengurusan kewangan bertujuan untuk menyediakan perusahaan dengan sumber kewangan dalam jumlah yang diperlukan, pada masa yang sesuai dan di tempat yang betul untuk mendapatkan kesan maksimum daripada penggunaannya melalui pengedaran yang optimum.

Mungkin sukar untuk menentukan tahap "kecekapan sumber maksimum", tetapi dalam apa jua keadaan,

CFO harus sentiasa tahu:

  • Berapa banyak sumber kewangan yang ada?
  • Dari mana dana akan datang dan dalam kuantiti berapa?
  • di mana untuk melabur dengan lebih berkesan dan mengapa?
  • dan pada masa yang manakah semua ini perlu dilakukan?
  • berapa banyak yang diperlukan untuk memastikan operasi normal perusahaan?

Untuk mendapatkan jawapan yang munasabah kepada soalan-soalan ini, adalah perlu untuk mempunyai, menganalisis dan mengetahui cara menganalisis bilangan penunjuk prestasi yang cukup besar. Di samping itu, FU merangkumi sejumlah besar bidang: analisis aliran tunai (aliran tunai), analisis aset dan liabiliti, analisis keuntungan, analisis margin, analisis keuntungan, analisis pelbagai.

Pengetahuan

Oleh itu, faktor utama dalam keberkesanan proses pengurusan kewangan ialah ketersediaan pengetahuan:

  • Pengetahuan peribadi dalam bidang subjek (mungkin dikatakan teori dan metodologi), termasuk pengalaman, gerak hati seorang pembiaya/pengarah kewangan
  • Pengetahuan am (korporat) atau maklumat sistematik tentang fakta transaksi kewangan dalam perusahaan (iaitu maklumat tentang keadaan masa lalu, masa kini dan masa depan perusahaan, dibentangkan dalam pelbagai penunjuk dan ukuran)

Jika yang pertama terletak pada skop tindakan pembiaya ini (atau pengarah HR yang mengupah pekerja ini), maka yang kedua harus dibuat secara sengaja di perusahaan oleh usaha bersama pekerja perkhidmatan kewangan dan maklumat.

Apa yang ada sekarang

Walau bagaimanapun, kini keadaan paradoks adalah tipikal dalam perusahaan: terdapat maklumat, terdapat banyak, terlalu banyak. Tetapi ia berada dalam keadaan huru-hara: tidak berstruktur, tidak konsisten, berpecah-belah, tidak selalu boleh dipercayai dan sering tersilap, hampir mustahil untuk dicari dan diperolehi. Generasi penyata kewangan yang panjang dan sering tidak berguna dijalankan, yang menyusahkan untuk analisis kewangan dan sukar difahami, kerana ia dicipta bukan untuk pengurusan dalaman, tetapi untuk penyerahan kepada pihak berkuasa kawal selia luar.

Menurut hasil kajian yang dijalankan oleh syarikat tersebut Reuters Di antara 1,300 pengurus antarabangsa, 38% responden mengatakan mereka menghabiskan banyak masa untuk mencari maklumat yang mereka perlukan. Ternyata pakar yang berkelayakan tinggi menghabiskan masa bergaji tinggi bukan untuk analisis data, tetapi untuk mengumpul, mencari dan menyusun maklumat yang diperlukan untuk analisis ini. Pada masa yang sama, pengurus dibebani dengan data yang selalunya tidak relevan, yang sekali lagi mengurangkan keberkesanan kerja mereka. Sebab keadaan ini: maklumat berlebihan dan kekurangan pengetahuan.

Apa nak buat

Maklumat mesti ditukar kepada pengetahuan. Untuk perniagaan moden, maklumat berharga, pemerolehan sistematik, sintesis, pertukaran, penggunaan adalah sejenis mata wang, tetapi untuk menerimanya, adalah perlu untuk menguruskan maklumat, seperti mana-mana proses perniagaan.

Kunci kepada pengurusan maklumat ialah menyampaikan maklumat yang betul dalam bentuk yang betul kepada pihak berkepentingan dalam organisasi pada masa yang sesuai. Matlamat pengurusan sedemikian adalah untuk membantu orang ramai bekerjasama dengan lebih baik menggunakan jumlah maklumat yang semakin meningkat.

Teknologi maklumat dalam kes ini bertindak sebagai cara yang memungkinkan untuk mensistematisasikan maklumat dalam perusahaan, menyediakan pengguna tertentu dengan akses kepadanya dan memberi mereka alat untuk mengubah maklumat ini menjadi pengetahuan.

Konsep asas teknologi OLAP

Teknologi OLAP (daripada Pemprosesan Analitik Dalam Talian Bahasa Inggeris) ialah nama bukan untuk produk tertentu, tetapi untuk keseluruhan teknologi untuk analisis operasi data berbilang dimensi yang terkumpul dalam gudang. Untuk memahami intipati OLAP, adalah perlu untuk mempertimbangkan proses tradisional untuk mendapatkan maklumat untuk membuat keputusan.

Sistem sokongan keputusan tradisional

Di sini, sudah tentu, terdapat juga banyak pilihan: kekacauan maklumat lengkap atau situasi paling tipikal apabila perusahaan mempunyai sistem operasi dengan bantuan fakta operasi tertentu direkodkan dan disimpan dalam pangkalan data. Untuk mengekstrak data daripada pangkalan data untuk tujuan analisis, sistem pertanyaan untuk sampel data tertentu telah dibina.

Tetapi kaedah sokongan keputusan ini tidak mempunyai fleksibiliti dan mempunyai banyak kelemahan:

  • jumlah data yang boleh diabaikan digunakan yang boleh berguna untuk membuat keputusan
  • kadangkala laporan berbilang halaman yang kompleks dibuat, yang mana 1-2 baris sebenarnya digunakan (selebihnya hanya untuk berjaga-jaga) - maklumat yang berlebihan
  • tindak balas perlahan proses kepada perubahan: jika perwakilan data baharu diperlukan, permintaan mesti diterangkan dan dikodkan secara rasmi oleh pengaturcara, barulah dilaksanakan. Masa menunggu: jam, hari. Atau mungkin penyelesaian diperlukan sekarang, segera. Tetapi selepas menerima maklumat baru, persoalan baru akan timbul (menjelaskan)

Jika laporan pertanyaan dibentangkan dalam format satu dimensi, maka masalah perniagaan biasanya berbilang dimensi dan pelbagai rupa. Jika anda ingin mendapatkan gambaran yang jelas tentang perniagaan syarikat, maka anda perlu menganalisis data dari pelbagai perspektif.

Banyak syarikat mencipta pangkalan data perhubungan yang sangat baik, secara idealnya menyusun segunung maklumat yang tidak digunakan, yang dengan sendirinya tidak memberikan sama ada tindak balas yang cepat atau cukup cekap kepada acara pasaran. YA - pangkalan data hubungan adalah, sedang dan akan menjadi teknologi yang paling sesuai untuk menyimpan data korporat. Kami tidak bercakap tentang teknologi pangkalan data baharu, tetapi lebih kepada alat analisis yang melengkapkan fungsi DBMS sedia ada dan cukup fleksibel untuk menyediakan dan mengautomasikan pelbagai jenis analisis intelektual yang wujud dalam OLAP.

Memahami OLAP

Apakah yang disediakan oleh OLAP?

  • Alat capaian data storan lanjutan
  • Manipulasi data interaktif dinamik (putaran, penyatuan atau gerudi ke bawah)
  • Paparan visual data yang jelas
  • Cepat – analisis dijalankan dalam masa nyata
  • Persembahan data berbilang dimensi - analisis serentak beberapa penunjuk sepanjang beberapa dimensi

Untuk mendapatkan kesan penggunaan teknologi OLAP, anda mesti: 1) memahami intipati teknologi itu sendiri dan keupayaannya; 2) mentakrifkan dengan jelas proses apa yang perlu dianalisis, penunjuk apa yang akan dicirikan olehnya dan dalam dimensi apa yang dinasihatkan untuk melihatnya, iaitu mencipta model analisis.

Konsep asas yang digunakan oleh teknologi OLAP adalah seperti berikut:

Multidimensi

Untuk memahami kepelbagaian dimensi data, anda harus terlebih dahulu membentangkan jadual yang menunjukkan, sebagai contoh, prestasi Kos Perusahaan mengikut elemen ekonomi dan unit perniagaan.

Data ini dibentangkan dalam dua dimensi:

  • artikel
  • Unit perniagaan

Jadual ini tidak bermaklumat, kerana ia menunjukkan jualan untuk satu tempoh masa tertentu. Untuk tempoh masa yang berbeza, penganalisis perlu membandingkan beberapa jadual (untuk setiap tempoh masa):

Rajah menunjukkan dimensi ke-3, Masa, sebagai tambahan kepada dua yang pertama. (Artikel, unit perniagaan)

Satu lagi cara untuk menunjukkan data berbilang dimensi adalah dengan mewakilinya dalam bentuk kubus:

Kiub OLAP membolehkan penganalisis mendapatkan data pada pelbagai bahagian untuk mendapatkan jawapan kepada soalan yang dikemukakan oleh perniagaan:

  • Kos yang manakah kritikal dalam unit perniagaan yang mana?
  • Bagaimanakah kos unit perniagaan berubah dari semasa ke semasa?
  • Bagaimanakah item kos berubah dari semasa ke semasa?

Jawapan kepada soalan sedemikian adalah perlu untuk membuat keputusan pengurusan: mengenai pengurangan item kos tertentu, kesan ke atas strukturnya, mengenal pasti sebab perubahan dalam kos dari semasa ke semasa, sisihan daripada rancangan dan penghapusan mereka - mengoptimumkan strukturnya.

Dalam contoh ini, hanya 3 dimensi dipertimbangkan. Sukar untuk menggambarkan lebih daripada 3 dimensi, tetapi ia berfungsi dengan cara yang sama seperti 3 dimensi.

Biasanya, aplikasi OLAP membolehkan anda mendapatkan data pada 3 atau lebih dimensi, contohnya, anda boleh menambah satu lagi dimensi - Pelan-Sebenar, Kategori Kos: langsung, tidak langsung, mengikut Pesanan, mengikut Bulan. Dimensi tambahan membolehkan anda mendapatkan lebih banyak kepingan analisis dan memberikan jawapan kepada soalan dengan pelbagai syarat.

Hierarki

OLAP juga membenarkan penganalisis untuk menyusun setiap dimensi ke dalam hierarki kumpulan, subkumpulan dan jumlah yang mencerminkan ukuran merentas seluruh organisasi—cara paling logik untuk menganalisis perniagaan.

Sebagai contoh, adalah dinasihatkan untuk mengumpulkan kos secara hierarki:

OLAP membolehkan penganalisis melihat metrik ringkasan keseluruhan (di peringkat atas) dan kemudian menggerudi ke bawah dan peringkat seterusnya untuk mengetahui sebab sebenar metrik berubah.

Dengan membenarkan penganalisis menggunakan berbilang dimensi dalam kiub data, dengan keupayaan untuk membina dimensi secara hierarki, OLAP menyediakan gambaran perniagaan yang tidak dimampatkan oleh struktur gudang maklumat.

Menukar arah analisis dalam kubus (data berputar)

Sebagai peraturan, mereka beroperasi dalam konsep: dimensi yang dinyatakan dalam lajur, baris (mungkin terdapat beberapa daripadanya), kepingan bentuk selebihnya, kandungan dimensi bentuk jadual (jualan, kos, tunai)

Biasanya, OLAP membenarkan anda menukar orientasi dimensi kiub, dengan itu mempersembahkan data dalam paparan berbeza.

Paparan data kubus bergantung pada:

  • orientasi dimensi: dimensi mana yang dinyatakan dalam baris, lajur, kepingan;
  • kumpulan penunjuk, diserlahkan dalam baris, lajur, bahagian.
  • Menukar dimensi adalah dalam skop tindakan pengguna.

Oleh itu, OLAP membolehkan anda menjalankan pelbagai jenis analisis dan memahami hubungannya dengan keputusannya.

  • Analisis sisihan ialah analisis pelaksanaan rancangan, yang ditambah dengan analisis faktor punca penyelewengan dengan memperincikan penunjuk.
  • Analisis ketergantungan: OLAP membolehkan anda mengenal pasti pelbagai kebergantungan antara pelbagai perubahan, contohnya, apabila bir dialih keluar daripada pelbagai dalam tempoh dua bulan pertama, penurunan dalam jualan lipas telah ditemui.
  • Perbandingan (analisis perbandingan). Perbandingan hasil perubahan dalam penunjuk dari semasa ke semasa, untuk kumpulan barang tertentu, di kawasan yang berbeza, dsb.
  • Analisis dinamik membolehkan kami mengenal pasti arah aliran tertentu dalam perubahan penunjuk dari semasa ke semasa.

Kecekapan: kita boleh mengatakan bahawa OLAP adalah berdasarkan undang-undang psikologi: keupayaan untuk memproses permintaan maklumat dalam "masa nyata" - pada kadar proses pemahaman analisis data oleh pengguna.

Jika pangkalan data hubungan boleh membaca kira-kira 200 rekod sesaat dan menulis 20, maka pelayan OLAP yang baik, menggunakan baris dan lajur yang dikira, boleh menyatukan 20,000-30,000 sel (bersamaan dengan satu rekod dalam pangkalan data hubungan) sesaat.

Keterlihatan: Perlu ditekankan bahawa OLAP menyediakan cara lanjutan bagi persembahan grafik data kepada pengguna akhir. Otak manusia mampu melihat dan menganalisis maklumat yang dipersembahkan dalam bentuk imej geometri, dalam jumlah yang beberapa urutan magnitud lebih besar daripada maklumat yang dibentangkan dalam bentuk alfanumerik. Contoh: Katakan anda perlu mencari wajah yang dikenali dalam salah satu daripada seratus gambar. Saya percaya proses ini akan membawa anda tidak lebih daripada satu minit. Sekarang bayangkan bahawa bukannya gambar anda akan ditawarkan seratus penerangan lisan tentang orang yang sama. Saya fikir anda tidak akan dapat menyelesaikan masalah yang dicadangkan sama sekali.

Kesederhanaan: Ciri utama teknologi ini ialah ia bertujuan untuk digunakan bukan oleh pakar dalam bidang teknologi maklumat, bukan oleh ahli statistik pakar, tetapi oleh profesional dalam bidang gunaan - pengurus jabatan kredit, pengurus jabatan belanjawan, dan akhirnya pengarah. Mereka direka untuk penganalisis untuk berkomunikasi dengan masalah, bukan dengan komputer..

Walaupun keupayaan hebat OLAP (selain itu, idea itu agak lama - 60-an), penggunaan sebenar secara praktikalnya tidak pernah ditemui dalam perusahaan kami. kenapa?

  • tiada maklumat atau kemungkinan tidak jelas
  • tabiat berfikir dua dimensi
  • penghalang harga
  • kandungan teknologi berlebihan artikel yang dikhaskan untuk OLAP: istilah luar biasa menakutkan - OLAP, "perlombongan dan penghirisan data", "pertanyaan ad hoc", "pengenalpastian korelasi yang ketara"

Pendekatan kami dan pendekatan Barat terhadap penggunaan OLAP

Di samping itu, kami juga mempunyai pemahaman khusus tentang utiliti aplikasi OLAP walaupun semasa memahami keupayaan teknologinya.

Pengarang kami dan Rusia pelbagai bahan yang dikhaskan untuk OLAP menyatakan pendapat berikut mengenai kegunaan OLAP: kebanyakannya menganggap OLAP sebagai alat yang membolehkan anda mengembangkan dan meruntuhkan data dengan mudah dan mudah, menjalankan manipulasi yang datang ke fikiran penganalisis semasa proses analisis. Lebih banyak "kepingan" dan "bahagian" data yang dilihat oleh penganalisis, lebih banyak idea yang dia ada, yang seterusnya, memerlukan lebih banyak "kepingan" untuk pengesahan. Ia tidak betul.

Pemahaman Barat tentang kegunaan OLAP adalah berdasarkan model analisis metodologi yang mesti digabungkan semasa mereka bentuk penyelesaian OLAP. Penganalisis tidak seharusnya bermain dengan kiub OLAP dan mengubah dimensi dan tahap perinciannya tanpa tujuan, orientasi data, paparan grafik data (dan ini benar-benar memerlukan!), tetapi memahami dengan jelas pandangan yang dia perlukan, dalam urutan dan sebabnya (sudah tentu , elemen " mungkin terdapat penemuan di sini, tetapi ia bukan asas kepada kegunaan OLAP).

Aplikasi OLAP

  • Bajet
  • Aliran dana

Salah satu bidang aplikasi teknologi OLAP yang paling subur. Bukan tanpa alasan bahawa tiada sistem belanjawan moden dianggap lengkap tanpa kehadiran alat OLAP untuk analisis belanjawan. Kebanyakan laporan belanjawan mudah dibina berdasarkan sistem OLAP. Pada masa yang sama, laporan menjawab pelbagai soalan yang sangat luas: analisis struktur perbelanjaan dan pendapatan, perbandingan perbelanjaan untuk item tertentu dalam bahagian yang berbeza, analisis dinamik dan trend perbelanjaan untuk item tertentu, analisis kos dan keuntungan.

OLAP akan membolehkan anda menganalisis aliran masuk dan keluar tunai dalam konteks operasi perniagaan, rakan niaga, mata wang dan masa untuk mengoptimumkan aliran mereka.

  • Pelaporan kewangan dan pengurusan (dengan analitik yang diperlukan oleh pengurusan)
  • Pemasaran
  • Kad Skor Seimbang
  • Analisis Keberuntungan

Jika anda mempunyai data yang sesuai, anda boleh menemui pelbagai aplikasi teknologi OLAP.

produk OLAP

Bahagian ini akan membincangkan OLAP sebagai penyelesaian perisian.

Keperluan am untuk produk OLAP

Terdapat banyak cara untuk melaksanakan aplikasi OLAP, jadi tiada teknologi tertentu sepatutnya diperlukan, malah disyorkan. Di bawah keadaan dan keadaan yang berbeza, satu pendekatan mungkin lebih disukai daripada yang lain. Teknik pelaksanaan termasuk banyak idea proprietari berbeza yang vendor sangat banggakan: variasi seni bina klien-pelayan, analisis siri masa, orientasi objek, pengoptimuman storan data, proses selari, dll. Tetapi teknologi ini tidak boleh menjadi sebahagian daripada definisi OLAP.

Terdapat ciri-ciri yang mesti diperhatikan dalam semua produk OLAP (jika ia adalah produk OLAP), yang merupakan teknologi yang ideal. Ini ialah 5 takrifan utama yang mencirikan OLAP (ujian FASMI yang dipanggil): Analisis Pantas Maklumat Berbilang Dimensi Dikongsi.

  • Cepat(FAST) bermakna sistem seharusnya dapat memberikan kebanyakan respons kepada pengguna dalam masa kira-kira lima saat. Walaupun sistem memberi amaran bahawa proses itu akan mengambil masa yang lebih lama, pengguna mungkin terganggu dan hilang fikiran, dan kualiti analisis akan terjejas. Kelajuan ini tidak mudah dicapai dengan jumlah data yang besar, terutamanya jika pengiraan khas semasa penerbangan diperlukan. Vendor menggunakan pelbagai kaedah untuk mencapai matlamat ini, termasuk bentuk penyimpanan data khusus, pra-pengkomputeran yang meluas atau keperluan perkakasan yang semakin ketat. Walau bagaimanapun, pada masa ini tiada penyelesaian yang dioptimumkan sepenuhnya. Pada pandangan pertama, nampaknya mengejutkan bahawa apabila menerima laporan dalam satu minit yang tidak lama dahulu mengambil masa beberapa hari, pengguna dengan cepat menjadi bosan semasa menunggu, dan projek itu ternyata kurang berjaya berbanding dalam kes sekelip mata. tindak balas, walaupun pada kos analisis yang kurang terperinci.
  • Dikongsi bermakna sistem memungkinkan untuk memenuhi semua keperluan perlindungan data dan melaksanakan akses teragih dan serentak kepada data untuk tahap pengguna yang berbeza. Sistem mesti boleh mengendalikan berbilang perubahan data dengan cara yang selamat dan tepat pada masanya. Ini adalah kelemahan utama kebanyakan produk OLAP, yang cenderung menganggap bahawa semua aplikasi OLAP adalah baca sahaja dan menyediakan kawalan keselamatan yang dipermudahkan.
  • Berbilang dimensi adalah keperluan utama. Jika anda terpaksa mentakrifkan OLAP dalam satu perkataan, anda akan memilihnya. Sistem mesti menyediakan pandangan konseptual berbilang dimensi bagi data, termasuk sokongan penuh untuk hierarki dan berbilang hierarki, kerana ini menentukan cara paling logik untuk menganalisis perniagaan. Tiada bilangan minimum dimensi yang mesti diproses, kerana ini juga bergantung pada aplikasi, dan kebanyakan produk OLAP mempunyai bilangan dimensi yang mencukupi untuk pasaran yang dituju. Sekali lagi, kami tidak menyatakan teknologi pangkalan data asas yang harus digunakan jika pengguna ingin mendapatkan pandangan konseptual yang benar-benar multidimensi bagi maklumat tersebut. Ciri ini adalah nadi OLAP
  • Maklumat. Maklumat yang diperlukan mesti diperolehi di mana ia diperlukan, tanpa mengira jumlah dan lokasi penyimpanannya. Walau bagaimanapun, banyak bergantung pada aplikasi. Kuasa pelbagai produk diukur dari segi jumlah data input yang boleh mereka proses, tetapi bukan berapa banyak gigabait yang boleh mereka simpan. Kuasa produk berbeza-beza - produk OLAP terbesar boleh mengendalikan sekurang-kurangnya seribu kali lebih banyak data daripada yang terkecil. Terdapat banyak faktor yang perlu dipertimbangkan dalam hal ini, termasuk pertindihan data, keperluan RAM, penggunaan ruang cakera, metrik prestasi, penyepaduan dengan gudang maklumat, dsb.
  • Analisis bermakna sistem boleh mengendalikan sebarang analisis logik dan statistik khusus untuk aplikasi tertentu dan memastikan ia disimpan dalam bentuk yang boleh diakses oleh pengguna akhir. Pengguna seharusnya boleh mentakrifkan pengiraan tersuai baharu sebagai sebahagian daripada analisis tanpa memerlukan pengaturcaraan. Iaitu, semua fungsi analisis yang diperlukan mesti disediakan dengan cara yang intuitif untuk pengguna akhir. Alat analisis boleh termasuk prosedur tertentu, seperti analisis siri masa, peruntukan kos, pemindahan mata wang, carian sasaran, dsb. Keupayaan sedemikian berbeza secara meluas antara produk, bergantung pada orientasi sasaran.

Dalam erti kata lain, 5 definisi utama ini ialah matlamat yang direka untuk dicapai oleh produk OLAP.

Aspek teknologi OLAP

Sistem OLAP merangkumi komponen tertentu. Terdapat pelbagai skim untuk operasi mereka yang boleh dilaksanakan oleh produk ini atau itu.

Komponen sistem OLAP (apa yang terdiri daripada sistem OLAP?)

Biasanya, sistem OLAP merangkumi komponen berikut:

  • Sumber data
    Sumber dari mana data untuk analisis diambil (gudang data, pangkalan data sistem perakaunan operasi, set jadual, gabungan di atas).
  • pelayan OLAP
    Data daripada sumber dipindahkan atau disalin ke pelayan OLAP, di mana ia disusun dan disediakan untuk penjanaan respons yang lebih pantas kepada pertanyaan.
  • Pelanggan OLAP
    Antara muka pengguna ke pelayan OLAP di mana pengguna beroperasi

Perlu diingatkan bahawa tidak semua komponen diperlukan. Terdapat sistem OLAP desktop yang membolehkan anda menganalisis data yang disimpan terus pada komputer pengguna dan tidak memerlukan pelayan OLAP.

Walau bagaimanapun, elemen yang diperlukan ialah sumber data: ketersediaan data ialah isu penting. Jika ia wujud, dalam sebarang bentuk, seperti jadual Excel, dalam pangkalan data sistem perakaunan, atau dalam bentuk laporan berstruktur daripada cawangan, pakar IT akan dapat menyepadukan dengan sistem OLAP secara langsung atau dengan penukaran perantaraan. Sistem OLAP mempunyai alat khas untuk ini. Jika data ini tidak tersedia, atau tidak lengkap dan berkualiti, OLAP tidak akan membantu. Iaitu, OLAP hanyalah superstruktur ke atas data, dan jika tidak ada, ia menjadi perkara yang tidak berguna.

Kebanyakan data untuk aplikasi OLAP berasal dari sistem lain. Walau bagaimanapun, dalam sesetengah aplikasi (contohnya, perancangan atau belanjawan), data boleh dibuat terus dalam aplikasi OLAP. Apabila data datang daripada aplikasi lain, biasanya data perlu disimpan dalam borang pendua yang berasingan untuk aplikasi OLAP. Oleh itu, adalah dinasihatkan untuk membuat gudang data.

Perlu diingat bahawa istilah "OLAP" berkait rapat dengan istilah "gudang data" (Gudang Data). Gudang data ialah koleksi data khusus domain, berasaskan masa dan tidak berubah untuk menyokong pembuatan keputusan pengurusan. Data dalam gudang datang daripada sistem operasi (sistem OLTP), yang direka untuk mengautomasikan proses perniagaan; gudang boleh diisi semula daripada sumber luaran, contohnya, laporan statistik.

Walaupun fakta bahawa ia mengandungi maklumat yang jelas berlebihan yang sudah ada dalam pangkalan data atau fail sistem pengendalian, gudang data diperlukan kerana:

  • pemecahan data, menyimpannya dalam pelbagai format DBMS;
  • prestasi pengambilan data bertambah baik
  • jika dalam perusahaan semua data disimpan pada pelayan pangkalan data pusat (yang sangat jarang berlaku), penganalisis mungkin tidak akan memahami strukturnya yang kompleks, kadangkala mengelirukan
  • pertanyaan analitikal yang kompleks untuk maklumat operasi memperlahankan kerja semasa syarikat, menyekat jadual untuk masa yang lama dan mengambil alih sumber pelayan
  • keupayaan untuk membersihkan dan menyelaraskan data
  • adalah mustahil atau sangat sukar untuk menganalisis data secara langsung daripada sistem pengendalian;

Tujuan repositori adalah untuk menyediakan "bahan mentah" untuk analisis di satu tempat dan dalam struktur yang mudah dan mudah difahami. Maksudnya, konsep Data Warehousing bukanlah konsep analisis data, sebaliknya ia adalah konsep penyediaan data untuk dianalisis. Ia melibatkan pelaksanaan sumber data bersepadu tunggal.

Produk OLAP: seni bina

Apabila menggunakan produk OLAP, dua soalan adalah penting: bagaimana dan di mana simpan Dan proses data. Bergantung pada cara kedua-dua proses ini dilaksanakan, seni bina OLAP dibezakan. Terdapat 3 cara untuk menyimpan data untuk OLAP dan 3 cara untuk memproses data ini. Banyak pengeluar menawarkan beberapa pilihan, ada yang cuba membuktikan bahawa pendekatan mereka adalah yang paling berhemat. Ini, tentu saja, tidak masuk akal. Walau bagaimanapun, sangat sedikit produk yang boleh beroperasi dalam lebih daripada satu mod dengan cekap.

Pilihan storan data OLAP

Penyimpanan dalam konteks ini bermakna mengekalkan data dalam keadaan yang sentiasa dikemas kini.

  • Pangkalan data perhubungan: Ini adalah pilihan biasa jika perusahaan menyimpan data perakaunan dalam RDB. Dalam kebanyakan kes, data harus disimpan dalam struktur yang tidak normal (yang paling sesuai ialah skema bintang). Pangkalan data yang dinormalkan tidak boleh diterima kerana prestasi pertanyaan yang sangat rendah apabila menjana agregat untuk OLAP (selalunya data yang terhasil disimpan dalam jadual agregat).
  • Fail pangkalan data pada komputer pelanggan (kiosk atau data mart): Data ini boleh dipraedarkan atau dibuat oleh pertanyaan pada komputer pelanggan.

Pangkalan Data Multidimensi: Ini mengandaikan bahawa data disimpan dalam pangkalan data berbilang dimensi pada pelayan. Ia boleh termasuk data yang diekstrak dan diringkaskan daripada sistem lain dan pangkalan data hubungan, fail pengguna akhir, dsb. Dalam kebanyakan kes, pangkalan data multidimensi disimpan pada cakera, tetapi sesetengah produk membenarkan anda menggunakan RAM, mengira data yang paling kerap digunakan dengan cepat. " Sangat sedikit produk berdasarkan pangkalan data berbilang dimensi membenarkan berbilang penyuntingan data; banyak produk membenarkan penyuntingan tunggal tetapi berbilang bacaan data, manakala yang lain terhad kepada bacaan sahaja.

Ketiga-tiga lokasi storan ini mempunyai keupayaan storan yang berbeza, dan ia disusun dalam susunan kapasiti menurun. Mereka juga mempunyai ciri prestasi pertanyaan yang berbeza: pangkalan data hubungan jauh lebih perlahan daripada dua pilihan terakhir.

Pilihan untuk memproses data OLAP

Terdapat 3 pilihan pemprosesan data yang sama:

  • Menggunakan SQL: Pilihan ini, sudah tentu, digunakan semasa menyimpan data dalam RDB. Walau bagaimanapun, SQL tidak membenarkan pengiraan multidimensi dalam satu pertanyaan, jadi ia memerlukan menulis pertanyaan SQL yang kompleks untuk mencapai lebih daripada fungsi multidimensi asas. Walau bagaimanapun, ini tidak menghalang pembangun daripada mencuba. Dalam kebanyakan kes, mereka melakukan bilangan pengiraan yang berkaitan yang terhad dalam SQL, dengan hasil yang boleh diperoleh daripada pemprosesan data berbilang dimensi atau daripada mesin klien. Anda juga boleh menggunakan RAM yang boleh menyimpan data menggunakan lebih daripada satu permintaan: ini meningkatkan tindak balas secara mendadak.
  • Pemprosesan berbilang dimensi pada pelanggan: Produk OLAP pelanggan melakukan pengiraan sendiri, tetapi pemprosesan sedemikian hanya tersedia jika pengguna mempunyai PC yang agak berkuasa.

Pemprosesan berbilang dimensi bahagian pelayan: Ini ialah tempat yang popular untuk melakukan pengiraan berbilang dimensi dalam aplikasi OLAP pelayan pelanggan dan digunakan dalam banyak produk. Prestasi biasanya tinggi kerana kebanyakan pengiraan telah dilakukan. Walau bagaimanapun, ini memerlukan banyak ruang cakera.

Matriks seni bina OLAP

Sehubungan itu, dengan menggabungkan pilihan storan/pemprosesan, adalah mungkin untuk mendapatkan matriks seni bina sistem OLAP. Sehubungan itu, secara teori boleh terdapat 9 kombinasi kaedah ini. Walau bagaimanapun, memandangkan 3 daripadanya kurang akal, sebenarnya terdapat hanya 6 pilihan untuk menyimpan dan memproses data OLAP.

Pilihan storan pelbagai dimensi
data

Pilihan
pelbagai dimensi
pemprosesan data

Pangkalan data perhubungan

Pangkalan data multidimensi sebelah pelayan

Komputer pelanggan

Magnitud Kartesis

Pemprosesan pelayan pelbagai dimensi

Crystal Holos (mod ROLAP)

Pelayan OLAP IBM DB2

CA EUREKA:Strategi

Informix MetaCube

Speedware Media/MR

Perkhidmatan Analisis Microsoft

Oracle Express (mod ROLAP)

Pelayan Analisis Perintis

Applix iTM1

Holos Kristal

Keputusan Comshare

Hyperion Essbase

Oracle Express

Speedware Media/M

Perkhidmatan Analisis Microsoft

Pelayan PowerPlay Enterprise

Pelayan Analisis Perintis

Applix iTM1

Pemprosesan berbilang dimensi pada komputer klien

Penemu Oracle

Informix MetaCube

Wawasan Dimensi

Hyperion Enterprise

Cognos PowerPlay

Ekspres Peribadi

Perspektif iTM1

Oleh kerana storan yang menentukan pemprosesan, adalah kebiasaan untuk mengumpulkan mengikut pilihan storan, iaitu:

  • Produk ROLAP dalam sektor 1, 2, 3
  • Desktop OLAP - dalam sektor 6

Produk MOLAP – dalam sektor 4 dan 5

Produk HOLAP (membenarkan pilihan storan data berbilang dimensi dan relasi) – dalam 2 dan 4 (dalam huruf condong)

Kategori produk OLAP

Terdapat lebih daripada 40 vendor OLAP, walaupun mereka semua tidak boleh dianggap sebagai pesaing kerana keupayaan mereka sangat berbeza dan, sebenarnya, mereka beroperasi dalam segmen pasaran yang berbeza. Mereka boleh dikumpulkan ke dalam 4 kategori asas, perbezaan di antaranya adalah berdasarkan konsep berikut: fungsi kompleks - fungsi mudah, prestasi - ruang cakera. Ia berguna untuk menggambarkan kategori dalam bentuk segi empat sama kerana ia jelas menunjukkan hubungan antara mereka. Ciri tersendiri bagi setiap kategori diwakili di sisinya, dan persamaan dengan yang lain diwakili pada sisi yang bersebelahan, oleh itu, kategori di sisi yang bertentangan secara asasnya berbeza.

Keanehan

Kelebihan

Kecacatan

wakil rakyat

OLAP yang digunakan

Aplikasi lengkap dengan fungsi yang kaya. Hampir kesemuanya memerlukan pangkalan data berbilang dimensi, walaupun sesetengahnya berfungsi dengan pangkalan data relasional. Kebanyakan kategori aplikasi ini adalah khusus, seperti jualan, pembuatan, perbankan, belanjawan, penyatuan kewangan, analisis jualan

Kemungkinan integrasi dengan pelbagai aplikasi

Tahap kefungsian yang tinggi

Tahap fleksibiliti dan skalabiliti yang tinggi

Kerumitan aplikasi (latihan pengguna diperlukan)

Harga tinggi

Penyelesaian Hyperion

Keputusan Kristal

Pembina Maklumat

Produk ini berdasarkan struktur data bukan perkaitan yang menyediakan storan, pemprosesan dan pembentangan data berbilang dimensi. Semasa proses analisis, data dipilih secara eksklusif daripada struktur multidimensi. Walaupun tahap keterbukaan yang tinggi, pembekal memujuk pembeli untuk membeli alat mereka sendiri

Prestasi tinggi (pengiraan pantas penunjuk ringkasan dan pelbagai transformasi multidimensi untuk mana-mana dimensi). Purata masa tindak balas kepada pertanyaan analisis ad hoc apabila menggunakan pangkalan data berbilang dimensi biasanya 1-2 susunan magnitud kurang daripada dalam kes RDB

Tahap keterbukaan yang tinggi: sejumlah besar produk yang boleh disepadukan

Mereka dengan mudah mengatasi tugas termasuk pelbagai fungsi terbina dalam dalam model maklumat, menjalankan analisis khusus oleh pengguna, dsb.

Keperluan ruang cakera yang besar untuk menyimpan data (disebabkan oleh lebihan data yang disimpan). Ini adalah penggunaan memori yang sangat tidak cekap - disebabkan penyahnormalan dan pengagregatan pra-laksana, volum data dalam pangkalan data berbilang dimensi sepadan dengan 2.5-100 kali kurang daripada volum data terperinci asal. Walau apa pun, MOLAP tidak membenarkan bekerja dengan pangkalan data yang besar. Had sebenar ialah pangkalan data 10-25 gigabait

Potensi untuk "letupan" pangkalan data ialah peningkatan yang tidak dijangka, mendadak, tidak seimbang dalam volumnya

Kekurangan fleksibiliti apabila mengubah suai struktur data. Sebarang perubahan dalam struktur dimensi hampir selalu memerlukan penstrukturan semula hypercube yang lengkap

Untuk pangkalan data berbilang dimensi, pada masa ini tiada piawaian seragam untuk antara muka, bahasa untuk menerangkan dan memanipulasi data

Hyperion (Essbase)

DOLAP (Desktop OLAP)

Produk OLAP pelanggan yang agak mudah untuk dilaksanakan dan mempunyai kos yang rendah bagi setiap tempat duduk

Kami bercakap tentang pemprosesan analitik sedemikian di mana hiperkubus kecil, dimensinya kecil, keperluannya sederhana, dan untuk pemprosesan analitik sedemikian, mesin peribadi pada desktop adalah mencukupi

Matlamat pengeluar pasaran ini adalah untuk mengautomasikan ratusan dan ribuan pekerjaan, tetapi pengguna mesti melakukan analisis yang agak mudah. Pembeli sering digalakkan untuk membeli lebih banyak pekerjaan daripada yang diperlukan

Penyepaduan yang baik dengan pangkalan data: multidimensi, hubungan

Kemungkinan membuat pembelian yang kompleks, yang mengurangkan kos projek pelaksanaan

Kemudahan penggunaan aplikasi

Fungsi yang sangat terhad (tidak setanding dalam hal ini dengan produk khusus)

Kuasa yang sangat terhad (volume data yang kecil, bilangan ukuran yang kecil)

Cognos (PowerPlay)

Objek Perniagaan

Keputusan Kristal

Ini adalah sektor terkecil dalam pasaran.

Data terperinci kekal di tempat asalnya - dalam pangkalan data hubungan; beberapa agregat disimpan dalam pangkalan data yang sama dalam jadual perkhidmatan yang dicipta khas

Mampu mengendalikan jumlah data yang sangat besar (storan yang menjimatkan kos)

Sediakan mod operasi berbilang pengguna, termasuk mod pengeditan, dan bukan hanya membaca

Tahap perlindungan data yang lebih tinggi dan pilihan yang baik untuk membezakan hak akses

Perubahan kerap pada struktur pengukuran adalah mungkin (tidak memerlukan penyusunan semula fizikal pangkalan data)

Prestasi rendah, jauh lebih rendah dari segi kelajuan tindak balas kepada yang berbilang dimensi (tindak balas kepada pertanyaan kompleks diukur dalam minit atau jam dan bukannya dalam saat). Ini adalah pembina laporan yang lebih baik daripada alat analisis interaktif

Kerumitan produk. Memerlukan kos penyelenggaraan yang besar daripada pakar teknologi maklumat. Untuk memberikan prestasi yang setanding dengan MOLAP, sistem perhubungan memerlukan reka bentuk yang teliti bagi skema pangkalan data dan penalaan indeks, iaitu, banyak usaha dari pihak pentadbir pangkalan data

Mahal untuk dilaksanakan

Had SQL kekal menjadi realiti, yang menghalang RDBMS daripada melaksanakan banyak fungsi terbina dalam yang mudah disediakan dalam sistem berdasarkan perwakilan data berbilang dimensi.

Kelebihan Maklumat

Informix (MetaCube)

Perlu diingatkan bahawa pengguna produk hibrid yang membenarkan pilihan mod ROLAP dan MOLAP, seperti Perkhidmatan Analisis Microsoft, Oracle Express, Crystal Holos, IBM DB2 OLAPServer, hampir selalu memilih mod MOLAP.

Setiap kategori yang dibentangkan mempunyai kekuatan dan kelemahan sendiri; tidak ada satu pilihan yang optimum. Pilihan mempengaruhi 3 aspek penting: 1) prestasi; 2) ruang cakera untuk penyimpanan data; 3) keupayaan, kefungsian dan terutamanya kebolehskalaan penyelesaian OLAP. Dalam kes ini, adalah perlu untuk mengambil kira jumlah data yang sedang diproses, kuasa peralatan, keperluan pengguna dan mencari kompromi antara kelajuan dan redundansi ruang cakera yang diduduki oleh pangkalan data, kesederhanaan dan pelbagai fungsi.

Klasifikasi Gudang Data mengikut volum pangkalan data sasaran

Kelemahan OLAP

Seperti mana-mana teknologi, OLAP juga mempunyai kelemahannya: keperluan tinggi untuk perkakasan, latihan dan pengetahuan kakitangan pentadbiran dan pengguna akhir, kos tinggi untuk pelaksanaan projek pelaksanaan (kedua-dua kewangan dan masa, intelektual).

Memilih produk OLAP

Memilih produk OLAP yang betul adalah sukar, tetapi sangat penting jika anda mahu projek itu tidak gagal.

Seperti yang anda lihat, perbezaan produk terletak pada banyak bidang: fungsi, seni bina, teknikal. Sesetengah produk sangat terhad dalam tetapan. Sesetengahnya dicipta untuk bidang subjek khusus: pemasaran, jualan, kewangan. Terdapat produk untuk tujuan umum, yang tidak mempunyai kegunaan khusus aplikasi, yang mesti agak fleksibel. Sebagai peraturan, produk sedemikian lebih murah daripada yang khusus, tetapi kos pelaksanaannya lebih tinggi. Rangkaian produk OLAP sangat luas - daripada alat paling mudah untuk membina jadual pangsi dan carta yang merupakan sebahagian daripada produk pejabat, kepada alat untuk menganalisis data dan mencari corak, yang menelan belanja puluhan ribu dolar.

Seperti dalam bidang lain, dalam bidang OLAP tidak boleh ada garis panduan yang jelas untuk memilih alat. Anda hanya boleh memberi tumpuan kepada beberapa perkara utama dan membandingkan keupayaan perisian yang dicadangkan dengan keperluan organisasi. Satu perkara yang penting: tanpa memikirkan dengan betul tentang cara anda akan menggunakan alat OLAP, anda berisiko menimbulkan sakit kepala yang besar untuk diri sendiri.

Semasa proses pemilihan, terdapat 2 soalan yang perlu dipertimbangkan:

  • menilai keperluan dan keupayaan perusahaan
  • menilai tawaran sedia ada di pasaran, trend pembangunan juga penting

Kemudian bandingkan semua ini dan, sebenarnya, buat pilihan.

Memerlukan penilaian

Anda tidak boleh membuat pilihan produk yang rasional tanpa memahami kegunaannya. Banyak syarikat mahukan "produk terbaik" tanpa pemahaman yang jelas tentang cara ia harus digunakan.

Untuk projek itu berjaya dilaksanakan, pengarah kewangan mesti, sekurang-kurangnya, cekap merumuskan kehendak dan keperluannya kepada pengurus dan pakar perkhidmatan automasi. Banyak masalah timbul disebabkan oleh persediaan dan kesedaran yang tidak mencukupi untuk pilihan OLAP; pakar IT dan pengguna akhir mengalami kesukaran komunikasi hanya kerana mereka memanipulasi konsep dan istilah yang berbeza semasa perbualan dan mengemukakan pilihan yang bercanggah. Perlu ada konsistensi dalam matlamat dalam syarikat.

Beberapa faktor telah menjadi jelas selepas membaca gambaran keseluruhan kategori produk OLAP, iaitu:

Aspek teknikal

  • Sumber data: gudang data korporat, sistem OLTP, fail jadual, pangkalan data hubungan. Kemungkinan memautkan alatan OLAP dengan semua DBMS yang digunakan dalam organisasi. Seperti yang ditunjukkan oleh amalan, penyepaduan produk heterogen ke dalam sistem pengendalian yang stabil adalah salah satu isu yang paling penting, dan penyelesaiannya dalam beberapa kes boleh dikaitkan dengan masalah besar. Adalah perlu untuk memahami betapa mudah dan boleh dipercayai untuk mengintegrasikan alatan OLAP dengan DBMS yang sedia ada dalam organisasi. Ia juga penting untuk menilai kemungkinan penyepaduan bukan sahaja dengan sumber data, tetapi juga dengan aplikasi lain yang mungkin anda perlukan untuk mengeksport data: e-mel, aplikasi pejabat
  • Kepelbagaian data diambil kira
  • Platform pelayan: NT, Unix, AS/400, Linux - tetapi jangan berkeras bahawa produk spesifikasi OLAP dijalankan pada platform yang boleh dipersoalkan atau hampir mati yang anda masih gunakan
  • Piawaian sisi pelanggan dan penyemak imbas
  • Seni bina boleh pakai: rangkaian tempatan dan sambungan modem PC, pelanggan/pelayan berkelajuan tinggi, intranet, extranet, Internet
  • Ciri Antarabangsa: Sokongan berbilang mata wang, operasi berbilang bahasa, perkongsian data, penyetempatan, pelesenan, kemas kini Windows

Jumlah maklumat input yang tersedia dan akan muncul pada masa hadapan

Pengguna

  • Bidang permohonan: analisis jualan/pemasaran, belanjawan/perancangan, analisis prestasi, analisis laporan perakaunan, analisis kualitatif, keadaan kewangan, penjanaan bahan analisis (laporan)
  • Bilangan pengguna dan lokasi mereka, keperluan untuk pembahagian hak akses kepada data dan fungsi, kerahsiaan (kerahsiaan) maklumat
  • Jenis pengguna: pengurusan kanan, kewangan, pemasaran, HR, jualan, pengeluaran, dsb.
  • Pengalaman pengguna. Tahap kemahiran pengguna. Pertimbangkan untuk menyediakan latihan. Aplikasi klien OLAP adalah sangat penting supaya pengguna berasa yakin dan boleh menggunakannya dengan berkesan.

Ciri Utama: Keperluan Tulis Balik Data, Pengkomputeran Teragih, Penukaran Mata Wang Kompleks, Keperluan Pencetakan Laporan, Antara Muka Hamparan, Kerumitan Logik Aplikasi, Dimensi Diperlukan, Jenis Analisis: Statistik, Carian Matlamat, Analisis Bagaimana Jika

Perlaksanaan

  • Siapa yang akan terlibat dalam pelaksanaan dan operasi: perunding luar, fungsi IT dalaman atau pengguna akhir
  • Belanjawan: perisian, perkakasan, perkhidmatan, pemindahan data. Ingat bahawa membayar untuk lesen produk OLAP hanyalah sebahagian kecil daripada jumlah kos projek. Kos pelaksanaan dan perkakasan mungkin lebih daripada yuran lesen, dan kos sokongan, operasi dan pentadbiran jangka panjang hampir pasti lebih ketara. Dan jika anda membuat keputusan yang salah untuk membeli produk yang salah hanya kerana ia lebih murah, anda mungkin akan mendapat kos keseluruhan projek yang lebih tinggi disebabkan kos penyelenggaraan, pentadbiran dan/atau perkakasan yang lebih tinggi untuk perkara yang anda mungkin akan mendapat tahap faedah perniagaan yang lebih rendah. . Apabila menganggarkan jumlah kos, pastikan anda bertanya soalan berikut: Sejauh manakah sumber pelaksanaan, latihan dan sokongan tersedia? Adakah dana am yang berpotensi (pekerja, kontraktor, perunding) berkemungkinan berkembang atau mengecut? Sejauh mana anda boleh menggunakan pengalaman profesional industri anda?

Walaupun pada hakikatnya kos sistem analisis masih agak tinggi sehingga hari ini, dan metodologi dan teknologi untuk melaksanakan sistem sedemikian masih di peringkat awal, hari ini kesan ekonomi yang mereka berikan jauh melebihi kesan sistem operasi tradisional.

Kesan organisasi yang betul, perancangan strategik dan operasi pembangunan perniagaan adalah sukar untuk diukur terlebih dahulu, tetapi jelas bahawa ia boleh melebihi kos melaksanakan sistem sedemikian sebanyak berpuluh-puluh dan bahkan ratusan kali. Walau bagaimanapun, seseorang tidak boleh tersilap. Kesannya dipastikan bukan oleh sistem itu sendiri, tetapi oleh orang yang bekerja dengannya. Oleh itu, pengisytiharan seperti: "sistem Pergudangan Data dan teknologi OLAP akan membantu pengurus membuat keputusan yang betul" adalah tidak betul sepenuhnya." Sistem analisis moden bukanlah sistem kecerdasan buatan dan ia tidak dapat membantu mahupun menghalang pembuatan keputusan. Matlamat mereka adalah untuk memberikan pengurus dengan segera semua maklumat yang diperlukan untuk membuat keputusan dalam bentuk yang mudah. Dan maklumat apa yang akan diminta dan keputusan yang akan dibuat berdasarkannya hanya bergantung pada orang tertentu yang menggunakannya.

Apa yang perlu diperkatakan ialah sistem ini boleh membantu menyelesaikan banyak masalah perniagaan dan boleh memberi kesan positif yang meluas. Ia masih harus dilihat siapa yang akan menjadi orang pertama yang menyedari manfaat pendekatan ini dan mendahului yang lain.

Program OLAP Desktop dan komponen OLAP

Klasifikasi program OLAP

Mula-mula, mari ulangi definisi OLAP yang terkenal. OLAP (On Line Analytical Processing) - proses analisis operasi - ialah kelas perisian yang memberikan pengguna peluang untuk serta-merta, dalam masa nyata, menerima jawapan kepada pertanyaan analitikal sewenang-wenangnya.

Ia berlaku bahawa tidak mana-mana program yang cepat melakukan pertanyaan sewenang-wenangnya, pengiraan dan menyediakan pengguna dengan data dalam bentuk yang boleh difahami olehnya dianggap sebagai alat OLAP. Kelas OLAP termasuk hanya program yang menyediakan pengguna jadual terurus berbilang dimensi sebagai antara muka luaran. Jadual ini membenarkan pengguna menukar lajur dan baris, menutup dan membuka lajur deskriptif, menetapkan syarat penapisan dan pada masa yang sama ia secara automatik mengira kumpulan data perantaraan dan jumlah akhir untuk lajur berangka. Bahagian penting analisis OLAP ialah paparan grafik data.

Program yang melaksanakan teknik ini dibahagikan kepada kategori berikut:

  1. Pelayan OLAP atau DBMS multidimensi MOLAP. Ia adalah enjin pengkomputeran dan pangkalan data berbilang dimensi yang diakses oleh program klien dengan arahan untuk mendapatkan semula data dan melakukan pengiraan. MOLAP menyimpan set data, fakta dan dimensi, dengan agregat pra-pengiraan.
  2. komponen MOLAP. Ini ialah alat pengaturcara yang dengannya atur cara klien dibangunkan yang menerima kiub terkira daripada pelayan OLAP melalui beberapa antara muka, contohnya OLE DB untuk OLAP daripada Microsoft Corporation.
  3. komponen ROLAP. Ini juga merupakan alat pengaturcara. Tidak seperti komponen OLAP visual, ia mengandungi enjin OLAPnya sendiri untuk mengubah data hubungan atau matriks berbilang dimensi kepada kiub berbilang dimensi. Dengan kata lain, program ini, atas permintaan pengguna, mengira agregat dalam RAM dan memaparkannya pada skrin itu sendiri.
  4. pelayan ROLAP. Kelas perisian yang agak baru. Tidak seperti pelayan OLAP, ia tidak mengandungi pangkalan data berbilang dimensi, tetapi menukar data DBMS hubungan kepada kiub berbilang dimensi atas permintaan banyak aplikasi klien.
  5. program OLAP. Ini ialah penyelesaian lengkap yang mengandungi komponen OLAP, alat untuk menerangkan pertanyaan sewenang-wenang (Pertanyaan Ad-hoc) dan antara muka akses pangkalan data. Seterusnya, program tersebut boleh dibahagikan kepada dua kumpulan: program MOLAP dan ROLAP.

komponen OLAP

Sebarang penyelesaian akhir mengandungi komponen OLAP, iaitu antara muka pengguna. Komponen ini adalah serupa antara satu sama lain. Bahagian visual mereka terdiri daripada kawalan dan elemen paparan data. Biasanya, ini ialah jadual yang medannya mengandungi data dan lajur serta baris adalah kawalan.

Sebilangan besar vendor OLAP, yang mana terdapat kira-kira 140 di seluruh dunia, tidak menjual komponen mereka. Kami tahu hanya tiga komponen yang anda boleh beli untuk pembangunan anda sendiri. Ini ialah Inprise's Decision Cube sebagai sebahagian daripada penyusun Delphi dan C++ Builder, Jadual Pangsi Microsoft sebagai sebahagian daripada MS Office dan Data Dynamic's Dynamic Cube, yang mengkhusus dalam pembangunan komponen OLAP.

Kiub Keputusan Inprise dibekalkan sebagai komponen VCL. Menurut klasifikasi kami, ia tergolong dalam komponen ROLAP, iaitu, ia mengandungi enjin OLAP dan hanya bertujuan untuk bekerja dengan DBMS hubungan atau jadual tempatan. Ia mempunyai keupayaan yang sangat sederhana. Sebagai contoh, adalah mustahil untuk membuka satu elemen dimensi, atau menetapkan penapis untuk beberapa dimensi, atau memaparkan beberapa fakta pada masa yang sama. Prestasi komponen adalah rendah. Had adalah kira-kira 4000 rekod dengan 5 ukuran. Komponen memaparkan hanya satu fakta pada satu masa dalam jadual. Ciri yang tidak menyenangkan ialah kehadiran beberapa ralat dalam kod sumber, akibatnya hanya pengaturcara yang berkelayakan tinggi, selepas membetulkan ralat ini, boleh menggunakan komponen dalam pembangunan mereka. Kelebihannya termasuk kemudahan penggunaan dan penguasaan komponen. Apabila digunakan dengan betul dan dengan jumlah data yang kecil, produk berdasarkan komponen ini boleh berguna dan mempunyai prestasi yang boleh diterima.

Jadual Pangsi Microsoft Corporation dibekalkan dalam dua versi: sebagai sebahagian daripada MS Excel dan sebagai komponen Web. Komponen web (ActiveX) boleh digunakan dalam penyemak imbas dan dalam aplikasi Windows asli. Jadual Pangsi ialah komponen MOLAP dan ROLAP. Menggunakan OLE DB untuk protokol OLAP, ia boleh berinteraksi dengan DBMS MS OLAP Server multidimensi, atau 70 DBMS multidimensi lain yang pembangunnya menyokong protokol ini. Menggunakan protokol OLE DB, Jadual Pangsi boleh menerima data daripada DBMS hubungan dan melakukan pengiraan kiub dalam ingatan. Dan sudah tentu data boleh diperolehi dari kawasan tertentu jadual MS Excel. Dalam kes ini, prestasinya tidak berbeza dengan Decision Cube. Komponen memaparkan hanya satu fakta pada satu masa dalam jadual. Walau bagaimanapun, kit alat komponen adalah lebih luas daripada Decision Cube - penapisan sewenang-wenang dan pengembangan satu elemen ukuran dilaksanakan. Tujuan utama komponen ini adalah untuk mencipta antara muka ke pelayan OLAP dalam rangka kerja konsep Business Intelligent Microsoft Corporation.

Kiub Dinamik Dinamik Data ialah komponen ROLAP klasik. Ia datang sebagai VCL untuk pengaturcara Delphi dan C++ Builder, dan sebagai COM untuk peminat model komponen. Komponen enjin OLAP agak berkuasa. Ia dengan mudah memproses puluhan dan sedikit perlahan walaupun ratusan ribu rekod. Terdapat berbilang penapisan, membuka elemen satu dimensi, dan beberapa fungsi tambahan. Komponen ini membolehkan anda memaparkan beberapa fakta dalam jadual pada masa yang sama. Walau bagaimanapun, komponen ini agak mahal, kosnya sangat mengagumkan untuk pemaju profesional.

Ketiga-tiga komponen yang diterangkan di atas, berbanding dengan produk siap dari banyak pembekal, mempunyai fungsi yang sangat kecil, terhad kepada fungsi OLAP klasik: menggerudi ke bawah, bergerak, berputar, dll. Pada masa yang sama, dalam beberapa produk siap sedia sering terdapat bar alat yang diisi dengan butang untuk fungsi mudah tambahan. Seperti, dan juga butang yang melaksanakan tugas analisis popular, seperti analisis pemasaran klasik 20/80.

Program OLAP Desktop

Sehingga baru-baru ini, vendor pelayan OLAP menjual produk mereka pada harga sedemikian sehingga pelanggan mereka harus kaya seperti syeikh Arab. Oleh itu, pemerolehan Oracle Express akan menelan kos $100,000 untuk pekerjaan dua penganalisis dan dua pentadbir. Tetapi, walaupun selepas Microsoft memasuki pasaran, yang menurunkan harga dengan menyediakan pelayan OLAP secara percuma sebagai sebahagian daripada MS SQL Server, penciptaan Gudang Data atau data mart kekal sebagai usaha serius yang memerlukan penglibatan pembangun profesional, pentadbiran semasa operasi dan kos lain.

Oleh itu, kelas produk khas muncul di pasaran - DOLAP (Desktop OLAP) - OLAP desktop. Ini adalah program yang dipasang pada setiap komputer peribadi. Ia tidak memerlukan pelayan dan mempunyai "pentadbiran sifar". Program ini membolehkan pengguna menyesuaikan pangkalan data sedia ada; Sebagai peraturan, kamus dicipta yang menyembunyikan struktur fizikal data di sebalik perihalan subjeknya, yang boleh difahami oleh pakar. Selepas ini, program melakukan pertanyaan sewenang-wenangnya dan memaparkan keputusan dalam jadual OLAP. Dalam jadual ini pula, pengguna boleh memanipulasi data dan menerima ratusan laporan berbeza pada skrin atau di atas kertas.

Berdasarkan kaedah mendapatkan data, program tersebut boleh dibahagikan kepada tempatan dan korporat:

  • Orang tempatan memanipulasi data daripada jadual MS Excel atau pangkalan data kecil seperti Access, DBF, Paradox.
  • DOLAP Perusahaan mempunyai akses kepada pelayan SQL atau pangkalan data berbilang dimensi dan oleh itu juga termasuk dalam dua kategori.

DOLAP Korporat, direka untuk menganalisis data daripada pelayan SQL, membolehkan anda menganalisis data yang sudah tersedia dalam perbadanan, yang disimpan dalam sistem OLTP. Walau bagaimanapun, tujuan kedua mereka boleh menjadi penciptaan Gudang atau data mart yang cepat dan murah, apabila pengaturcara organisasi hanya perlu mencipta set jadual bintang dan prosedur pemuatan data. Bahagian kerja yang paling memakan masa - membangunkan antara muka dengan pelbagai pilihan untuk pertanyaan pengguna, antara muka dan laporan - menjadi tidak diperlukan. Ini boleh dilaksanakan dalam beberapa jam sahaja dalam program DOLAP. Menguasai program sedemikian oleh pengguna akhir memerlukan 30 minit.

Program DOLAP dibekalkan oleh pembangun pangkalan data sendiri, multidimensi dan hubungan. Ini ialah SAS Corporate Reporter, yang hampir merupakan produk standard dari segi kemudahan dan kecantikan, Oracle Discovery, pakej perisian MS Pivot Services dan Pivot Table dan lain-lain. Produk ini, kecuali program Microsoft, tidak murah. Jadi Wartawan Korporat SAS akan menelan kos $2000 bagi setiap pengguna.

Sekumpulan besar program dibekalkan sebagai sebahagian daripada kempen "OLAP to the Masses", yang dijalankan oleh Microsoft Corporation. Program ini direka bentuk untuk berfungsi dengan MS OLAP Services. Sebagai peraturan, ia adalah versi Jadual Pangsi yang dipertingkatkan dan bertujuan untuk digunakan dalam MS Office atau Web. Ini adalah Matryx, Knosys, dll.

Disebabkan kesederhanaan, kos rendah dan keberkesanan yang besar, kelas produk ini telah mendapat populariti yang sangat besar di Barat. Syarikat besar membina Storan Akses Teragih mereka berdasarkan program sedemikian.

Produk OLAP daripada Intersoft Lab

Standard Kontur

Produk utama syarikat Intersoft Lab ialah sistem maklumat dan pengurusan besar "Kontur Corporation", dibina berdasarkan prinsip Gudang Data. Walau bagaimanapun, dalam proses berkomunikasi dengan pelanggan, syarikat menyedari bahawa tidak semua orang bersedia untuk pelaburan dan langkah organisasi yang berkaitan dengan membina Gudang Data yang serius. Langkah pertama pada laluan ini untuk banyak bank dan perusahaan boleh menjadi analisis OLAP data daripada sistem OLTP sedia ada dan pangkalan data analitik mereka sendiri.

Untuk tujuan ini, produk DOLAP "Contour Standard" telah dicipta.

Contour Standard 1.0 Versi pertama sistem tergolong dalam kelas DOLAP tempatan. Alat program memungkinkan untuk mengatur akses terus ke fail dbf dan paradoks. Selain itu, pakej pengedaran termasuk penghijrah data, yang membantu mengumpul data daripada sistem sedia ada organisasi ke dalam jadual tempatan.

Contour Standard 2.0 Selepas itu, untuk mengembangkan kuasa produk, sistem Contour Standard 2.0 menyediakan akses kepada pelayan SQL sewenang-wenangnya pada tahap jadual dan, yang tidak terdapat dalam analog asing, prosedur tersimpan. Ini menjadikan program ini sebagai sistem maklumat dan analisis korporat. Antara muka yang berasingan kepada sistem Kontur Corporation telah dilaksanakan.

Pada masa yang sama, untuk memudahkan pentadbiran, program ini dibahagikan kepada dua edisi. Edisi "Pembangun" membenarkan pakar IT untuk menerangkan sumber data dan sampel. Dalam kes ini, kamus semantik dicipta yang menyembunyikan lapisan fizikal daripada pengguna akhir dan menterjemah data ke dalam bahasa kawasan subjek. Edisi Run-Time membolehkan anda menganalisis data dan menghasilkan laporan. Cara utama untuk memanipulasi data ialah komponen OLAP, yang membolehkan anda membuat laporan yang diperlukan tanpa pengaturcaraan atau kemahiran khas. Pada masa yang sama, jenis alat analisis mudah baharu telah dicipta, yang bukan jadual OLAP secara rasmi, tetapi merupakan alat OLAP dalam semangat, i.e. melaksanakan analisis dalam talian, tetapi dalam bentuk pembentangan data yang berbeza.

Dua versi pertama menggunakan komponen ROLAP Decision Cube Inprise. Walau bagaimanapun, kuasa rendah dan kesederhanaan berfungsi menghalang penggunaan program di bank dan organisasi untuk menganalisis jumlah data yang besar. Oleh itu, keputusan dibuat untuk menggantikannya. Analisis pemasaran dan audit terhadap keupayaan intelektual dan pengeluaran syarikat itu sendiri membawa kepada keputusan untuk mencipta komponen OLAP kami sendiri. Hasil daripada pembangunan komponen, yang dipanggil Contour Cube, versi program seterusnya muncul - "Contour Standard" 3.0, yang membolehkan anda memproses sampel data sehingga satu juta rekod dan mempunyai fungsi analisis lanjutan.

Kiub Kontur

Komponen Contour Cube daripada Intersoft Lab ialah komponen ROLAP yang mewakili. Ia terdiri daripada enjin OLAP, antara muka untuk mengakses data yang terletak dalam pelayan SQL dan sumber lain, dan bahagian visual.

Komponen ini akan dilaksanakan dalam beberapa versi untuk aplikasi yang berbeza.

versi VCL untuk digunakan dalam persekitaran Delphi dan C++ Builder Inprise. Dalam kes ini, data dibekalkan melalui Set Data standard pengkompil ini. Akses kepada sumber disediakan menggunakan BDE dan ADO, disokong dalam versi terkini persekitaran ini.

versi COM direka untuk pembangun menggunakan Visual Basic, Visual C++, dsb. Ia menyediakan akses data menggunakan ADO. Dalam versi akan datang, akses kepada pelayan OLAP melalui antara muka OLE DB untuk OLAP akan disokong.

Versi ActiveX ialah komponen Web untuk mencipta antara muka Internet analisis dalam gaya yang dicadangkan oleh Microsoft.

Versi DHTML terdiri daripada pelayan dan halaman DHTML. Ia bertujuan untuk mencipta antara muka Internet analisis dalam persekitaran UNIX, serta untuk pasaran peranti Internet mudah alih yang pesat membangun.

Kelebihan utama komponen adalah:

  • Memproses volum data yang besar.
  • Keperluan memori minimum.
  • Fungsi diperluaskan.

Komponen prestasi tinggi dicapai melalui model matematik unik yang dicipta oleh pakar syarikat.

Mencipta berbilang versi komponen dimungkinkan berkat seni bina berbilang lapisannya. Lapisan Enjin OLAP ialah bahagian komponen yang agak bebas. Ia dilaksanakan sebagai perpustakaan merentas platform yang mempunyai API untuk pelbagai lapisan visualisasi. API ini mempunyai fungsi untuk memuatkan data, mengira hirisan kubus berbilang dimensi dan melaksanakan fungsi analisis dan perkhidmatan. Lapisan Enjin OLAP itu sendiri terdiri daripada enjin pengiraan dan Stor Data multidimensi abstrak, yang boleh disimpan sebagai fail untuk dipindahkan kepada pengguna lain atau penggunaan jangka panjang.

Memproses volum data yang besar

Ujian pada komputer peribadi dengan pemproses Intel Celeron 400 dan 64 MB RAM memberikan keputusan berikut. Memuatkan 60,000 rekod dengan 6 dimensi mengambil masa 5 saat; manipulasi selanjutnya, seperti pusingan meja lengkap, gerudi ke bawah dan gerudi ke atas, dilakukan dalam sepersepuluh saat.

Ini adalah hasil tertib magnitud (sic!) terbaik daripada komponen OLAP yang kami ketahui. Oleh itu, Decision Cube dan Pivot Table (tanpa menggunakan Perkhidmatan OLAP) memerlukan berpuluh-puluh saat untuk memuatkan dan memutar jadual dengan 4000 rekod dan 6 dimensi. Kelajuan Kiub Dinamik adalah lebih rendah daripada Kiub Kontur, dengan purata 30% pada purata volum data dan beberapa kali lebih rendah pada volum maksimum.

Oleh itu, dalam banyak kes, disebabkan kuasanya, komponen menjadikan penggunaan pelayan OLAP tidak diperlukan. Ini sangat memudahkan proses melaksanakan dan mentadbir sistem korporat.

Keperluan Memori Minimum

Apabila bekerja dengan data, komponen tersebut menggunakan jumlah RAM yang paling kecil berbanding rakan sekelasnya. Jadi, apabila memuatkan 40,000 rekod, Contour Cube menggunakan 7 MB, Decision Cube 15 MB.

Fungsi lanjutan

Komponen ini menggabungkan fungsi komponen OLAP terbaik:

  • Penapis berbilang mengikut dimensi.
  • Penjanaan kedua-dua tempoh masa standard ("Tahun", "Suku", "Bulan", "Dekad", "Minggu", dll.) dan yang ditentukan pengguna ("Tahun Fiskal", "Musim", "Masa Hari" ) mengikut jenis dimensi "tarikh".
  • Isih mengikut dimensi.
  • Menyusun mengikut fakta.
  • Membuka nilai satu dimensi (cawangan).
  • Pengurusan carta automatik.
  • Persediaan carta manual.
  • Banyak fakta.
  • Banyak algoritma pengagregatan fakta standard.
  • Algoritma pengagregatan "Baki akaun".

Sifat unik komponen ialah algoritma pengagregatan "Baki Akaun". Disebabkan oleh fakta bahawa komponen OLAP ditujukan terutamanya untuk analisis jualan dan jenis analisis sumatif lain, ia mengagregatkan baki akaun dari semasa ke semasa. Ini adalah ralat - baki akaun untuk suku tersebut bukanlah jumlah baki akaun untuk hari tersebut, tetapi baki untuk hari terakhir suku tersebut. Pelaksanaan algoritma ini membolehkan komponen digunakan untuk menganalisis kunci kira-kira dan menjadikannya berguna bukan sahaja untuk ahli ekonomi dan pemasar, tetapi juga untuk akauntan.

Agar produk siap yang berkuasa dapat dicipta apabila menggunakan komponen dalam jumlah masa yang minimum, ia mempunyai set fungsi analitik terbina dalam yang sering ditemui dalam kerja sebenar. Setiap fungsi ini dilaksanakan sebagai butang dalam bar alat bahagian visual komponen. Berikut ialah senarai fungsi ini:

  • Alih keluar lajur nol, alih keluar baris nol, alih keluar lajur dan baris nol. Digunakan untuk memampatkan jadual jarang.
  • Giliran penuh. Dalam kes ini, lajur dan baris jadual ditukar. Ia digunakan untuk meningkatkan persepsi penganalisis terhadap jadual dan untuk memilih bentuk cetakan terbaik.
  • Tapis mengikut fakta. Membolehkan anda menentukan had fakta mutlak atau bilangan elemen terbesar atau terkecil. Ia adalah salah satu alat analisis faktor.
  • Analisis kluster. Membahagikan data kepada bilangan kumpulan tertentu mengikut nilai had fakta. Sebagai contoh, membahagikan pelanggan kepada besar, sederhana dan kecil berdasarkan jumlah pendapatan yang diterima daripada mereka.
  • 80/20. Jenis analisis kelompok yang popular dalam pemasaran di Barat. Contoh aplikasinya: tunjukkan 20% pelanggan yang membawa 80% keuntungan.
  • Bermula. Menjana dimensi baharu "tempat dalam senarai" berdasarkan nilai fakta tertentu dan mengisih mengikutnya. Berguna untuk menganalisis kempen pilihan raya, membandingkan bank, perusahaan dan cawangan mengikut penunjuk yang diberikan.
  • Paparkan beberapa jumlah statistik secara serentak, seperti purata, sisihan piawai, dsb. Ciri ini akan menarik minat profesional maju, terutamanya dalam bidang analisis kewangan dan saham.
  • Memuat naik ke MS Excel, MS Word, format html. Mereka membenarkan anda meneruskan analisis menggunakan alat MS Excel biasa, membuat laporan bentuk bebas dan menerbitkan laporan di Internet.

Disebabkan ketidakmungkinan melindungi hak cipta di Rusia untuk produk perisian, perlindungan fizikal yang pada asasnya mustahil, komponen sebagai produk komersial akan dibekalkan hanya kepada pasaran Barat. Walau bagaimanapun, pengguna Rusia boleh mengambil kesempatan daripada kelebihannya untuk membangunkan perniagaan mereka sendiri dalam produk "Kontur Standard" dan "Kontur Corporation".

Selepas data diterima, dibersihkan, dibawa ke dalam satu bentuk dan diletakkan dalam simpanan, ia perlu dianalisis. Untuk tujuan ini, teknologi OLAP digunakan.

Dua belas prinsip penentu OLAP telah dirumuskan pada tahun 1993 oleh E. F. Codd, "pencipta" pangkalan data hubungan. OLAP ialah Pemprosesan Analitik Dalam Talian, iaitu analisis data operasi. Takrifan Codd kemudiannya dibangunkan kepada apa yang dipanggil ujian FASMI (Analisis Pantas Maklumat Berbilang Dimensi) yang memerlukan aplikasi OLAP untuk menyediakan keupayaan berikut untuk analisis pantas maklumat multidimensi yang dikongsi: kelajuan tinggi; analisis; perkongsian akses; multidimensi; bekerja dengan maklumat...

Kelajuan tinggi. Analisis harus dilakukan dengan cepat pada semua aspek maklumat. Dalam kes ini, masa tindak balas yang boleh diterima adalah tidak lebih daripada 5 saat.

Analisis. Anda mesti boleh melakukan jenis asas analisis berangka dan statistik - sama ada dipratakrif oleh pembangun aplikasi atau ditakrifkan secara bebas oleh pengguna.

Perkongsian akses. Akses kepada data mestilah berbilang pengguna, dan akses kepada maklumat sulit mesti dikawal.

Multidimensi. Ciri utama OLAP yang paling penting.

Bekerja dengan maklumat. Aplikasi mesti boleh mengakses sebarang maklumat yang diperlukan, tanpa mengira volum dan lokasi storannya.

Perwakilan pelbagai dimensi. OLAP menyediakan organisasi dengan cara yang paling mudah dan pantas untuk mengakses, melihat dan menganalisis maklumat perniagaan. Paling penting, OLAP membekalkan pengguna model data semula jadi dan intuitif, menyusunnya ke dalam kiub berbilang dimensi. Paksi (dimensi) sistem koordinat multidimensi adalah sifat utama proses perniagaan yang dianalisis. Contohnya, untuk proses jualan, ini boleh menjadi kategori produk, wilayah atau jenis pembeli. Masa hampir selalu digunakan sebagai salah satu dimensi. Di dalam kubus terdapat data yang secara kuantitatif mencirikan proses - yang dipanggil Ukuran. Ini boleh menjadi volum jualan dalam keping atau dari segi kewangan, baki stok, kos, dsb. Pengguna yang menganalisis maklumat boleh "memotong" kiub ke arah yang berbeza, menerima ringkasan (contohnya, mengikut tahun) atau, sebaliknya, data terperinci (mengikut minggu) dan menjalankan operasi lain yang diperlukan untuk analisis.

Storan data OLAP . Pertama sekali, mesti dikatakan bahawa oleh kerana penganalisis sentiasa beroperasi dengan beberapa data ringkasan (bukannya terperinci), pangkalan data OLAP hampir selalu menyimpan, bersama-sama dengan data terperinci, yang dipanggil agregat, iaitu, penunjuk ringkasan yang telah dikira sebelumnya. Contoh agregat termasuk jumlah volum jualan untuk tahun tersebut atau baki purata barang dalam stok. Menyimpan pengagregatan prakiraan ialah cara utama untuk meningkatkan kelajuan pertanyaan OLAP.


Walau bagaimanapun, agregat bangunan boleh menyebabkan peningkatan ketara dalam saiz pangkalan data.

Satu lagi masalah dengan menyimpan data OLAP ialah kesederhanaan data berbilang dimensi. Contohnya, jika tiada jualan di rantau tertentu pada tahun 2000, maka tidak akan ada nilai di persimpangan dimensi kubus yang sepadan. Jika pelayan OLAP menyimpan nilai tertentu yang hilang dalam kes ini, maka jika datanya sangat jarang, bilangan sel kosong (yang bagaimanapun memerlukan ruang storan) mungkin berkali-kali lebih besar daripada bilangan sel yang diisi, dan akibatnya, jumlah volum akan meningkat secara tidak wajar. Penyelesaian yang dicadangkan oleh Microsoft untuk ini diberikan di bawah.

Jenis OLAP. Perkara berikut boleh digunakan untuk menyimpan data OLAP:

DBMS berbilang dimensi khas (pelayan OLAP). Dalam kes ini mereka bercakap tentang MOLAP (OLAP berbilang dimensi). Apabila menjalankan pertanyaan kompleks yang menganalisis data dalam pelbagai dimensi, DBMS berbilang dimensi memberikan prestasi yang lebih baik daripada yang berkaitan. Pada masa yang sama, kelajuan pelaksanaan pertanyaan tidak bergantung pada dimensi mana "kepingan" kubus berbilang dimensi dibuat bersama.

DBMS hubungan tradisional - ROLAP (OLAP Hubungan). Penggunaan struktur data khas - skema bintang dan kepingan salji, serta penyimpanan agregat yang dikira, memungkinkan analisis multidimensi data hubungan. DBMS perhubungan dari segi sejarah adalah lebih biasa, dan pelaburan yang besar telah dibuat di dalamnya, jadi buat masa ini ROLAP adalah lebih biasa.

Pilihan gabungan - HOLAP (OLAP Hibrid), menggabungkan kedua-dua jenis DBMS. Satu pilihan untuk menggabungkan dua jenis DBMS ialah menyimpan agregat dalam DBMS berbilang dimensi dan data terperinci (mempunyai volum terbesar) dalam satu relasi.

Microsoft menawarkan alat analisis OLAP berikut:

Microsoft SQL Server 7.0 termasuk pelayan OLAP berciri penuh - Perkhidmatan OLAP SQL Server. Pelayan, secara semula jadi, direka untuk melayani permintaan pelanggan, dan ini memerlukan protokol interaksi dan bahasa pertanyaan tertentu. Contohnya, untuk interaksi klien dengan DBMS hubungan pelayan - SQL Server - protokol ODBC atau OLE DB dan bahasa pertanyaan SQL digunakan. Untuk mengakses pelayan OLAP, Microsoft membangunkan OLE DB untuk protokol OLAP dan bahasa pertanyaan untuk data berbilang dimensi - MDX (MultiDimensional eXpression). Sama seperti lapisan objek ADO (ActiveX Data Objects) dibangunkan di atas OLE DB untuk kesederhanaan dan kemudahan, ADO MD (MultiDimensional ADO) dibina di atas OLE DB untuk OLAP.

Alat analisis data dalam Microsoft Office 2000. Microsoft Excel 2000 mengandungi mekanisme jadual pangsi baharu - OLAP PivotTable, yang menggantikan mekanisme dengan nama yang sama dalam versi sebelumnya. Bersama-sama dengan keupayaan sebelumnya untuk menganalisis data hubungan, enjin Jadual Pangsi kini termasuk keupayaan untuk menganalisis data OLAP, iaitu, ia bertindak sebagai pelanggan OLAP. Microsoft SQL Server 7.0 boleh digunakan sebagai pelayan, serta mana-mana produk yang menyokong antara muka OLE DB untuk OLAP. Enjin jadual pangsi Excel menyokong sepenuhnya keupayaan yang disediakan oleh perkhidmatan Jadual Pangsi (PTS) yang diterangkan di atas. Oleh itu, data OLAP yang dianalisis boleh didapati dalam kiub tempatan dan pada pelayan OLAP.

Microsoft Office 2000 juga mengandungi satu set komponen ActiveX yang dipanggil Komponen Web Office 2000, yang membolehkan anda mengatur analisis data OLAP menggunakan alat penyemakan imbas Web. Ini termasuk empat komponen berikut:

Hamparan- melaksanakan fungsi terhad helaian Excel.

Jadual Pangsi- "kembar" jadual pangsi Excel; boleh berfungsi dengan data Perkhidmatan OLAP.

Carta- membolehkan anda membina gambar rajah berdasarkan kedua-dua data hubungan dan OLAP.

Sumber data- komponen perkhidmatan untuk mengikat komponen lain kepada sumber data.

Apabila bekerja dengan data OLAP, Komponen Web mengakses Perkhidmatan Jadual Pangsi.

5.5. TEKNOLOGI ANALISIS “PERLOMBONGAN DATA”

Kemunculan teknologi Perlombongan Data dikaitkan dengan keperluan untuk mengekstrak pengetahuan daripada data heterogen yang terkumpul oleh sistem maklumat. Satu konsep timbul bahawa dalam bahasa Rusia mula dipanggil "pengeluaran", "pengeluaran" pengetahuan. Istilah "Perlombongan Data" telah ditubuhkan di luar negara.

Kaedah statistik matematik yang digunakan secara meluas sebelum ini ternyata berguna terutamanya untuk menguji hipotesis pra-dirumuskan (perlombongan data dipacu pengesahan) dan untuk analisis penerokaan "kasar", yang membentuk asas pemprosesan analisis dalam talian (OLAP).

Kelebihan Utama "Perlombongan Data" berbanding kaedah sebelumnya - keupayaan untuk menjana hipotesis secara automatik tentang hubungan antara pelbagai parameter atau komponen data. Kerja seorang penganalisis apabila bekerja dengan pakej pemprosesan data tradisional sebenarnya adalah untuk menguji atau menjelaskan satu atau dua hipotesis yang dihasilkan olehnya. Dalam kes di mana tiada andaian awal, dan jumlah data adalah ketara, sistem sedia ada kehilangan fungsinya dan bertukar menjadi pembaziran masa penganalisis.

Satu lagi ciri penting sistem Perlombongan Data ialah keupayaan untuk memproses pertanyaan berbilang dimensi dan mencari kebergantungan berbilang dimensi. Juga unik ialah keupayaan sistem perlombongan data untuk mengesan situasi luar biasa secara automatik - i.e. elemen data yang "keluar" daripada corak umum.

Terdapat lima jenis corak standard yang membolehkan anda mengenal pasti kaedah Perlombongan Data

persatuan

susulan

pengelasan

berkelompok

peramalan

Pencarian corak dijalankan menggunakan kaedah yang tidak terhad oleh andaian apriori tentang struktur sampel dan jenis taburan nilai penunjuk yang dianalisis. Contoh tugas untuk carian sedemikian apabila menggunakan Perlombongan Data diberikan dalam Jadual 1.

Jadual 1 - Perbandingan rumusan masalah apabila menggunakan kaedah OLAP dan Data Mining