Pergantungan fungsional adalah yang utama. Apakah fungsi? Pergantungan fungsi, atau fungsi, ialah pergantungan antara dua pembolehubah supaya setiap nilai pembolehubah bebas. Kebergantungan fungsional. Definisi asas

Konsep pergantungan fungsi

biarlah R- sikap ϶ᴛᴏ. Di satu pihak, ia mempunyai makna tertentu (malar) dalam masa ini masa. Sebaliknya, ini adalah pembolehubah yang pada bila-bila masa tertentu boleh mengambil nilai yang berbeza.

Konsep undang-undang persekutuan boleh digunakan untuk kedua-dua kes pertama dan kedua. Dalam kes ini, kami akan mempertimbangkan hanya kes kedua, kerana ia lebih sesuai dengan realiti.

Penentuan pergantungan fungsi. biarlah R– pembolehubah hubungan. X Dan Y– subset arbitrari bagi set atribut R. Kemudian Y bergantung secara fungsi daripada X, yang ditulis secara simbolik sebagai X → Y(dibaca sebagai ʼʼ X mendefinisikan secara fungsional Yʼʼ) jika dan hanya jika untuk sebarang nilai yang dibenarkan R setiap nilai X dikaitkan dengan tepat satu nilai Y.

Di sini X dipanggil penentu Undang-undang Persekutuan, dan Ybahagian bergantung Undang-undang Persekutuan.

Contoh: Biarlah R- sikap ϶ᴛᴏ pelajar. X– kod pelajar Y– set semua sifat pelajar. Kemudian X → Y, kerana X mewakili kunci utama yang secara unik mengenal pasti rekod dalam jadual pelajar.

Pernyataan ini juga akan benar untuk kes yang lebih umum: jika X- ϶ᴛᴏ kunci potensi, kemudian set semua atribut R sentiasa berfungsi bergantung pada X.

Walau bagaimanapun, perlu diingat bahawa jika R terdapat undang-undang persekutuan yang sebelah kirinya tidak termasuk kunci berpotensi, maka R mempunyai redundansi, yang menyukarkan untuk memastikan integriti data dan mengambil sumber sistem yang tidak diperlukan.

Jika tiada atribut harus ditinggalkan dari sebelah kiri, maka pergantungan fungsi seperti itu biasanya dipanggil tidak dapat dikurangkan(lebih tepat, dibiarkan tidak dapat dikurangkan).

Contoh:

{ID pelajar, Nama pertama, Nama terakhir, Nama tengah} → {Tarikh lahir) – diberi Undang-undang Persekutuan.

{ID pelajar} → {Tarikh lahir) – FL tidak dapat dikurangkan.

Satu set kebergantungan berfungsi biasanya dipanggil tidak dapat dikurangkan jika dan hanya jika ia mempunyai ketiga-tiga sifat berikut:

1. Bahagian bersandar setiap kebergantungan fungsi mengandungi hanya satu atribut.

2. Penentu setiap pergantungan fungsi tidak boleh dikurangkan.

3. Tiada satu kebergantungan fungsi daripada set harus dialih keluar tanpa kehilangan maklumat tentang sambungan.

Pertimbangan set undang-undang fizikal yang tidak boleh dikurangkan adalah penting untuk menormalkan hubungan.

Terdapat dua jenis undang-undang persekutuan:

1. Undang-undang persekutuan yang remeh- ϶ᴛᴏ Undang-undang Persekutuan, di mana bahagian kanan ( Y) ialah subset bahagian kiri ( X). Dari sudut pandangan praktikal, mereka tidak mempunyai kepentingan yang ketara, tetapi dari sudut pandangan teori formal kebergantungan, adalah sangat penting untuk mengambil kira kehadiran mereka.

2. Undang-undang persekutuan yang tidak remeh. Οʜᴎ sememangnya sekatan ke atas integriti data, sehubungan dengan ini, pada masa hadapan kami akan mempertimbangkan Undang-undang Persekutuan yang tidak remeh.

Untuk menentukan bentuk normal hubungan itu, adalah perlu untuk mencari semua undang-undang fizik. Ada tiga peraturan Armstrong(Ahli matematik Sweden), membenarkan seseorang memperoleh kemungkinan undang-undang fizik daripada set awal undang-undang fizik.

biarlah A, B, C- ϶ᴛᴏ subset set atribut hubungan R, AB– penyatuan subset ini.

1. Peraturan reflekstiviti. Sekiranya set B ialah subset daripada set A, Itu A → B. (Ini pada asasnya takrifan pergantungan yang remeh.)

2. Peraturan Pelengkap. Jika A → B, Itu AC → BC.

3. Peraturan transitiviti. Jika A → B Dan B→C, Itu A → C.

Setiap peraturan ini mesti dibuktikan berdasarkan definisi Undang-undang Persekutuan.

Pada masa yang sama, untuk memudahkan mendapatkan semua undang-undang persekutuan, beberapa lagi boleh diperolehi peraturan tambahan(biar D- ϶ᴛᴏ satu lagi subset arbitrari bagi set atribut R):

4. Peraturan penentuan nasib sendiri. A → A.

5. Peraturan penguraian. Jika A → BC, Itu A → B Dan A → C.

6. Peraturan persatuan. Jika A → B Dan A → C, Itu A → BC.

7. Peraturan komposisi. Jika A → B Dan C → D, Itu AC → BD.

8. Teorem penyatuan sejagat. Jika A→B Dan C → D, Itu A(C – B) → BD.

Nama teorem menunjukkan bahawa beberapa peraturan yang disenaraikan di atas boleh diterbitkan sebagai kes khas teorem ini.

Perlu diingat bahawa peraturan ini tidak menyediakan algoritma yang jelas untuk mendapatkan semua undang-undang persekutuan. Lebih-lebih lagi, algoritma sedemikian tidak wujud. Satu-satunya cara- ϶ᴛᴏ penghitungan semua pilihan.

Konsep pergantungan berfungsi - konsep dan jenis. Klasifikasi dan ciri kategori "Konsep pergantungan fungsi" 2017, 2018.

Maklumat sentiasa mempunyai minat dinamik yang mencukupi. Pembangunan bahasa pengaturcaraan, pangkalan data hubungan dan teknologi maklumat secara radikal mengubah kandungan dan struktur minat. Sistem idea yang ketat tertentu telah berkembang. Formalisasi, matematik tepat dan hubungan binari telah menjadi bidang pengetahuan dan pengalaman yang berjaya dan berkembang pesat.

Dunia semula jadi maklumat tidak mengubah dinamiknya dan, membangunkan kandungan dan struktur, telah meningkat ke tahap yang lebih tinggi. Ia mempunyai bentuk licin, dan tiada apa-apa dalam alam semula jadi "segi empat tepat". Maklumat, sudah tentu, sesuai dengan pemformalkan, tetapi ia mempunyai dinamik; bukan sahaja data dan algoritma untuk memprosesnya berubah, tetapi tugas itu sendiri dan kawasan aplikasinya berubah.

Maklumat > pemformalan >> data

Maklumat bertukar menjadi struktur maklumat, pangkalan data...) seperti yang dilihat oleh pengaturcara. Tidak ada jaminan bahawa visi ini adalah betul, tetapi jika programnya menyelesaikan masalah, maka data telah dibentangkan dengan sewajarnya yang mungkin.

Persoalan tentang seberapa betul maklumat itu diformalkan adalah masalah masa. Sehingga kini, konsep dinamik (penyesuaian diri kepada perubahan keadaan penggunaan) hanyalah impian pengaturcaraan.

Kebergantungan fungsi: "penyelesaian yang betul = program (pengaturcara)" dan syarat: "pematuhan berterusan dengan tugas" adalah sah dalam kebanyakan kes, tetapi hanya bersama-sama. Tetapi ini bukan asas matematik yang digunakan untuk mencipta pangkalan data.

Pernyataan langsung: dinamik semula jadi dan berterusan maklumat dan algoritma penyelesaian masalah sentiasa nyata. Dan ini adalah hubungan binari + matematik ketat + pembinaan formal yang tepat, + ...

dan pangkalan data

Cara data disimpan telah lama tidak penting: sama ada Ram atau peranti luaran. Komponen perkakasan telah mencapai tahap pembangunan yang stabil dan menyediakan kualiti yang baik dalam kuantiti yang banyak.

Pilihan storan utama, berbeza dalam pilihan penggunaan data:

  • fail;
  • Pangkalan data.

Yang pertama diserahkan kepada pengaturcara (apa yang perlu ditulis, dalam format apa, bagaimana untuk melakukannya, bagaimana untuk membaca...), yang kedua segera membawa keperluan untuk memahami hubungan fungsian yang mudah.

Kelajuan mendapatkan dan menulis maklumat apabila bekerja dengan fail (saiz yang munasabah, bukan astronomi) adalah sangat pantas, tetapi kelajuan operasi yang serupa dengan pangkalan data kadangkala boleh ketara perlahan.

Pengalaman peribadi dan kebijaksanaan kolektif

Terdapat percubaan sepanjang sejarah untuk melampaui had ini, tetapi sehingga hari ini pangkalan data hubungan berkuasa. Potensi teori yang hebat telah terkumpul, amalan aplikasi adalah meluas, dan pembangunnya sangat berkelayakan.

Pemaju pangkalan data mengenakan konsep pergantungan fungsi pada pengaturcara, walaupun dia tidak berhasrat untuk menggunakan pengalaman matematik dan logik yang kaya untuk membina struktur maklumat yang kompleks, proses bekerja dengan mereka, mendapatkan dan merekod maklumat.

Walaupun dalam kes mudah pengaturcara bergantung pada logik pangkalan data yang dia pilih untuk bekerja. Tidak ada keinginan untuk mengikuti kanun, anda boleh menggunakan fail, anda akan mendapat banyak fail dan banyak pengalaman peribadi. Banyak masa peribadi akan diluangkan dan masalah itu akan diselesaikan dalam jangka masa yang panjang.

Tidak kira betapa rumitnya contoh pergantungan fungsi yang kelihatan, sama sekali tidak perlu untuk menyelami kedalaman makna dan logik. Selalunya harus diakui bahawa minda kolektif telah dapat mencipta pangkalan data yang sangat baik, pelbagai saiz dan fungsi:

  • Oracle pepejal;
  • menuntut MS SQL Server;
  • MySQL yang popular.

Pangkalan data hubungan yang sangat baik dengan reputasi yang baik, mudah digunakan, pantas di tangan yang betul. Penggunaannya menjimatkan masa dan menghapuskan keperluan untuk menulis helaian tambahan kod tambahan.

Pengaturcaraan dan Ciri Data

Untuk masa yang lama, pengaturcaraan telah mengalami penyakit menulis semula sesuatu secara berterusan, mengulangi kerja pendahulunya, untuk entah bagaimana menyesuaikan sesuatu dengan maklumat yang berubah, tugas atau syarat penggunaannya.

Perkara tentang kebergantungan fungsi ialah, sama seperti dalam pengaturcaraan, kesilapan boleh menjadi sangat mahal. Tugasnya jarang mudah. Biasanya, semasa pemformalkan maklumat, perwakilan kompleks data diperolehi. Biasanya elemen mereka diasingkan, kemudian ia dipautkan oleh kunci ke dalam hubungan tertentu, kemudian algoritma untuk membentuk jadual, pertanyaan dan algoritma untuk mendapatkan maklumat diselaraskan.

Selalunya sangat penting mempunyai ikatan pada pengekodan. Tidak semua pangkalan data menawarkan penyelesaian mudah alih, anda sering dapat melihat bagaimana MySQL yang dikonfigurasikan dengan sempurna, di mana sedozen pangkalan data terletak, berfungsi dengan sempurna dan stabil, memaksa pembangun untuk menjadikan pangkalan data kesebelas serupa dengan yang sedia ada.

Ada masanya hosting bersama mengehadkan kefungsian PHP dan ini meninggalkan tanda pada akses pengaturcaraan ke pangkalan data.

DALAM pengaturcaraan moden tanggungjawab untuk algoritma program adalah bersamaan dengan tanggungjawab untuk mencipta model data. Segala-galanya sepatutnya berfungsi, tetapi anda tidak harus selalu terjun ke dalam hutan teori.

DB: pergantungan data mudah

Pertama sekali, konsep pangkalan data ialah pangkalan data, kedua-dua sistem pengurusan (contohnya, MySQL), dan struktur maklumat tertentu yang mencerminkan data tugas dan hubungan antara mereka. satu pangkalan data MySQL"memegang" sebarang bilangan struktur maklumat dalam pelbagai bidang aplikasi. satu Pangkalan data Oracle, boleh menyediakan proses maklumat syarikat besar atau bank, pantau isu keselamatan dan integriti data pada peringkat tertinggi, terletak pada banyak komputer yang terletak pada jarak yang berbeza, dalam persekitaran alat yang berbeza.

Secara umum diterima bahawa sikap adalah asas dalam model hubungan. Hubungan asas ialah satu set lajur dengan nama dan baris dengan nilai. Klasik "segi empat tepat"(jadual) - pencapaian kemajuan yang mudah dan berkesan. Kerumitan dan kebergantungan fungsi pangkalan data bermula apabila "segi empat tepat" mula menjalinkan hubungan antara satu sama lain.

Nama setiap lajur dalam setiap jadual mestilah unik dalam konteks tugasan. Data yang sama tidak boleh dalam dua jadual. Mengetahui maksud konsep:

  • “takrifkan entiti”;
  • "menghapuskan lebihan";
  • "memperbaiki hubungan";
  • "untuk memastikan keaslian."

Keperluan asas untuk menggunakan pangkalan data dan membina model data untuk tugas tertentu.

Pelanggaran mana-mana konsep ini bermakna kecekapan rendah algoritma, pensampelan data perlahan, kehilangan data dan masalah lain.

Pergantungan fungsional: logik dan makna

Anda tidak perlu membaca tentang tuple perhubungan, tentang fakta bahawa fungsi ialah korespondensi antara set hujah dan set nilai, dan fungsi bukan sahaja formula atau graf, tetapi boleh ditentukan oleh set nilai - jadual.

Ia tidak perlu, tetapi tidak salah untuk memikirkan kebergantungan berfungsi sebagai:

F(x1, x2, …, xN) = (y1, y2, …, yN).

Tetapi adalah penting untuk memahami bahawa input ialah jadual, dan output juga merupakan jadual atau penyelesaian khusus. Biasanya, kebergantungan berfungsi menetapkan logik perhubungan antara jadual, pertanyaan, keistimewaan, pencetus, prosedur tersimpan dan aspek lain (komponen) pangkalan data.

Biasanya, jadual ditukar kepada satu sama lain, kemudian kepada hasilnya. Tetapi penggunaan kebergantungan berfungsi tidak terhad kepada idea ini sahaja. Pengaturcara sendiri membina perwakilannya sendiri tentang gambar data, struktur maklumat... tidak kira apa yang anda panggil, tetapi jika ia berfungsi pada pangkalan data tertentu, ia mesti dibina mengikut logiknya, mengambil kira maksudnya dan dialek bahasa yang digunakan, biasanya SQL.

Ia boleh dikatakan bahawa sifat kebergantungan fungsi pangkalan data boleh diakses melalui dialek yang digunakan bahasa SQL. Tetapi adalah lebih penting untuk difahami: selepas semua perubahan dalam pembangunan, tidak banyak pangkalan data yang terselamat, tetapi terdapat banyak dialek bahasa ini dan ciri struktur dalaman dalam pangkalan data juga.

Mengenai Excel lama yang bagus

Apabila komputer menunjukkan dirinya dengan sisi positif, dunia segera dibahagikan kepada pengaturcara dan pengguna. Sebagai peraturan, yang pertama menggunakan:

  • PHP, Perl, JavaScript, C++, Delphi.
  • MySQL, Oracle, Visual FoxPro.
  • Perkataan.
  • Excel.

Sesetengah pengguna berjaya mencipta pangkalan data dalam Word sendiri (tanpa bantuan pengaturcara) - ini adalah karut sebenar.

Pengalaman pengguna dalam Excel untuk mencipta pangkalan data adalah praktikal dan menarik. Yang penting ialah Excel itu sendiri berfungsi, berwarna-warni dan praktikal.

Idea jadual mentakrifkan konsep pergantungan fungsi dengan cara yang jelas dan boleh diakses, tetapi setiap pangkalan data mempunyai nuansa. Masing-masing mempunyai "wajah" sendiri tetapi semua orang dari Excel hingga Oracle memanipulasi petak mudah, iaitu jadual.

Jika anda menganggap bahawa Excel bukanlah pangkalan data sama sekali, tetapi ramai pengguna (bukan pengaturcara) menggunakannya dengan cara itu, dan Oracle ialah pencapaian paling kompleks dan berkuasa bagi pasukan pembangun yang besar dalam bidang pangkalan data, maka ia menjadi lumrah untuk mengakui bahawa pangkalan data adalah perwakilan khusus pengaturcara (pasukan) tentang tugas tertentu dan penyelesaiannya.

Apakah pergantungan fungsi, dengan apa, di mana, mengapa... jelas hanya kepada pengarang atau pasukan daripada mereka.

Perihal Kemana Perhubungan Perhubungan Akan Dituju

Kemajuan saintifik dan teknologi adalah prosedur yang sangat menyakitkan, dan kadangkala kejam. Jika anda masih ingat bagaimana pangkalan data bermula, apakah *.dbf itu, bagaimana sibernetik dijenamakan, maka mereka jatuh cinta dengan sains komputer dan mula mencipta halangan kepada pergerakan Teknologi tinggi di peringkat negara, menjadi jelas mengapa pangkalan data hubungan sangat berdaya tahan dan baik. Mengapa gaya pengaturcaraan klasik masih hidup pada hari ini, dan pengaturcaraan berorientasikan objek hanya dihargai, tetapi belum memerintah.

Tidak kira betapa cantiknya pergantungan fungsi dalam konteks matematik:

Ini bukan perhubungan binari, atau sebaliknya, ia adalah sebab untuk memikirkan semula idea mewujudkan hubungan antara banyak atribut, meneroka "satu-ke-banyak", "banyak-dengan-satu", "banyak-kepada- -banyak" atau "banyak secara umum dan beberapa khususnya" perhubungan.

Anda boleh menghasilkan pelbagai pilihan perhubungan yang hebat. Ia adalah matematik dengan logik, dan ia ketat! Maklumat adalah matematiknya sendiri, istimewa. Di dalamnya, seseorang hanya boleh bercakap tentang formaliti dengan tolak yang sangat besar.

Anda boleh memformalkan kerja jabatan HR, menulis sistem kawalan automatik untuk pengeluaran minyak atau pengeluaran susu, roti, membuat pilihan dalam pangkalan data yang besar Google, Yandex atau Rambler, tetapi hasilnya akan sentiasa statik dan sama pada setiap saat!

Jika pergantungan fungsi = logik yang ketat dan matematik = asas untuk pangkalan data, maka apakah jenis dinamik yang boleh kita bincangkan? Sebarang penyelesaian adalah formal, mana-mana model data formal + algoritma ketat = penyelesaian tepat dan tidak jelas. Maklumat dan skop mana-mana program sentiasa berubah.

Sampel enjin carian pada frasa carian yang sama tidak boleh sama dalam satu atau dua jam dan, pasti, dalam sehari - jika frasa carian merujuk kepada bidang maklumat di mana bilangan tapak, sumber, pengetahuan, dan elemen lain sentiasa berubah.

Walaupun program itu adalah matematik semata-mata dan pangkalan datanya tidak memikirkan tentang dinamik, semuanya sentiasa bergaris. Dan tali itu mempunyai panjang. Dan ia tidak boleh berkesudahan. Ia tidak boleh menjadi pembolehubah, hanya pembolehubah bersyarat. Antara lain, mana-mana pangkalan data, dengan alat birokrasi matematik dan binarinya, mengenakan banyak formaliti, dan ini bermakna kelajuan + kualiti pensampelan dan pemprosesan maklumat.

Dan jika medan tertentu dalam pangkalan data adalah nombor, terutamanya yang sebenar, maka sekatan berikut akan ditambah: kapasiti digit nombor, kehadiran huruf "e", format perwakilan - ringkasnya, di mana-mana dan sentiasa kita ada yang penting sifat pergantungan fungsi pangkalan data: rentetan panjang berubah bersyarat dengan banyak formaliti binari dan sekatan matematik yang ketat.

Jika anda menukar nada dan mendengar nadi dinamik, maka semuanya boleh dicat menjadi objek. Untuk penghampiran pertama, nama lajur dalam jadual ialah objek, senarai nama juga objek, ringkasnya, jadual ialah objek pengepala dan di dalamnya nama lajur dalam pengepala. Dan mungkin tiada topi sama sekali...

Tetapi mungkin terdapat baris dalam jadual. Dan boleh ada nilai dalam rentetan. Dan kenapa mesti selalu ada bilangan yang sama? Meja persegi lengkap- ini adalah perkara tertentu, dan dalam kebanyakan kes, perkara peribadi.

Jika anda mewakili semua binaan dalam pangkalan data sebagai objek, maka mungkin anda tidak perlu membina perhubungan binari yang ketat. Terdapat semula jadi dan maksud sebenar jika hanya kerana ini, mengikut logik objektif (pasti bukan matematik), mencerminkan dinamik maklumat dan persekitaran di mana masalah wujud.


pengenalan

Pendekatan dialektik terhadap kajian alam dan masyarakat memerlukan pertimbangan fenomena dalam perkaitan dan perubahan yang berterusan. Konsep korelasi dan regresi muncul pada pertengahan abad ke-19. terima kasih kepada kerja ahli statistik Inggeris F. Galton dan K. Pearson. Istilah pertama berasal dari bahasa Latin "correlatio" - nisbah, hubungan. Istilah kedua (dari bahasa Latin "regresi" - pergerakan mundur) diperkenalkan oleh F. Galton, yang, semasa mengkaji hubungan antara ketinggian ibu bapa dan anak-anak mereka, menemui fenomena "regresi kepada min" - pada kanak-kanak yang dilahirkan kepada ibu bapa yang sangat tinggi, ketinggian cenderung lebih hampir kepada nilai purata.

Dalam amalan penyelidikan ekonomi, selalunya data yang tersedia tidak boleh dianggap sebagai sampel daripada populasi normal multivariate, contohnya, apabila salah satu pembolehubah yang dipertimbangkan tidak rawak atau apabila garis regresi jelas tidak lurus, dsb. Dalam kes ini, seseorang cuba menentukan lengkung (permukaan) yang memberikan penghampiran terbaik (dalam erti kata kuasa dua terkecil) kepada data asal. Kaedah penghampiran yang sepadan dipanggil analisis regresi. Objektif analisis regresi adalah untuk mewujudkan bentuk pergantungan antara pembolehubah, menganggar fungsi regresi, dan menganggar nilai yang tidak diketahui (ramalan nilai) pembolehubah bersandar.

Perkara di atas menentukan perkaitan pemilihan topik kerja kursus. Tujuan kerja ini adalah untuk mengkaji pergantungan fungsi antara pembolehubah rawak menggunakan kaedah analisis korelasi dan regresi.



Bab 1 Analisis Kolerasi

1.1 Kebergantungan fungsi, statistik dan korelasi

Dalam sains semula jadi selalunya kita bercakap tentang tentang pergantungan fungsi (sambungan), apabila setiap nilai satu pembolehubah sepadan dengan nilai yang sangat khusus bagi yang lain. Pergantungan fungsi boleh berlaku kedua-dua antara pembolehubah deterministik (bukan rawak) (contohnya, pergantungan kadar kejatuhan dalam vakum pada masa, dsb.) dan antara pembolehubah rawak (contohnya, pergantungan kos produk yang dijual pada bilangan mereka, dsb.) .Dalam ekonomi, dalam kebanyakan kes, terdapat kebergantungan antara kuantiti berubah, apabila setiap nilai satu pembolehubah tidak sepadan dengan yang khusus, tetapi dengan banyak kemungkinan nilai pembolehubah lain. Dengan kata lain, setiap nilai satu pembolehubah sepadan dengan taburan tertentu (bersyarat) pembolehubah lain. Pergantungan (sambungan) ini dipanggil statistik (atau stokastik, kebarangkalian).

Kemunculan konsep hubungan statistik adalah disebabkan oleh fakta bahawa pembolehubah bersandar dipengaruhi oleh beberapa faktor yang tidak terkawal atau tidak diambil kira, serta fakta bahawa pengukuran nilai pembolehubah tidak dapat dielakkan disertai oleh beberapa ralat rawak. Contoh hubungan statistik ialah pergantungan hasil pada jumlah baja yang digunakan, produktiviti buruh di perusahaan pada bekalan kuasanya, dsb.

Disebabkan oleh kekaburan hubungan statistik antara Y dan X, bagi penyelidik, khususnya, corak pergantungan yang dipuratakan ke atas x adalah menarik, i.e. corak dalam perubahan dalam nilai purata - jangkaan matematik bersyarat (Y) (jangkaan matematik pembolehubah rawak Y, didapati dengan syarat pembolehubah X mengambil nilai x) bergantung kepada x.

Definisi: Hubungan statistik antara dua pembolehubah di mana setiap nilai satu pembolehubah sepadan dengan nilai purata tertentu, i.e. jangkaan matematik bersyarat adalah berbeza, dipanggil korelasi. Jika tidak, pergantungan korelasi antara dua kuantiti berubah adalah pergantungan fungsi antara nilai salah satu daripada mereka dan jangkaan matematik bersyarat yang lain.

Kebergantungan korelasi boleh dibentangkan sebagai:

Diandaikan bahawa φ(x)≠const dan ψ(x)≠const, i.e. jika, apabila x atau y berubah, jangkaan matematik bersyarat (Y) tidak berubah, maka mereka mengatakan bahawa tiada korelasi antara pembolehubah X dan Y. Membandingkan jenis lain pergantungan antara X dan Y, kita boleh mengatakan bahawa dengan perubahan dalam nilai pembolehubah X, dengan pergantungan fungsi, nilai tertentu pembolehubah y berubah dengan jelas, dengan korelasi - nilai purata tertentu (jangkaan matematik bersyarat ) daripada Y, dan dengan statistik - taburan tertentu (bersyarat) pembolehubah Y (Rajah .1.1)

Oleh itu, daripada pergantungan yang dipertimbangkan, yang paling umum ialah pergantungan statistik. Setiap korelasi adalah statistik, tetapi tidak setiap hubungan statistik adalah korelasi. Pergantungan fungsi mewakili kes istimewa korelasi.

Persamaan (1.1) dan (1.2) dipanggil persamaan regresi model (atau ringkasnya persamaan regresi), masing-masing, Y dalam X dan X dalam Y, fungsi ψ(x) dan φ(y) ialah fungsi regresi model (atau fungsi regresi) , dan grafnya - garis regresi model (atau garis regresi).

Untuk mencari model persamaan regresi, secara amnya, adalah perlu untuk mengetahui hukum taburan pembolehubah rawak dua dimensi (X,Y). Dalam amalan, penyelidik, sebagai peraturan, hanya mempunyai sampel terhad pasangan nilai (,). Dalam kes ini, kita boleh bercakap tentang anggaran (ungkapan anggaran) berdasarkan sampel fungsi regresi. Anggaran terbaik (dalam erti kata kaedah kuasa dua terkecil) ini ialah garis regresi sampel (lengkung) Y pada X

di manakah purata bersyarat (kumpulan) pembolehubah Y untuk nilai tetap pembolehubah X = x; ,…, ialah parameter lengkung.

Garis regresi sampel (lengkung) X pada Y ditentukan dengan cara yang sama:

di manakah purata bersyarat (kumpulan) pembolehubah X untuk nilai tetap pembolehubah Y = y; -parameter lengkung.

Persamaan (1.3), (1.4) juga dipanggil persamaan regresi sampel, masing-masing, Y oleh X dan X oleh Y.

Dengan fungsi anggaran yang ditakrifkan dengan betul) dan dengan peningkatan saiz sampel (n), ia akan menumpu dalam kebarangkalian, masing-masing, kepada fungsi regresi ψ(x) dan φ(y).

Hubungan statistik antara pembolehubah boleh dikaji menggunakan kaedah korelasi dan analisis regresi. Objektif utama analisis regresi adalah untuk mewujudkan bentuk dan mengkaji hubungan antara pembolehubah. Tugas utama analisis korelasi– mengenal pasti hubungan antara pembolehubah rawak dan menilai keakrabannya.

1.2 Regresi pasangan linear

Adalah mudah untuk menetapkan data tentang pergantungan statistik dalam bentuk jadual korelasi.

Mari kita pertimbangkan, sebagai contoh, hubungan antara keluaran harian Y (t) dan nilai aset pengeluaran tetap X (juta rubel) untuk satu set 50 perusahaan serupa (Jadual 1).
(Dalam jadual, dan menunjukkan titik tengah selang yang sepadan, dan dan menunjukkan frekuensinya, masing-masing.)

Bagi setiap nilai, i.e. untuk setiap baris jadual korelasi kami mengira purata kumpulan

di manakah frekuensi pasangan () dan; m – bilangan selang untuk pembolehubah Y.

Kami akan meletakkan purata kumpulan yang dikira dalam lajur terakhir jadual korelasi dan memaparkannya secara grafik dalam bentuk garis putus-putus, dipanggil garis regresi empirikal Y pada X

Begitu juga untuk setiap nilai mengikut formula

Mari kita hitung purata kumpulan, dengan l ialah bilangan selang bagi pembolehubah X.

Dengan bentuk garis putus, seseorang boleh menentukan kehadiran pergantungan korelasi linear Y pada X antara dua pembolehubah yang sedang dipertimbangkan, yang dinyatakan dengan lebih tepat semakin besar saiz sampel n:

Oleh itu, kita akan mencari persamaan regresi (1.3) dalam bentuk:

Mari kita berehat sebentar dari contoh yang sedang dipertimbangkan dan cari formula untuk mengira parameter yang tidak diketahui bagi persamaan regresi linear.

Untuk tujuan ini, kami menggunakan kaedah kuasa dua terkecil, mengikut mana parameter yang tidak diketahui dipilih sedemikian rupa sehingga jumlah sisihan kuasa dua purata kumpulan empirikal dikira menggunakan formula (1.5) daripada nilai yang ditemui menggunakan regresi persamaan (1.8) adalah minimum:

berdasarkan syarat yang perlu daripada ekstrem fungsi dua pembolehubah S=S() kita samakan terbitan separanya kepada sifar, i.e.

Dari mana, selepas transformasi, kita memperoleh sistem persamaan normal untuk menentukan parameter regresi linear:

Dengan mengambil kira (1.5), kita mengubah ungkapan dan mengambil kira (1.7), membahagikan kedua-dua belah persamaan (1.10) dengan n, kita memperoleh sistem persamaan normal dalam bentuk:

di mana purata yang sepadan ditentukan oleh formula:

Menggantikan nilai daripada persamaan pertama sistem (1.11) ke dalam persamaan regresi (1.8), kita memperoleh

Pekali b 1 dalam persamaan regresi, dipanggil pekali regresi sampel (atau ringkasnya pekali regresi) Y pada X, akan dilambangkan dengan simbol. Sekarang persamaan regresi Y pada X akan ditulis seperti ini:

Pekali regresi Y pada X menunjukkan berapa banyak unit secara purata pembolehubah Y berubah apabila pembolehubah X meningkat sebanyak satu unit.

Sistem penyelesaian (1.11), kami dapati

di manakah varians sampel bagi pembolehubah X

µ - momen korelasi sampel:

Menaakul sama dan menganggap persamaan regresi (1.4) adalah linear, kita boleh mengurangkannya kepada bentuk:

pekali regresi sampel (atau ringkasnya pekali regresi) X pada Y, menunjukkan berapa banyak unit secara purata pembolehubah X berubah apabila pembolehubah Y meningkat sebanyak satu unit = – (–varians sampel pembolehubah Y. ketagihan. Dalam kes ini, semua pemerhatian terletak ... Garis arah aliran (Rajah 2); 3) pilih jenis kebergantungan regresi. Untuk contoh kami, jenis trend...

  • Bilik wap regresi (3)

    Ujian >> Matematik

    Maksud analisis regresi ialah pembinaan berfungsi kebergantungan antara dua kumpulan pembolehubah... linear dan tak linear regresi. Linear regresi:. Tak linear regresi dibahagikan kepada dua kelas: regresi, tak linear berkenaan dengan...

  • Kekangan keunikan yang dikenakan oleh pengisytiharan utama dan calon utama sesuatu hubungan adalah kes khas kekangan yang dikaitkan dengan konsep kebergantungan berfungsi.

    Untuk menerangkan konsep pergantungan fungsi, pertimbangkan contoh berikut.

    Marilah kita diberikan hubungan yang mengandungi data tentang keputusan satu sesi tertentu. Gambar rajah perhubungan ini kelihatan seperti ini:

    Sesi ( Buku gred no. , Nama penuh, item , Gred);

    Atribut "No Buku Gred." dan "Subjek" membentuk kunci utama komposit (memandangkan dua atribut diisytiharkan sebagai kunci) bagi perhubungan ini. Sesungguhnya, daripada kedua-dua sifat ini seseorang boleh menentukan dengan jelas nilai semua atribut lain.

    Walau bagaimanapun, sebagai tambahan kepada kekangan keunikan yang dikaitkan dengan kunci ini, perhubungan itu mestilah tertakluk kepada syarat bahawa satu buku gred mesti dikeluarkan kepada satu kepada orang tertentu dan oleh itu, dalam hal ini, tupel dengan nombor buku gred yang sama mesti mengandungi nilai yang sama atribut "Nama keluarga", "Nama pertama" dan "Patronymic".


    Jika kita mempunyai serpihan berikut bagi beberapa pangkalan data pelajar tertentu institusi pendidikan selepas beberapa sesi, maka dalam tupel dengan nombor buku gred 100, atribut "Nama Akhir", "Nama Pertama" dan "Patronymic" bertepatan, tetapi atribut "Subjek" dan "Gred" tidak bertepatan (yang boleh difahami, kerana ia mengandungi perkara yang sama berlaku mata pelajaran yang berbeza dan prestasi pada mereka). Ini bermakna bahawa atribut "Nama Akhir", "Nama Pertama" dan "Patronymic" bergantung secara fungsional daripada atribut "Nombor buku Gred", dan atribut "Subjek" dan "Gred" adalah bebas dari segi fungsi.

    Oleh itu, pergantungan fungsi ialah kebergantungan yang tidak jelas yang dijadualkan dalam sistem pengurusan pangkalan data.

    Sekarang mari kita berikan definisi yang ketat tentang pergantungan fungsi.

    Definisi: biarkan X, Y menjadi subskema bagi hubungan skema S yang mentakrifkan di atas skema S rajah kebergantungan fungsi X > Y(baca “X anak panah Y”). Mari kita tentukan sekatan pergantungan fungsi inv > Y> sebagai pernyataan bahawa, berhubung dengan skema S, mana-mana dua tupel yang bertepatan dalam unjuran kepada subskema X juga mesti bertepatan dalam unjuran kepada subskema Y.

    Mari kita tulis definisi yang sama dalam bentuk formal:

    Inv > Y> r(S) = t 1 , t 2 ? r(t 1 [X] = t 2 [X] ? t 1 [Y] = t 2 [Y]), X, Y? S;

    Menariknya, takrifan ini menggunakan konsep operasi unjuran unari, yang kami temui sebelum ini. Sesungguhnya, bagaimana lagi, jika tidak menggunakan operasi ini, bolehkah anda menunjukkan bahawa dua lajur jadual hubungan, dan bukannya baris, adalah sama antara satu sama lain? Oleh itu, kami menulis dari segi operasi ini bahawa kebetulan tuple dalam unjuran ke beberapa atribut atau beberapa atribut (subschema X) pastinya melibatkan kebetulan lajur tuple yang sama pada subskema Y jika Y bergantung pada X secara berfungsi.

    Adalah menarik untuk diperhatikan bahawa dalam kes pergantungan fungsi Y pada X, mereka juga mengatakan bahawa X mendefinisikan secara fungsional Y atau apa Y bergantung secara fungsional dari X. Dalam rajah kebergantungan berfungsi X > Y, sublitar X dipanggil sebelah kiri, dan sublitar Y dipanggil sebelah kanan.

    Dalam amalan reka bentuk pangkalan data, rajah kebergantungan berfungsi biasanya dirujuk sebagai rajah kebergantungan berfungsi untuk ringkasnya.

    Akhir definisi.


    Dalam kes khas apabila bahagian kanan pergantungan fungsi, iaitu, subskema Y, bertepatan dengan keseluruhan skema perhubungan, kekangan pergantungan fungsi menjadi kekangan keunikan untuk kunci utama atau calon. sungguh:

    Inv<K > S> r(S) = ? t 1 , t 2 ? r(t 1 [K] = t 2 [K] > t 1 (S) = t 2 (S)), K ? S;

    Cuma dalam mentakrifkan pergantungan fungsian, bukannya sublitar X, anda perlu mengambil sebutan kunci K, dan bukannya bahagian kanan pergantungan fungsi, sublitar Y, anda perlu mengambil keseluruhan rajah hubungan S, iaitu, sesungguhnya, kekangan keunikan kunci perhubungan adalah kes khas kekangan pergantungan fungsi apabila bahagian kanan adalah skema pergantungan fungsi yang sama dengan keseluruhan skema perhubungan.

    Berikut ialah contoh imej pergantungan berfungsi:

    (nombor buku gred) > (Nama keluarga, Nama pertama, Patronymic);

    (no. buku gred, Subjek) > (Gred);

    2. Peraturan inferens Armstrong

    Jika mana-mana hubungan asas memenuhi kebergantungan fungsi yang ditentukan vektor, maka yang lain boleh diperoleh menggunakan pelbagai peraturan inferens khas kebergantungan berfungsi, yang pastinya akan memuaskan hubungan asas ini.

    Contoh yang baik bagi peraturan khas tersebut ialah peraturan inferens Armstrong.

    Tetapi sebelum kita mula menganalisis peraturan inferens Armstrong sendiri, mari kita perkenalkan simbol metalinguistik baru "+", yang dipanggil simbol pernyataan meta tentang dedusibiliti. Apabila merumuskan peraturan, simbol ini ditulis di antara dua ungkapan sintaksis dan menunjukkan bahawa formula di sebelah kanannya berasal daripada formula di sebelah kirinya.

    Sekarang mari kita rumuskan peraturan inferens Armstrong sendiri dalam bentuk teorem berikut.

    Teorem. Peraturan berikut, yang dipanggil peraturan inferens Armstrong, adalah sah.

    Peraturan inferens 1.+ X > X;

    Peraturan inferens 2. X > Y+ X ? Z > Y;

    Peraturan inferens 3. X > Y, Y ? W > Z + X ? W > Z;

    Di sini X, Y, Z, W adalah subskema arbitrari bagi skema hubungan S. Simbol pernyataan meta tentang dedusibiliti memisahkan senarai premis dan senarai pernyataan (kesimpulan).

    1. Peraturan inferens pertama dipanggil “ refleksitiviti” dan berbunyi seperti berikut: “peraturan itu diperolehi: “X berfungsi melibatkan X.” Ini adalah peraturan inferens Armstrong yang paling mudah. Ia benar-benar keluar dari udara nipis.

    Adalah menarik untuk diperhatikan bahawa pergantungan berfungsi, yang mempunyai kedua-dua kiri dan sebelah kanan, dipanggil reflektif. Mengikut peraturan refleksif, sekatan pergantungan refleksif dipenuhi secara automatik.

    2. Peraturan inferens kedua dipanggil “ pengisian semula” dan berbunyi begini: “jika X secara fungsinya menentukan Y, maka peraturan itu diperoleh: “penyatuan sublitar X dan Z secara fungsional melibatkan Y.” Peraturan penambahan semula membolehkan anda berkembang sebelah kiri sekatan ke atas kebergantungan fungsi.

    3. Peraturan inferens ketiga dipanggil “ pseudotransitiviti” dan berbunyi seperti berikut: “jika sublitar X secara fungsinya melibatkan sublitar Y dan gabungan sublitar Y dan W secara fungsional melibatkan Z, maka peraturan itu diperolehi: “kesatuan sublitar X dan W secara fungsional menentukan sublitar Z.”

    Peraturan pseudotransitiviti menyamaratakan peraturan transitiviti sepadan dengan kes khas W: = 0. Mari kita berikan perwakilan rasmi peraturan ini:

    Perlu diingatkan bahawa premis dan kesimpulan yang diberikan sebelum ini telah dibentangkan dalam bentuk singkatan menggunakan sebutan skema pergantungan berfungsi. Dalam bentuk yang diperluaskan, ia sepadan dengan sekatan pergantungan fungsi berikut.

    Peraturan inferens 1. inv X>r(S);

    Peraturan inferens 2. inv Y> r(S) ? inv Y>r(S);

    Peraturan inferens 3. inv Y> r(S) & inv Z> r(S) ? inv Z>r(S);

    Mari kita laksanakan bukti peraturan inferens ini.

    1. Bukti peraturan refleksitiviti mengikuti terus daripada takrifan sekatan pergantungan fungsi apabila menggantikan sublitar X dan bukannya sublitar Y.

    Sesungguhnya, mari kita ambil kekangan pergantungan fungsi:

    Inv Y> r(S) dan gantikan X ke dalamnya dan bukannya Y, kita dapat:

    Inv X> r(S), dan ini adalah peraturan reflekstiviti.

    Peraturan reflekstiviti telah terbukti.

    2. Bukti peraturan pengisian semula Mari kita ilustrasikan dengan gambar rajah kebergantungan berfungsi.

    Rajah pertama ialah rajah premis:

    Pakej: X>Y


    Gambar rajah kedua:

    kesimpulan: X ? Z>Y


    Biarkan tupel sama pada X? Z. Maka mereka adalah sama pada X. Menurut premis itu, mereka akan sama pada Y.

    Peraturan penambahan telah terbukti.

    3. Bukti peraturan pseudotransitiviti Kami juga akan menggambarkan dengan gambar rajah, yang mana akan ada tiga dalam kes ini.

    Rajah pertama ialah premis pertama:

    premis 1: X > Y


    premis 2: Y ? W>Z


    Dan akhirnya, rajah ketiga ialah rajah kesimpulan:

    kesimpulan: X ? W>Z


    Biarkan tupel sama pada X? W. Kemudian mereka adalah sama pada kedua-dua X dan W. Menurut Premis 1, mereka akan sama pada Y. Oleh itu, mengikut Premis 2, mereka akan sama pada Z.

    Peraturan pseudotransitiviti telah terbukti.

    Semua peraturan telah terbukti.

    3. Peraturan inferens terbitan

    Satu lagi contoh peraturan dengan bantuan peraturan baru pergantungan fungsi boleh, jika perlu, diperolehi adalah apa yang dipanggil peraturan inferens terbitan.

    Apakah peraturan ini, bagaimana ia diperoleh?

    Maklumlah jika dari beberapa peraturan yang sudah ada, sah kaedah logik memperoleh yang lain, maka peraturan baru ini, dipanggil derivatif, boleh digunakan bersama peraturan asal.

    Perlu diingatkan khas bahawa peraturan yang sangat sewenang-wenang ini "diperoleh" dengan tepat daripada peraturan inferens Armstrong yang kami lalui sebelum ini.

    Mari kita rumuskan peraturan terbitan untuk membuat kesimpulan kebergantungan fungsi dalam bentuk teorem berikut.

    Teorem.

    Peraturan berikut diperoleh daripada peraturan inferens Armstrong.

    Peraturan inferens 1.+X? Z > X;

    Peraturan inferens 2. X > Y, X > Z + X ? Y>Z;

    Peraturan inferens 3. X > Y ? Z + X > Y, X > Z;

    Di sini X, Y, Z, W, seperti dalam kes sebelumnya, adalah subskema sewenang-wenang bagi skema hubungan S.

    1. Peraturan terbitan pertama dipanggil peraturan remeh dan berbunyi seperti berikut:

    "Peraturan itu diperolehi:" penyatuan sublitar X dan Z secara fungsional melibatkan X."

    Kebergantungan berfungsi dengan bahagian kiri sebagai subset dari bahagian kanan dipanggil remeh. Mengikut peraturan remeh, kekangan pergantungan remeh dipenuhi secara automatik.

    Menariknya, peraturan remeh ialah generalisasi peraturan reflekstiviti dan, seperti yang kedua, boleh diperoleh secara langsung daripada takrifan kekangan pergantungan fungsi. Hakikat bahawa peraturan ini adalah terbitan tidak disengajakan dan dikaitkan dengan kesempurnaan sistem peraturan Armstrong. Kami akan bercakap lebih lanjut mengenai kesempurnaan sistem peraturan Armstrong sedikit kemudian.

    2. Peraturan terbitan kedua dipanggil peraturan aditiviti dan berbunyi seperti berikut: “Jika sublitar X secara fungsinya menentukan sublitar Y, dan X secara serentak secara fungsional menentukan Z, maka daripada peraturan ini kita simpulkan peraturan seterusnya: "X secara fungsional mentakrifkan penyatuan sublitar Y dan Z."

    3. Peraturan terbitan ketiga dipanggil peraturan projektiviti atau peraturan" pembalikan aditiviti" Ia berbunyi seperti berikut: "Jika sublitar X berfungsi mentakrifkan kesatuan sublitar Y dan Z, maka daripada peraturan ini peraturan berikut diperolehi: "X berfungsi mentakrifkan sublitar Y dan pada masa yang sama X berfungsi mentakrifkan sublitar Z," iaitu, sememangnya. , ini ialah peraturan terbitan ialah songsang peraturan ketagihan.

    Adalah aneh bahawa peraturan tambahan dan projektiviti seperti yang digunakan pada kebergantungan berfungsi dengan bahagian kiri yang sama membolehkan kita menggabungkan atau, sebaliknya, membelah bahagian kanan pergantungan.

    Apabila membina rantaian inferens, selepas merumuskan semua premis, peraturan transitiviti digunakan untuk memasukkan pergantungan berfungsi dengan bahagian kanan terletak dalam kesimpulan.

    Mari kita laksanakan bukti peraturan inferens arbitrari yang disenaraikan.

    1. Bukti peraturan perkara remeh.

    Marilah kita melaksanakannya, seperti semua bukti berikutnya, langkah demi langkah:

    1) kita ada: X > X (daripada peraturan reflekstiviti inferens Armstrong);

    Peraturan remeh telah terbukti.

    2. Mari kita laksanakan bukti langkah demi langkah peraturan itu aditiviti:

    1) kita ada: X > Y (ini adalah premis 1);

    2) kita ada: X > Z (ini adalah premis 2);

    3) kita ada: Y ? Z > Y ? Z (daripada peraturan reflekstiviti inferens Armstrong);

    4) kita ada: X? Z > Y ? Z (diperolehi dengan menggunakan peraturan pseudotransitiviti terbitan Armstrong, dan kemudian sebagai akibat daripada langkah pertama dan ketiga pembuktian);

    5) kita ada: X? X > Y ? Z (diperolehi dengan menggunakan peraturan pseudotransitiviti Armstrong, dan kemudian mengikuti dari langkah kedua dan keempat);

    6) kita ada X > Y? Z (mengikut dari langkah lima).

    Peraturan aditiviti telah terbukti.

    3. Dan akhirnya, kami akan membina bukti peraturan itu projektiviti:

    1) kita ada: X > Y? Z, X > Y ? Z (ini adalah petak);

    2) kita ada: Y > Y, Z > Z (diperoleh menggunakan peraturan reflekstiviti inferens Armstrong);

    3) kita ada: Y ? z > y, Y ? z > Z (diperolehi daripada peraturan penyiapan terbitan Armstrong dan akibat daripada langkah kedua pembuktian);

    4) kita ada: X > Y, X > Z (ini diperoleh dengan menggunakan peraturan pseudotransitiviti terbitan Armstrong, dan kemudian sebagai akibat daripada langkah pertama dan ketiga pembuktian).

    Peraturan projektiviti telah terbukti.

    Semua peraturan inferens terbitan telah dibuktikan.

    4. Kesempurnaan sistem peraturan Armstrong

    biarlah F(S) - set kebergantungan fungsi tertentu yang ditakrifkan pada gambar rajah hubungan S.

    Mari kita nyatakan dengan inv <F(S)> had yang dikenakan oleh set kebergantungan berfungsi ini. Mari kita tuliskannya:

    Inv <F(S)> r(S) = ?X > Y ? F(S) [inv Y> r(S)].

    Jadi, set sekatan yang dikenakan oleh kebergantungan berfungsi ini ditafsirkan seperti berikut: untuk sebarang peraturan daripada sistem kebergantungan berfungsi X > Y, kepunyaan set kebergantungan berfungsi F(S), inv sekatan kebergantungan berfungsi berkuat kuasa Y> r(S), ditakrifkan atas satu set hubungan r(S).

    Biarkan beberapa sikap r(S) memenuhi kekangan ini.

    Menggunakan peraturan inferens Armstrong kepada kebergantungan fungsi yang ditakrifkan untuk set F(S), anda boleh mendapatkan kebergantungan fungsi baharu, seperti yang telah dikatakan dan dibuktikan oleh kami sebelum ini. Dan, yang penting, batasan kebergantungan fungsi ini adalah berkaitan F(S) akan memuaskan secara automatik, seperti yang dapat dilihat daripada bentuk lanjutan penulisan peraturan inferens Armstrong. Biar kami ingatkan anda bentuk umum peraturan inferens lanjutan ini:

    Peraturan inferens 1. inv < X >X> r(S);

    Peraturan inferens 2. inv Y> r(S) ? inv ? Z>Y> r(S);

    Peraturan inferens 3. inv Y> r(S) & inv ? W>Z> r(S) ? inv ? W>Z>;

    Berbalik kepada alasan kita, mari kita lengkapkan set F(S) kebergantungan baharu yang diperoleh daripadanya menggunakan peraturan Armstrong. Kami akan menggunakan prosedur penambahan semula ini sehingga kami tidak lagi memperoleh kebergantungan fungsi baharu. Hasil daripada pembinaan ini, kami memperoleh satu set kebergantungan fungsi baharu, yang dipanggil litar pintas set F(S) dan dilambangkan F+(S).

    Memang, nama ini agak logik, kerana kita sendiri, melalui pembinaan yang panjang, "menutup" banyak kebergantungan fungsi sedia ada pada diri kita sendiri, menambah (oleh itu "+") semua kebergantungan fungsi baharu yang terhasil daripada yang sedia ada.

    Perlu diingatkan bahawa proses membina penutupan ini adalah terhad, kerana skema hubungan itu sendiri, di mana semua pembinaan ini dijalankan, adalah terhad.

    Tidak perlu dikatakan bahawa penutupan adalah superset set yang ditutup (sememangnya, ia lebih besar!) dan tidak berubah sama sekali apabila ia ditutup semula.

    Jika kita menulis apa yang baru dikatakan dalam bentuk formal, kita mendapat:

    F(S) ? F + (S), [F + (S)] + = F + (S);

    Selanjutnya, daripada kebenaran yang terbukti (iaitu kesahihan, kesahihan) peraturan inferens Armstrong dan definisi penutupan, ia berikutan bahawa mana-mana hubungan yang memenuhi kekangan set tanggungan fungsi tertentu akan memenuhi kekangan pergantungan yang dimiliki oleh penutupan. .

    X > Y ? F + (S) ? ?r(S) [inv <F(S)> r(S) ? inv Y> r(S)];

    Jadi, teorem kesempurnaan Armstrong untuk sistem peraturan inferens menyatakan bahawa implikasi luaran boleh sepenuhnya secara sah dan wajar digantikan dengan kesetaraan.

    (Kami tidak akan mempertimbangkan bukti teorem ini, kerana proses pembuktian itu sendiri tidak begitu penting dalam kursus kuliah khusus kami.)

    Apabila mereka bentuk pangkalan data dalam DBMS hubungan Matlamat utama membangunkan model data logik adalah untuk mencipta perwakilan data yang tepat, hubungan antara mereka dan kekangan yang diperlukan. Untuk melakukan ini, perlu terlebih dahulu menentukan set hubungan yang sesuai. Kaedah yang digunakan untuk ini dipanggil normalisasi. Normalisasi ialah varian pendekatan bawah ke atas kepada reka bentuk pangkalan data yang bermula dengan mewujudkan hubungan antara atribut.

    Tujuan normalisasi

    Normalisasi - kaedah mencipta satu set perhubungan dengan sifat tertentu berdasarkan keperluan data yang ditetapkan dalam sesetengah organisasi.

    Normalisasi selalunya dilakukan sebagai satu siri ujian pada hubungan untuk memeriksa sama ada ia memenuhi (atau gagal memenuhi) keperluan bentuk normal yang diberikan.

    Proses normalisasi adalah kaedah formal yang membolehkan perhubungan dikenal pasti berdasarkan mereka kunci utama(atau kunci calon, seperti dalam kes BCNF) dan kebergantungan fungsi yang wujud antara atribut mereka. Pereka pangkalan data boleh menggunakan penormalan dalam bentuk set ujian yang digunakan pada perhubungan individu untuk menormalkan skema perhubungan kepada bentuk tertentu yang diberikan, dengan itu menghalang kemungkinan berlakunya anomali kemas kini.

    Matlamat reka bentuk utama asas perhubungan data adalah untuk mengumpulkan atribut dan perhubungan untuk meminimumkan lebihan data dan dengan itu mengurangkan jumlah memori yang diperlukan untuk menyimpan perhubungan secara fizikal yang diwakili sebagai jadual.

    Kebergantungan fungsional

    Kebergantungan fungsional menerangkan hubungan antara atribut dan merupakan salah satu konsep asas normalisasi. Bahagian ini memberikan definisi konsep ini, dan bahagian berikut menerangkan hubungannya dengan proses menormalkan hubungan pangkalan data.

    Pergantungan fungsional- menerangkan hubungan antara sifat-sifat sesuatu hubungan. Sebagai contoh, jika berkaitan. R yang mengandungi atribut A dan B, atribut B secara fungsinya bergantung pada atribut A (yang dilambangkan sebagai AB), maka setiap nilai atribut A dikaitkan dengan hanya satu nilai atribut B. (Selain itu, setiap atribut A dan B boleh terdiri daripada satu atau beberapa atribut.)

    Kebergantungan fungsional ialah sifat semantik (atau semantik) bagi sifat-sifat sesuatu hubungan. Semantik perhubungan menentukan cara atributnya boleh dikaitkan antara satu sama lain, dan juga mentakrifkan kebergantungan fungsi antara atribut dalam bentuk sekatan yang dikenakan ke atas beberapa atribut.

    Hubungan antara atribut A dan B boleh digambarkan secara skematik dalam bentuk rajah yang ditunjukkan dalam Rajah 5.

    Penentu- penentu pergantungan fungsi ialah atribut atau kumpulan atribut yang terletak pada gambar rajah pergantungan fungsi di sebelah kiri simbol anak panah.

    Rajah 5 - Gambar rajah pergantungan fungsional

    Apabila terdapat kebergantungan fungsi, atribut atau kumpulan atribut yang terletak pada rajahnya di sebelah kiri simbol anak panah dipanggil penentu. Sebagai contoh, dalam Rajah. 6.1 atribut A ialah penentu bagi atribut B.

    Konsep kebergantungan fungsi adalah konsep utama dalam proses normalisasi.