Menguji kepentingan model regresi berganda dan parameternya. Kepentingan statistik parameter regresi dan korelasi

Muka surat 1


Kepentingan model untuk menyelesaikan masalah penyelidikan khusus terletak pada hakikat bahawa ia membenarkan penilaian kuantitatif parameter tersembunyi yang mencerminkan dinamik sistem dua produk. Apabila menyelesaikan masalah sedemikian, konsep dalaman (produk jenis pertama) dan luaran (produk jenis kedua) mungkin berubah. Oleh itu, dalam model biosintesis protein yang dibina oleh V.M. Glushkov dan rakan-rakannya (1979), peranan produk jenis pertama dan kedua dimainkan oleh protein pengawalseliaan dan struktur, dalam model tindak balas imun - sel stem dan limfosit, masing-masing, dalam model peraturan kontraksi jantung - bahan yang dihantar miokardiosit, masing-masing, melalui saluran koronari dan melalui aorta.

Penilaian kepentingan model diberikan melalui / - kriteria dan / J2 bagi setiap persamaan secara berasingan.

Andaian kepentingan model adalah berdasarkan dua peruntukan.

Semua ini tidak menjejaskan kepentingan model. Sememangnya, tanpa iota kewujudan muzik tidak dapat difikirkan.

Akhirnya, had maksimum Kepentingan model kontrak seperti itu dipermudahkan oleh fakta bahawa hampir semua peraturan yang berkuat kuasa di kawasan ini adalah bersifat wajib (imperatif).

Penggunaan analisis varians sebagai tambahan kepada regresi membolehkan kita menilai bukan sahaja kepentingan model secara keseluruhan, tetapi juga kepentingan kebergantungan tertentu.

Daripada data yang dibentangkan, ia juga menunjukkan bahawa apabila menggerudi batu yang lebih keras, kepentingan model adalah lebih tinggi. Bukti kepentingan model yang terhasil mengesahkan hipotesis tentang pergantungan tak linear bagi parameter yang sedang dipertimbangkan.

Walaupun kejayaan dalam pembangunan teori membuat keputusan, ia nampaknya akan kekal untuk masa yang lama di tempat perantaraan antara seni - keupayaan untuk membuat keputusan yang wujud dalam kepada medium ini keputusan - dan sains sebagai sistem prinsip, peruntukan am, prosedur dan kaedah. Walau bagaimanapun, ini tidak mengurangkan kaitan buku: bilangan sistem manusia-komputer akan meningkat, kepentingan membuat keputusan dalam situasi yang kompleks akan berkembang, dan ia akan menjadi semakin sukar bagi seseorang untuk menyelesaikan masalah yang sepadan menggunakan lama ( tepat dan kebarangkalian) kaedah. Oleh itu, kepentingan model yang menggunakan ketidakpastian formal berdasarkan idea selain daripada matematik kebetulan hanya boleh meningkat.

Dengan pendekatan induktif, ciri-ciri proses pemodelan dalam rangka analisis aktiviti perniagaan, model diperoleh dengan menggeneralisasikan pemerhatian fakta-fakta tertentu individu, yang pertimbangannya dianggap penting untuk membuat keputusan. Model dibangunkan secara induktif untuk menyelesaikan masalah pengurusan ekonomi tertentu. Model termasuk mengambil kira sifat khusus yang dibentuk secara sejarah bagi proses yang dimodelkan. Masalah utama merangka model induktif ialah pemilihan daripada satu set pemerhatian individu yang menentukan intipati keputusan yang dibuat, dan pembentangan struktur dan sambungannya dalam bentuk formal. Kepentingan model induktif ialah dengan memudahkan huraian perhubungan, maklumat yang terkandung dalam set pemerhatian yang besar akan dipersembahkan dalam bentuk visual dan ringkas. Kualiti model induktif tidak ditentukan oleh ketepatan penyalinan realiti kompleks oleh sistem simbolik, tetapi bergantung pada seberapa banyak yang mungkin, dalam satu pihak, untuk memudahkan model untuk mencapai penyelesaian kepada masalah pada kos yang boleh diterima, tetapi, sebaliknya, untuk mencerminkan sifat asas realiti.

Jika jenis perjanjian buruh ini menetapkan tahap upah, maka apabila tahap pasaran menyimpang daripada tahap yang diharapkan oleh pekerja dan majikan apabila mereka menandatangani kontrak, maka adalah optimum bagi kedua-dua pekerja dan majikan untuk menukar gaji nominal tetap. Oleh itu, memandangkan keadaan pasaran buruh sentiasa berubah, adalah logik untuk mengandaikan bahawa dari masa ke masa perjanjian pekerjaan tersebut akan tidak lagi wujud. Pekerja dan majikan akan menjangkakan bahawa gaji nominal perlu diselaraskan setiap hari, menghasilkan gaji nominal yang akan turun naik secara anjal sebagai tindak balas kepada dinamik penawaran dan permintaan dalam pasaran buruh. Sebenarnya, kebenaran kritikan sedemikian adalah penurunan mendadak dalam aktiviti kesatuan dalam industri AS pada akhir 1970-an dan 1980-an. Sudah tentu, pekerja bukan kesatuan pekerja selalunya mempunyai perjanjian buruh formal atau tidak formal dengan majikan mereka, tetapi sesetengah ahli ekonomi percaya bahawa penurunan bahagian pekerja kesatuan sekerja ini adalah bukti penurunan kepentingan model perundingan kolektif untuk ekonomi A.S..

Senaman. Untuk wilayah rantau ini, data untuk 199X disediakan;
Nombor wilayah Purata gaji sara hidup per kapita setiap hari seorang yang berkemampuan, gosok., X Purata gaji harian, gosok., di
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173
Diperlukan:
1. Bina persamaan linear untuk regresi pasangan y daripada x.
2. Kira pekali korelasi pasangan linear dan ralat anggaran purata.
3. Menilai kepentingan statistik bagi parameter regresi dan korelasi.
4. Menjalankan ramalan upah y dengan nilai ramalan purata tahap sara hidup per kapita x, berjumlah 107% daripada tahap purata.
5. Menilai ketepatan ramalan dengan mengira ralat ramalan dan selang keyakinannya.

Penyelesaian cari menggunakan kalkulator.
Penggunaan kaedah grafik .
Kaedah ini digunakan untuk menggambarkan secara visual bentuk perkaitan antara yang dikaji penunjuk ekonomi. Untuk tujuan ini dalam sistem segi empat tepat koordinat, graf dibina, nilai individu bagi ciri terhasil Y diplot di sepanjang paksi ordinat, dan nilai individu bagi ciri faktor X diplot di sepanjang paksi absis.
Set titik ciri paduan dan faktor dipanggil medan korelasi.
Berdasarkan medan korelasi, kita boleh membuat hipotesis (untuk populasi) bahawa hubungan antara semua kemungkinan nilai X dan Y adalah linear.
Persamaan regresi linear ialah y = bx + a + ε
Di sini ε ialah ralat rawak (penyimpangan, gangguan).
Sebab kewujudan ralat rawak:
1. Kegagalan untuk memasukkan pembolehubah penjelasan yang signifikan dalam model regresi;
2. Pengagregatan pembolehubah. Sebagai contoh, jumlah fungsi penggunaan adalah percubaan ungkapan umum agregat keputusan perbelanjaan individu. Ini hanyalah anggaran perhubungan individu yang mempunyai parameter berbeza.
3. Penerangan yang salah tentang struktur model;
4. Spesifikasi fungsi yang salah;
5. Ralat pengukuran.
Oleh kerana sisihan ε i untuk setiap pemerhatian khusus i adalah rawak dan nilainya dalam sampel tidak diketahui, maka:
1) daripada pemerhatian x i dan y i hanya anggaran parameter α dan β boleh diperolehi
2) Anggaran parameter α dan β model regresi ialah nilai a dan b, masing-masing, yang bersifat rawak, kerana sepadan dengan sampel rawak;
Kemudian persamaan regresi anggaran (dibina daripada data sampel) akan mempunyai bentuk y = bx + a + ε, di mana e i ialah nilai yang diperhatikan (anggaran) ralat ε i , dan a dan b adalah, masing-masing, anggaran parameter α dan β model regresi yang perlu ditemui.
Untuk menganggar parameter α dan β - kaedah kuasa dua terkecil (kaedah kuasa dua terkecil) digunakan.
Sistem persamaan normal.
Untuk data kami, sistem persamaan mempunyai bentuk
Daripada persamaan pertama kita menyatakan a dan menggantikannya ke dalam persamaan kedua
Kami mendapat b = 0.92, a = 76.98
Persamaan regresi:
y = 0.92 x + 76.98

1. Parameter persamaan regresi.
Sampel bermakna.



Varian sampel:


Sisihan piawai


Pekali korelasi
Kami mengira penunjuk kedekatan sambungan. Penunjuk ini ialah pekali korelasi linear sampel, yang dikira dengan formula:

Pekali korelasi linear mengambil nilai dari -1 hingga +1.
Sambungan antara ciri boleh menjadi lemah dan kuat (dekat). Kriteria mereka dinilai mengikut skala Chaddock:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Dalam contoh kami, hubungan antara purata gaji harian dan purata gaji sara hidup per kapita adalah tinggi dan langsung.
1.2. Persamaan regresi(anggaran persamaan regresi).

Persamaan regresi linear ialah y = 0.92 x + 76.98
Pekali persamaan regresi linear boleh diberi makna ekonomi.
Pekali b = 0.92 menunjukkan perubahan purata dalam penunjuk berkesan (dalam unit ukuran y) dengan peningkatan atau penurunan nilai faktor x setiap unit ukurannya. DALAM dalam contoh ini dengan peningkatan 1 gosok. tahap sara hidup per kapita setiap hari, purata gaji harian meningkat sebanyak purata 0.92.
Koefisien a = 76.98 secara rasmi menunjukkan tahap ramalan purata gaji harian, tetapi hanya jika x=0 hampir dengan nilai sampel.
Dengan menggantikan nilai x yang sesuai ke dalam persamaan regresi, kita boleh menentukan nilai sejajar (diramalkan) penunjuk prestasi y(x) untuk setiap pemerhatian.
Hubungan antara purata gaji harian dan purata sara hidup per kapita minimum sehari ditentukan oleh tanda pekali regresi b (jika > 0 - hubungan langsung, sebaliknya - songsang). Dalam contoh kami, sambungan adalah langsung.
Pekali keanjalan.
Adalah tidak digalakkan untuk menggunakan pekali regresi (dalam contoh b) untuk menilai secara langsung pengaruh faktor pada ciri paduan jika terdapat perbezaan dalam unit pengukuran penunjuk paduan y dan ciri faktor x.
Untuk tujuan ini, pekali keanjalan dan pekali beta dikira. Pekali keanjalan didapati dengan formula:


Ia menunjukkan dengan berapa peratus secara purata atribut berkesan y berubah apabila atribut faktor x berubah sebanyak 1%. Ia tidak mengambil kira tahap turun naik faktor.
Pekali keanjalan adalah kurang daripada 1. Oleh itu, jika purata kos sara hidup per kapita sehari berubah sebanyak 1%, purata gaji harian akan berubah kurang daripada 1%. Dengan kata lain, pengaruh purata tahap sara hidup per kapita X terhadap purata gaji harian Y adalah tidak ketara.
Pekali beta menunjukkan dengan bahagian mana nilai sisihan piawainya nilai purata ciri yang terhasil akan berubah apabila ciri faktor berubah dengan nilai sisihan piawainya dengan nilai pembolehubah bebas yang tinggal tetap pada tahap malar:

Itu. peningkatan dalam x dengan sisihan piawai penunjuk ini akan membawa kepada peningkatan dalam purata gaji harian Y sebanyak 0.721 sisihan piawai penunjuk ini.
1.4. Ralat anggaran.
Marilah kita menilai kualiti persamaan regresi menggunakan ralat penghampiran mutlak.


Oleh kerana ralat kurang daripada 15%, persamaan ini boleh digunakan sebagai regresi.
Pekali penentuan.
Kuasa dua pekali korelasi (berbilang) dipanggil pekali penentuan, yang menunjukkan perkadaran variasi dalam atribut terhasil yang dijelaskan oleh variasi dalam atribut faktor.
Selalunya, apabila mentafsir pekali penentuan, ia dinyatakan sebagai peratusan.
R2 = 0.722 = 0.5199
mereka. dalam 51.99% kes, perubahan dalam purata tahap sara hidup per kapita x membawa kepada perubahan dalam purata gaji harian y. Dengan kata lain, ketepatan memilih persamaan regresi adalah purata. Baki 48.01% daripada perubahan dalam purata gaji harian Y dijelaskan oleh faktor-faktor yang tidak diambil kira dalam model.

x y x 2 y 2 x o y y(x) (y i -y cp) 2 (y-y(x)) 2 (x i -x cp) 2 |y - y x |:y
78 133 6084 17689 10374 148,77 517,56 248,7 57,51 0,1186
82 148 6724 21904 12136 152,45 60,06 19,82 12,84 0,0301
87 134 7569 17956 11658 157,05 473,06 531,48 2,01 0,172
79 154 6241 23716 12166 149,69 3,06 18,57 43,34 0,028
89 162 7921 26244 14418 158,89 39,06 9,64 11,67 0,0192
106 195 11236 38025 20670 174,54 1540,56 418,52 416,84 0,1049
67 139 4489 19321 9313 138,65 280,56 0,1258 345,34 0,0026
88 158 7744 24964 13904 157,97 5,06 0,0007 5,84 0,0002
73 152 5329 23104 11096 144,17 14,06 61,34 158,34 0,0515
87 162 7569 26244 14094 157,05 39,06 24,46 2,01 0,0305
76 159 5776 25281 12084 146,93 10,56 145,7 91,84 0,0759
115 173 13225 29929 19895 182,83 297,56 96,55 865,34 0,0568
1027 1869 89907 294377 161808 1869 3280,25 1574,92 2012,92 0,6902

2. Anggaran parameter persamaan regresi.
2.1. Kepentingan pekali korelasi.

Menggunakan jadual Pelajar dengan aras keertian α=0.05 dan darjah kebebasan k=10, kita dapati t crit:
t krit = (10;0.05) = 1.812
di mana m = 1 ialah bilangan pembolehubah penjelasan.
Jika t diperhatikan > t kritikal, maka nilai pekali korelasi yang terhasil dianggap signifikan (hipotesis nol yang menyatakan pekali korelasi sama dengan sifar ditolak).
Oleh kerana t obs > t kritik, kami menolak hipotesis bahawa pekali korelasi adalah sama dengan 0. Dalam erti kata lain, pekali korelasi adalah signifikan secara statistik.
Dalam regresi linear berpasangan t 2 r = t 2 b dan kemudian menguji hipotesis tentang kepentingan regresi dan pekali korelasi adalah setara dengan menguji hipotesis tentang keertian persamaan linear regresi.

2.3. Analisis ketepatan menentukan anggaran pekali regresi.
Anggaran yang tidak berat sebelah bagi penyebaran gangguan ialah nilai:


S 2 y = 157.4922 - varians yang tidak dapat dijelaskan (ukuran penyebaran pembolehubah bersandar di sekeliling garis regresi).

12.5496 - kesalahan biasa anggaran (ralat standard regresi).
S a - sisihan piawai pembolehubah rawak a.


S b - sisihan piawai pembolehubah rawak b.


2.4. Selang keyakinan untuk pembolehubah bersandar.
Ramalan ekonomi berdasarkan model yang dibina mengandaikan bahawa hubungan sedia ada antara pembolehubah dikekalkan untuk tempoh masa utama.
Untuk meramalkan pembolehubah bersandar bagi atribut terhasil, adalah perlu untuk mengetahui nilai ramalan semua faktor yang termasuk dalam model.
Nilai ramalan faktor digantikan ke dalam model dan anggaran titik ramalan penunjuk yang sedang dikaji diperolehi.
(a + bx p ± ε)
di mana

Mari kita mengira sempadan selang di mana 95% daripada kemungkinan nilai Y akan tertumpu untuk tanpa had. nombor besar pemerhatian dan X p = 94

(76.98 + 0.92*94 ± 7.8288)
(155.67;171.33)
Dengan kebarangkalian 95% adalah mungkin untuk menjamin bahawa nilai Y untuk bilangan cerapan yang tidak terhad tidak akan berada di luar had selang yang ditemui.
2.5. Menguji hipotesis mengenai pekali persamaan regresi linear.
1) statistik-t. Ujian t pelajar.
Mari kita semak hipotesis H 0 tentang kesamaan pekali regresi individu kepada sifar (jika alternatifnya tidak sama dengan H 1) pada aras keertian α=0.05.
t krit = (10;0.05) = 1.812


Sejak 3.2906 > 1.812, kepentingan statistik bagi pekali regresi b disahkan (kami menolak hipotesis bahawa pekali ini sama dengan sifar).


Sejak 3.1793 > 1.812, kepentingan statistik bagi pekali regresi a disahkan (kami menolak hipotesis bahawa pekali ini bersamaan dengan sifar).
Selang keyakinan untuk pekali persamaan regresi.
Mari kita tentukan selang keyakinan bagi pekali regresi, yang dengan kebolehpercayaan 95% adalah seperti berikut:
(b - t crit S b ; b + t crit S b)
(0.9204 - 1.812 0.2797; 0.9204 + 1.812 0.2797)
(0.4136;1.4273)

(a - t lang=SV>a)
(76.9765 - 1.812 24.2116; 76.9765 + 1.812 24.2116)
(33.1051;120.8478)
Dengan kebarangkalian 95% boleh dinyatakan bahawa nilai parameter ini akan terletak pada selang yang ditemui.
2) F-statistik. Kriteria Fisher.
Menguji kepentingan model regresi dijalankan menggunakan ujian Fisher's F, yang nilai pengiraannya didapati sebagai nisbah varians siri asal pemerhatian penunjuk yang sedang dikaji dan anggaran tidak berat sebelah bagi varians jujukan baki. untuk model ini.
Jika nilai yang dikira dengan darjah kebebasan k1=(m) dan k2=(n-m-1) adalah lebih besar daripada nilai jadual pada aras keertian tertentu, maka model tersebut dianggap signifikan.

di mana m ialah bilangan faktor dalam model.
Kepentingan statistik regresi linear berpasangan dinilai menggunakan algoritma berikut:
1. Hipotesis nol dikemukakan bahawa persamaan secara keseluruhan adalah tidak signifikan secara statistik: H 0: R 2 =0 pada aras keertian α.
2. Seterusnya tentukan nilai sebenar Ujian F:


di mana m=1 untuk regresi berpasangan.
3. Nilai jadual ditentukan daripada jadual taburan Fisher untuk tahap keertian tertentu, dengan mengambil kira bahawa bilangan darjah kebebasan untuk jumlah jumlah kuasa dua (varian yang lebih besar) ialah 1 dan bilangan darjah kebebasan untuk jumlah baki kuasa dua (varian yang lebih kecil). ) dalam regresi linear ialah n-2.
4. Jika nilai sebenar ujian-F kurang daripada nilai jadual, maka mereka mengatakan bahawa tidak ada sebab untuk menolak hipotesis nol.
Jika tidak, hipotesis nol ditolak dan hipotesis alternatif tentang kepentingan statistik persamaan secara keseluruhan diterima dengan kebarangkalian (1-α).
Nilai jadual bagi kriteria dengan darjah kebebasan k1=1 dan k2=10, Fkp = 4.96
Oleh kerana nilai sebenar F > Fkp, pekali penentuan adalah signifikan secara statistik (Anggaran persamaan regresi yang ditemui adalah boleh dipercayai secara statistik).

Kuliah 2. Analisis korelasi dan regresi. Regresi Berpasangan

1. Intipati analisis korelasi-regresi dan tugasnya.

2. Definisi regresi dan jenisnya.

3. Ciri-ciri spesifikasi model. Sebab kewujudan pembolehubah rawak.

4. Kaedah untuk memilih regresi berpasangan.

5. Kaedah kuasa dua terkecil.

6. Penunjuk untuk mengukur ketat dan kekuatan sambungan.

7. Anggaran kepentingan statistik.

8. Nilai ramalan pembolehubah y dan selang keyakinan ramalan.

1. Intipati analisis korelasi-regresi dan tugasnya. Fenomena ekonomi, yang sangat pelbagai, dicirikan oleh banyak ciri yang mencerminkan sifat tertentu proses dan fenomena ini dan tertakluk kepada perubahan yang saling bergantung. Dalam sesetengah kes, hubungan antara ciri-ciri ternyata sangat rapat (contohnya, keluaran setiap jam pekerja dan gajinya), manakala dalam kes lain hubungan sedemikian tidak dinyatakan sama sekali atau sangat lemah (contohnya, jantina pelajar dan prestasi akademik mereka). Semakin rapat hubungan antara ciri-ciri ini, semakin tepat keputusan yang dibuat.

Terdapat dua jenis kebergantungan antara fenomena dan ciri-cirinya:

    pergantungan fungsional (deterministik, kausal). . Ia dinyatakan dalam bentuk formula yang mengaitkan setiap nilai satu pembolehubah dengan nilai yang ditentukan dengan ketat bagi pembolehubah lain (pengaruh faktor rawak diabaikan). Dalam kata lain, pergantungan fungsi ialah hubungan di mana setiap nilai pembolehubah bebas x sepadan dengan nilai yang ditakrifkan dengan tepat bagi pembolehubah bersandar y. Dalam ekonomi, hubungan fungsi antara pembolehubah adalah pengecualian kepada peraturan umum;

    pergantungan statistik (stokastik, bukan deterministik). – ini adalah sambungan pembolehubah, yang dipengaruhi oleh faktor rawak, i.e. Ini adalah hubungan di mana setiap nilai pembolehubah bebas x sepadan dengan satu set nilai pembolehubah bersandar y, dan tidak diketahui terlebih dahulu nilai yang akan diambil oleh y.

Kes khas pergantungan statistik ialah pergantungan korelasi.

Pergantungan korelasi ialah hubungan di mana setiap nilai pembolehubah bebas x sepadan dengan jangkaan matematik tertentu (nilai purata) pembolehubah bersandar y.

Pergantungan korelasi adalah pergantungan "tidak lengkap", yang tidak muncul dalam setiap kes individu, tetapi hanya dalam nilai purata untuk bilangan kes yang cukup besar. Sebagai contoh, diketahui bahawa peningkatan kelayakan pekerja membawa kepada peningkatan produktiviti buruh. Kenyataan ini selalunya disahkan dalam amalan, tetapi tidak bermakna bahawa dua atau lebih pekerja dari kategori/tahap yang sama yang terlibat dalam proses yang serupa akan mempunyai produktiviti buruh yang sama.

Kebergantungan korelasi dikaji menggunakan kaedah analisis korelasi dan regresi.

Analisis korelasi dan regresi membolehkan anda mewujudkan keakraban, arah sambungan dan bentuk sambungan ini antara pembolehubah, i.e. ungkapan analitikalnya.

Tugas utama analisis korelasi terdiri daripada menentukan secara kuantitatif keakraban hubungan antara dua ciri dalam sambungan berpasangan dan antara ciri faktor berkesan dan beberapa dalam sambungan berbilang faktor dan menilai secara statistik kebolehpercayaan sambungan yang telah ditetapkan.

2. Definisi regresi dan jenisnya. Analisis regresi adalah alat matematik dan statistik utama dalam ekonometrik. Regresi Adalah menjadi kebiasaan untuk memanggil pergantungan nilai purata kuantiti (y) pada beberapa kuantiti lain atau pada beberapa kuantiti (x i).

Bergantung kepada bilangan faktor yang termasuk dalam persamaan regresi, adalah lazim untuk membezakan antara regresi mudah (berpasangan) dan berbilang.

Regresi mudah (berpasangan). ialah model di mana nilai purata pembolehubah bersandar (diterangkan) y dianggap sebagai fungsi satu pembolehubah bebas (penjelasan) x. Secara tersirat, regresi berpasangan ialah model bentuk:

Secara eksplisit:

,

di mana a dan b ialah anggaran pekali regresi.

Regresi berganda ialah model di mana nilai purata pembolehubah bersandar (diterangkan) y dianggap sebagai fungsi beberapa pembolehubah bebas (penerangan) x 1, x 2, ... x n. Secara tersirat, regresi berpasangan ialah model bentuk:

.

Secara eksplisit:

di mana a dan b 1, b 2, b n adalah anggaran pekali regresi.

Contoh model sedemikian ialah pergantungan gaji pekerja pada umur, pendidikan, kelayakan, tempoh perkhidmatan, industri, dll.

Mengenai bentuk pergantungan, terdapat:

      regresi linear;

      regresi tak linear, yang menganggap kewujudan hubungan tak linear antara faktor yang dinyatakan oleh fungsi tak linear yang sepadan. Selalunya tak linear dalam penampilan model boleh dikurangkan kepada bentuk linear, yang membolehkan mereka diklasifikasikan sebagai linear.

3. Ciri-ciri spesifikasi model. Sebab kewujudan pembolehubah rawak. Sebarang kajian ekonometrik bermula dengan spesifikasi model , iaitu daripada rumusan jenis model, berdasarkan teori hubungan antara pembolehubah yang sepadan.

Pertama sekali, daripada keseluruhan julat faktor yang mempengaruhi atribut berkesan, adalah perlu untuk mengenal pasti faktor yang mempengaruhi yang paling ketara. Regresi berpasangan adalah memadai jika terdapat faktor dominan, yang digunakan sebagai pembolehubah penjelasan. Persamaan regresi mudah mencirikan hubungan antara dua pembolehubah, yang menunjukkan dirinya sebagai corak tertentu hanya secara purata untuk keseluruhan pemerhatian. Dalam persamaan regresi, hubungan korelasi diwakili dalam bentuk pergantungan fungsi, dinyatakan oleh fungsi matematik yang sepadan. Dalam hampir setiap kes individu, nilai y terdiri daripada dua istilah:

,

dengan y ialah nilai sebenar bagi ciri yang terhasil;

– nilai teori bagi ciri paduan, didapati berdasarkan persamaan regresi;

nilai rawak, mencirikan sisihan nilai sebenar ciri yang terhasil daripada teori yang ditemui menggunakan persamaan regresi.

Nilai rawak disebut juga gangguan. Ia termasuk pengaruh faktor yang tidak diambil kira dalam model, ralat rawak dan ciri pengukuran. Kehadiran pembolehubah rawak dalam model dijana oleh tiga sumber:

    spesifikasi model,

    sifat terpilih bagi data sumber,

    ciri-ciri mengukur pembolehubah.

Ralat spesifikasi akan merangkumi bukan sahaja pilihan yang salah bagi fungsi matematik tertentu, tetapi juga meremehkan sebarang faktor penting dalam persamaan regresi (menggunakan regresi berpasangan dan bukannya berbilang).

Bersama-sama dengan ralat spesifikasi, ralat pensampelan mungkin berlaku, kerana penyelidik paling kerap berurusan dengan data sampel apabila mewujudkan corak hubungan antara ciri. Kesilapan pensampelan juga berlaku disebabkan oleh kepelbagaian data dalam populasi statistik asal, yang biasanya berlaku apabila mengkaji proses ekonomi. Jika populasi adalah heterogen, maka persamaan regresi tidak mempunyai makna praktikal. Untuk mendapatkan hasil yang baik, unit dengan nilai anomali ciri yang dikaji biasanya dikecualikan daripada populasi. Sekali lagi, keputusan regresi mewakili ciri sampel. Data sumber

Namun begitu bahaya paling besar dalam penggunaan praktikal kaedah regresi mewakili ralat pengukuran. Jika ralat spesifikasi boleh dikurangkan dengan menukar bentuk model (jenis formula matematik), dan ralat pensampelan boleh dikurangkan dengan meningkatkan jumlah data awal, maka ralat pengukuran secara praktikal membatalkan semua usaha untuk kuantifikasi perkaitan antara ciri.

4. Kaedah untuk memilih regresi berpasangan. Dengan mengandaikan bahawa ralat pengukuran diminimumkan, fokus penyelidikan ekonometrik adalah pada ralat spesifikasi model. Dalam regresi berpasangan, memilih jenis fungsi matematik
boleh dilakukan dengan tiga cara:

    grafik;

    analitikal, i.e. berdasarkan teori perhubungan yang dikaji;

    percubaan.

Apabila mengkaji hubungan antara dua ciri kaedah grafik memilih jenis persamaan regresi agak jelas. Ia berdasarkan medan korelasi. Jenis lengkung asas yang digunakan dalam mengukur hubungan




Kelas fungsi matematik untuk menerangkan hubungan antara dua pembolehubah adalah agak luas; jenis lengkung lain juga digunakan.

Kaedah analisis pilihan jenis persamaan regresi adalah berdasarkan kajian sifat material sambungan ciri-ciri yang dikaji, serta penilaian visual sifat sambungan. Itu. jika kita bercakap tentang keluk Laffer, menunjukkan hubungan antara progrestiviti cukai dan hasil belanjawan, maka kita bercakap tentang tentang lengkung parabola, dan dalam analisis mikro, isokuan ialah hiperbola.

5. Kaedah kuasa dua terkecil. Regresi linear digunakan secara meluas dalam ekonometrik kerana tafsiran ekonomi yang jelas bagi parameternya dan turun untuk mencari persamaan bentuk:

,

di mana x ialah pembolehubah penjelasan (bebas) – nilai bukan rawak;

y – kuantiti dijelaskan (bergantung);

– istilah rawak (ralat regresi);

 dan β ialah parameter persamaan.

Nilai teori mewakili garis regresi. Pembinaan regresi linear adalah untuk menganggar parameter a dan b persamaan
.

Anggaran parameter regresi linear boleh didapati dalam pelbagai cara.

Kaedah kuasa dua terkecil (LSM) – pendekatan klasik untuk menganggar parameter regresi linear.

Mari kita beralih ke medan korelasi.

Daripada graf anda boleh menentukan nilai parameter. Parameter a ialah titik persilangan garis regresi dengan paksi Oy, dan parameter b dianggarkan berdasarkan kecerunan garis regresi , dengan dy ialah kenaikan faktor y, dan dx ialah penambahan faktor x.

Kaedah kuasa dua terkecil membolehkan kita mendapatkan anggaran parameter a dan b sedemikian, yang mana jumlah sisihan kuasa dua bagi nilai sebenar ciri terhasil y daripada nilai yang dikira (teoretikal) minimum:

Itu. Garis regresi dipilih sedemikian rupa sehingga jumlah kuasa dua jarak menegak antara titik dan garis ini adalah minimum.

di mana
.

Mari kita hitung terbitan separa bagi setiap parameter a dan b.

Mari bahagikan kedua-dua belah persamaan dengan n dan dapatkan sistem persamaan dari mana kedua-dua parameter boleh dikira.

Daripada kaedah kuasa dua terkecil anda boleh mendapatkan dua formula lain untuk mencari parameter b:

1.

2.
atau

Parameter a dianggarkan dengan cara yang sama dalam semua kes:

.

Parameter b dipanggil pekali regresi dan menunjukkan berapa banyak unit secara purata pembolehubah y akan berubah apabila pembolehubah x meningkat sebanyak 1 unit. Tanda pekali regresi menunjukkan arah hubungan: pada b< 0 – связь обратная, при b >0 – sambungan langsung.

Parameter a secara rasmi mewakili nilai y pada x = 0. Jika x tidak atau tidak boleh mempunyai nilai sifar, maka a tidak masuk akal. Ia mungkin tidak masuk akal ekonomi. Apabila a<0 экономическая интерпретация может оказаться абсурдной.

Anda boleh mentafsir tanda untuk parameter a. Jika a>0, maka perubahan relatif dalam keputusan berlaku lebih perlahan daripada perubahan dalam faktor. Sekiranya<0, то изменение результата опережает изменение фактора.

6. Penunjuk untuk mengukur ketat dan kekuatan sambungan. Persamaan regresi sentiasa ditambah dengan penunjuk kedekatan sambungan.

Kualiti regresi berpasangan ditentukan menggunakan pekali korelasi linear berpasangan:

atau

,

di mana
,

– sisihan piawai, yang menunjukkan sebaran nilai dalam set nilai x dan y. Nilai sisihan piawai yang besar menunjukkan sebaran nilai yang besar dalam set yang dibentangkan dengan nilai purata set; nilai yang kecil, oleh itu, menunjukkan bahawa nilai dalam set dikumpulkan di sekitar nilai tengah.

Pekali korelasi linear adalah dalam:

1 < < 1.

Jika pekali korelasi adalah positif (Rajah a), maka hubungan antara ciri adalah langsung, i.e. dengan pertambahan (penurunan) dalam x, ciri y bertambah (berkurang). Jika pekali korelasi adalah negatif (Rajah b), maka hubungan antara ciri adalah songsang, i.e. dengan peningkatan (penurunan) dalam x, ciri y berkurang (bertambah).

Semakin dekat pekali korelasi kepada 1, semakin rapat hubungan (Rajah b), semakin hampir kepada 0, semakin lemah (Rajah a).

Jika 0< || <0,3, то связь между признаками практически отсутствует,

jika 0.3< || <0,5, то связь слабая,

jika 0.5< || <0,7, то связь умеренная,

jika 0.7< || <1, то связь сильная.

Dan akhirnya, pada r = 0 tiada korelasi linear. Dalam kes ini, garis regresi adalah selari dengan paksi Lembu.

Perlu diingatkan bahawa nilai pekali korelasi linear menilai keakraban hubungan antara ciri-ciri yang dipertimbangkan dalam bentuk linearnya. Oleh itu, kehampiran nilai mutlak pekali korelasi kepada sifar tidak bermakna tiada hubungan antara ciri-ciri. Dengan spesifikasi model yang berbeza, hubungan antara ciri mungkin menjadi agak rapat.

Untuk menilai kualiti pemasangan fungsi linear, kuasa dua pekali korelasi linear dikira R 2 , dipanggil pekali penentuan . Ia mencirikan bahagian varians ciri berkesan y, dijelaskan oleh regresi, dalam jumlah varians atribut berkesan.

Sehubungan itu, nilai 1 – R 2 mencirikan bahagian varians y yang disebabkan oleh pengaruh faktor lain yang tidak diambil kira dalam model.

Berdasarkan definisinya R 2 mengambil nilai antara 0 dan 1, i.e.

0 ≤ R 2 ≤ 1.

Jika R 2 = 0, maka ini bermakna regresi tidak memberikan apa-apa, iaitu x tidak meningkatkan kualiti ramalan y berbanding ramalan remeh
.

Satu lagi pilihan yang melampau R 2 = 1 bermaksud kesesuaian tepat model: semua titik cerapan terletak pada garis regresi (semua =0). Lebih dekat R 2 hingga 1, lebih baik kualiti kesesuaian model dan lebih tepat .

Walaupun parameter regresi b menunjukkan berapa banyak unit secara purata pembolehubah y akan berubah apabila pembolehubah x meningkat sebanyak 1 unit, ia tidak boleh digunakan untuk menilai secara langsung pengaruh ciri faktor ke atas yang terhasil disebabkan oleh perbezaan dalam unit pengukuran penunjuk yang dikaji. Untuk tujuan ini mereka gunakan pekali keanjalan . Pekali keanjalan menunjukkan dengan berapa peratus atribut berkesan y berubah apabila atribut faktor x berubah sebanyak 1%, dan dikira dengan formula:

,

di mana
– terbitan pertama, mencirikan nisbah peningkatan dalam hasil dan faktor untuk bentuk sambungan yang sepadan.

Disebabkan oleh fakta bahawa pekali keanjalan untuk fungsi linear bukanlah nilai tetap, tetapi bergantung pada nilai x yang sepadan, pekali keanjalan purata biasanya dikira:

.

Walaupun penggunaan pekali keanjalan secara meluas dalam ekonometrik, mungkin terdapat kes apabila pengiraannya tidak masuk akal ekonomi. Ini berlaku apabila bagi ciri-ciri yang dipertimbangkan adalah tidak bermakna untuk menentukan perubahan dalam nilai sebagai peratusan (contohnya, dengan berapa peratus akan hasil gandum berubah jika kualiti tanah bertambah baik sebanyak 1%).

Pekali keanjalan untuk beberapa fungsi matematik

7. Anggaran kepentingan statistik. Selepas persamaan regresi ditemui, kepentingan kedua-dua persamaan secara keseluruhan dan parameter individunya dinilai.

Menilai kepentingan persamaan secara keseluruhan. Penilaian kepentingan persamaan regresi secara keseluruhan diberikan menggunakan ujian Fisher's F dan berfungsi untuk menentukan bahawa nilai yang terhasil bagi pekali penentuan
ia bukan kebetulan, i.e. sama ada model matematik yang menyatakan hubungan antara pembolehubah sepadan dengan data eksperimen dan sama ada pembolehubah penjelasan yang termasuk dalam persamaan (satu atau lebih) mencukupi untuk menerangkan pembolehubah bersandar.

Dalam regresi linear berpasangan, menguji hipotesis tentang kepentingan regresi dan pekali korelasi adalah setara dengan menguji hipotesis tentang kepentingan persamaan regresi linear.

Untuk menguji kepentingan persamaan regresi secara keseluruhan, ujian F Fisher digunakan. Dalam kes regresi linear berpasangan, kepentingan model regresi diuji menggunakan formula berikut:

,

di mana m ialah bilangan ciri faktor penjelasan, i.e. X.

Nilai yang diperhatikan dibandingkan dengan nilai yang dijadualkan.

,

di mana α ialah aras keertian yang sepadan dengan selang keyakinan;

Jika, pada tahap keertian tertentu, F obs > F crit, maka model itu dianggap signifikan, hipotesis tentang sifat rawak ciri-ciri yang dianggarkan dinafikan dan kepentingan statistik dan kebolehpercayaannya diiktiraf.

Jika F obs.

Ralat piawai anggaran persamaan regresi. Walaupun OLS memberi kita garis regresi yang memberikan variasi minimum, tidak semua pemerhatian sepadan dengan garis regresi. Oleh itu, ukuran statistik variasi nilai sebenar y daripada nilai ramalan diperlukan . Ukuran variasi relatif kepada garis regresi dipanggil ralat piawai anggaran .

Ralat piawai anggaran ditakrifkan sebagai:

,

di mana y ialah nilai sebenar pembolehubah bersandar untuk nilai pembolehubah bebas yang diberi;

– nilai teori/ramalan pembolehubah bersandar untuk nilai tertentu pembolehubah bebas;

m – bilangan pembolehubah penjelasan x.

Pekali ini mencirikan ukuran variasi dalam data sebenar di sekitar garis regresi.

Menyemak kepentingan parameter. Di samping itu, kepentingan parameter regresi diperiksa. Pengujian kepentingan parameter pekali regresi individu dijalankan menggunakan ujian-t Pelajar dengan menguji hipotesis bahawa setiap pekali regresi adalah sama dengan sifar. Pada masa yang sama, mereka mengetahui sama ada nilai parameter yang diperoleh adalah hasil daripada tindakan pembolehubah rawak.

Kepentingan pekali regresi disemak menggunakan formula berikut. Untuk pekali b:

,

di mana S b ialah ralat piawai bagi pekali b, yang seterusnya ditakrifkan sebagai:

.

Untuk pekali yang serupa:

,

di mana S a ialah ralat piawai bagi istilah bebas a, juga ditemui oleh formula:

.

Nilai pengiraan ujian-t dibandingkan dengan nilai kriteria yang dijadualkan , dengan k = n–m–1 darjah kebebasan dan aras keertian yang sepadan α.

Jika nilai pengiraan ujian-t melebihi nilai jadualnya, maka parameter itu dianggap penting, i.e. tidak dijumpai secara kebetulan.

8. Nilai ramalan pembolehubah y dan selang keyakinan ramalan. Ramalan titik terdiri daripada mendapatkan nilai ramalan Y*, yang ditentukan dengan menggantikan ke dalam persamaan regresi
nilai ramalan yang sepadan X*:

.

Kebarangkalian ramalan titik direalisasikan secara praktikalnya sifar, jadi selang keyakinan ramalan dikira dengan kebolehpercayaan yang lebih besar.

Ramalan selang terdiri daripada membina selang keyakinan untuk ramalan, i.e. bawah dan atas – sempadan minimum dan maksimum yang mungkin bagi selang yang mengandungi nilai tepat untuk nilai ramalan Y* dengan kebarangkalian tertentu, iaitu:

У min

Selang keyakinan ramalan ditentukan menggunakan formula berikut:

di mana
– ralat piawai ramalan untuk regresi berpasangan.

Selang keyakinan untuk pekali regresi ditakrifkan sebagai:

Oleh kerana pekali regresi dalam kajian ekonometrik mempunyai tafsiran ekonomi yang jelas, had keyakinan selang untuk pekali regresi tidak seharusnya mengandungi keputusan yang bercanggah, contohnya, -10b40 - entri jenis ini menunjukkan bahawa nilai sebenar bagi pekali regresi secara serentak mengandungi nilai positif dan negatif dan juga sifar, yang tidak boleh. Kemudian parameter diambil sama dengan sifar.

Dibina berdasarkan persamaan regresi, ia bermula dengan menguji kepentingan setiap pekali regresi menggunakan ujian-T Pelajar

Ia boleh ditunjukkan bahawa untuk model linear berpasangan, kedua-dua kaedah menguji kepentingan menggunakan F- dan /-kriteria adalah setara, kerana kriteria ini dikaitkan dengan hubungan F = /2.

Sekiranya prasyarat asas OLS tidak dipenuhi, adalah perlu untuk menyesuaikan model, mengubah spesifikasinya, menambah (tidak termasuk) beberapa faktor, mengubah data asal untuk mendapatkan anggaran pekali regresi yang mempunyai sifat tidak berat sebelah, mempunyai nilai serakan sisa yang lebih rendah dan oleh itu menyediakan ujian statistik yang lebih berkesan tentang kepentingan parameter regresi. Matlamat ini, seperti yang telah dinyatakan, juga dilaksanakan dengan menggunakan kaedah kuasa dua terkecil umum, yang kita teruskan dalam Bahagian 3.11.

Kaedah yang dicadangkan untuk pemodelan maklumat rantai dan operasi teknologi, yang dilaksanakan dalam teknik yang sepadan, tidak berbeza dalam bentuk daripada analisis korelasi dan regresi. Pengiraan dan justifikasi model diteruskan mengikut skema klasik penyelesaian sistem persamaan, menilai kepentingan pekali, dan menyemak identiti model. Tugas biasa ialah tugas yang boleh diselesaikan menggunakan model: menilai hubungan antara parameter TP, mengenal pasti parameter yang mempunyai normativiti atau pengaruh terbesar pada parameter lain, dan keupayaan untuk mengira toleransi antara operasi. Walau bagaimanapun, dari sudut pengurusan proses teknologi, model maklumat adalah lebih mudah, lebih ringkas dan, oleh itu, lebih diterima untuk tujuan pengurusan.

Kita perlu memutuskan sama ada ujian keertian akan "sebelah" atau "dua belah". Keputusan ini mesti dibuat sebelum keputusan pengakuan diketahui. Pilihan ditentukan oleh justifikasi teori model sambungan antara X dan Y, diuji menggunakan agama.

Menguji kepentingan L2 terlaras juga menguji kepentingan hubungan antara pembolehubah bersandar Y dan mana-mana pembolehubah bebas X,-. Sesungguhnya, jika model regresi mempunyai tahap penjelasan yang tinggi untuk pembentukan hubungan, perubahan dalam pembolehubah bersandar adalah disebabkan oleh perubahan dalam pembolehubah tidak bersandar, dan jumlah sisihan kuasa dua yang dijelaskan oleh regresi (RSD) akan menjadi secara relatif. lebih besar daripada jumlah sisa sisihan kuasa dua (RMSD). Jika model mempunyai tahap penjelasan yang rendah, perubahan dalam pembolehubah bersandar berlaku disebabkan oleh perubahan dalam nilai ralat, dan MSE akan lebih besar daripada TMS.

Untuk menyemak kepentingan (kesesuaian) persamaan regresi yang terhasil, teknik khas digunakan. Semakan ini dipanggil menyemak kecukupan model.

Terangkan sifat dan kaedah analisis regresi bivariat dan huraikan model, prosedur anggaran parameter, normalisasi pekali regresi, ujian keertian, prosedur untuk menentukan ketepatan ramalan, analisis baki, dan pengesahan silang model.

Hai) Dalam usaha untuk mengatasi kelemahan yang diterangkan dalam perkara (i) dan (ia) sedikit sebanyak, kita boleh membangunkan model ramalan daripada set terpotong data sejarah yang tersedia. Sebagai contoh, jika kita mempunyai angka jualan untuk tempoh 1990 hingga 1997, kita boleh membangunkan model berdasarkan nilai hanya untuk 1990 hingga 1996. Penunjuk yang selebihnya, iaitu penunjuk untuk tahun 1997, boleh digunakan untuk perbandingan dengan penunjuk ramalan yang diperoleh menggunakan model ini. Ujian jenis ini lebih realistik, kerana ia sebenarnya mensimulasikan situasi ramalan. Kelemahan kaedah ini ialah penunjuk yang paling terkini, dan oleh itu yang paling penting, dikecualikan daripada proses membentuk model awal.

Senarai ini boleh diteruskan; kami hanya memetik beberapa faktor yang mungkin. Selepas menganalisis dan menyemak kepentingan semua faktor, faktor yang paling penting dipilih, yang harus dimasukkan dalam model ekonomi dan matematik korelasi berbilang faktor untuk menentukan keperluan untuk kenderaan elektrik tanpa jejak yang dipasang di lantai. Penggunaan kaedah pengiraan ini nampaknya paling sesuai dalam kes ini. Apabila membuat ramalan jangka panjang, seseorang juga harus mengambil kira faktor kemajuan saintifik dan teknologi, metodologi untuk menentukan dan perakaunan yang diterangkan secara meluas dalam.

Menguji hipotesis menghasilkan sejumlah besar keputusan yang menarik dan bercanggah, yang sering menunjukkan kehadiran perhubungan yang bertentangan dengan yang diramalkan. Model regresi menunjukkan semua hubungan yang telah terbukti agak signifikan berhubung dengan pembolehubah bersandar utama, iaitu. menggunakan kaedah pemindahan teknologi aktif.

Keputusan paling penting yang mesti dibuat oleh penganalisis ialah pilihan set pembolehubah untuk menerangkan proses yang dimodelkan. Untuk membayangkan kemungkinan hubungan antara pembolehubah yang berbeza, anda perlu mempunyai pemahaman yang baik tentang intipati masalah. Dalam hal ini, sangat berguna untuk berbincang dengan pakar yang berpengalaman dalam bidang subjek ini. Mengenai pembolehubah yang anda pilih, anda perlu memahami sama ada pembolehubah itu penting dalam diri mereka sendiri, atau sama ada ia hanya mencerminkan pembolehubah lain yang benar-benar penting. Pengujian untuk kepentingan melibatkan analisis korelasi silang. Dengan bantuannya, anda boleh, sebagai contoh, mengenal pasti sambungan sementara seperti kelewatan (lag) antara dua siri. Sejauh mana fenomena boleh diterangkan oleh model linear diuji menggunakan regresi kuasa dua terkecil biasa (OLS). Sisa R yang diperoleh selepas pengoptimuman boleh mengambil nilai daripada 0 (ketakpadanan lengkap) kepada 1 (padanan tepat). Selalunya berlaku bahawa untuk sistem linear kaedah OLS memberikan hasil berikut:

Secara umum, kita boleh mengatakan bahawa prapemprosesan melalui pembentukan satu set pembolehubah dan menguji kepentingannya dengan ketara meningkatkan kualiti model. Jika tiada kaedah ujian teori tersedia, pembolehubah boleh dipilih melalui percubaan dan kesilapan, atau menggunakan kaedah formal seperti algoritma genetik.

Satu lagi teknik yang terkenal ialah memotong sambungan dalam graf yang terlalu bersambung untuk mengkaji kelakuan sistem dan elemennya di bawah keadaan baharu. Kestabilan sistem mungkin bermakna hipotesis adalah betul. Keputusan untuk memusnahkan hubungan tertentu model boleh dibuat sama ada berdasarkan kriteria kepentingan statistik, atau berdasarkan kriteria ambang yang ditetapkan secara sewenang-wenangnya untuk magnitud pekali pengaruh kausal. Ketepatan hipotesis dan ketepatan model hendaklah disahkan melalui pengesahannya apabila diuji pada data kawalan.

Seperti Rajah. 6.3, dalam kes model probabilistik, mengira pekali regresi menggunakan ungkapan (6.7) dan (6.8) memberikan satu anggaran nilai Y, iaitu. E(Yt). Anggaran pekali regresi juga diandaikan sebagai taburan normal. Kita perlu mengetahui kepentingan statistik bagi pekali ini. Masalah ini diselesaikan dengan menyemak bahawa pekali regresi adalah berbeza dengan ketara daripada sifar.

Daripada analisis Kaldor dalam artikelnya A Model of Economic Growth, nampaknya jelas bahawa dia (untuk anggaran pertama) menganggap sw dan Sp sebagai pemalar dalam jangka masa yang panjang. Sudah tentu, ada kemungkinan bahawa teori Kaldor boleh menjadi signifikan secara empirikal walaupun apabila sp dan s kerap berubah. Dalam kes ini, pengujian teori akan terdiri daripada memerhatikan dinamik kovarians sp/sw dan I/Y. Walau bagaimanapun, kami tidak mempunyai cerapan sp dan sw pada titik masa yang berbeza, dan oleh itu, jika teori itu diuji pada siri masa, sw dan sp mesti diandaikan sebagai malar. Sudah tentu, mungkin juga apabila data yang sesuai tersedia, teori ini mungkin berguna dalam menerangkan perubahan antarabangsa atau antara wilayah dalam bahagian relatif, bebas daripada variasi temporal dalam sp dan s.

Hasil daripada perkara di atas, semua kesimpulan yang dibuat daripada statistik t- dan F yang sepadan, serta anggaran selang, akan menjadi tidak boleh dipercayai. Akibatnya, kesimpulan statistik yang diperoleh daripada semakan kualiti standard anggaran mungkin tersilap dan membawa kepada kesimpulan yang salah tentang model yang dibina. Kemungkinan ralat piawai pekali akan dipandang rendah dan oleh itu statistik-t akan dinaikkan. Ini boleh menyebabkan pekali dianggap signifikan secara statistik apabila ia tidak signifikan.

Secara umum, bercakap tentang membahagikan selang masa kepada bahagian, kami perhatikan bahawa ia adalah perlu dalam kes di mana nilai parameter berubah dari semasa ke semasa (yang melanggar premis model regresi linear mengenai invarian mereka). Jika mereka berubah lebih kurang secara tiba-tiba, maka dengan membahagikan selang masa dengan momen "lompatan" sedemikian, adalah mungkin untuk membahagikannya kepada beberapa selang, di mana setiap satu prasyarat model telah dipenuhi. Untuk menyemak kepentingan statistik perbezaan dalam pekali

Selalunya, hipotesis penumpuan model pertumbuhan neoklasik diuji pada contoh wilayah satu negara. Walaupun mungkin terdapat perbezaan antara wilayah dari segi pembangunan teknologi, keutamaan, dsb., perbezaan ini akan menjadi kurang ketara berbanding perbezaan antara negara. Oleh itu, kemungkinan penumpuan mutlak antara wilayah adalah jauh lebih tinggi daripada antara negara. Pada masa yang sama, apabila menggunakan kawasan untuk menguji hipotesis penumpuan mutlak, prasyarat penting model pertumbuhan neoklasik dilanggar—ekonomi tertutup. Jelas sekali bahawa halangan budaya, linguistik, institusi dan formal terhadap pergerakan faktor ternyata kurang ketara bagi sekumpulan wilayah dalam satu negara. Walau bagaimanapun, ia ditunjukkan bahawa walaupun dalam kes mobiliti faktor dan, dengan itu, pelanggaran andaian model asal, sifat dinamik ekonomi tertutup dan ekonomi dengan bebas

Pekali anggaran adalah signifikan secara statistik, pekali penentuan adalah tinggi, dan ujian kecukupan tidak mendedahkan pelanggaran andaian standard model regresi linear klasik.

Perlu diingatkan bahawa istilah pembolehubah tiruan tidak berjaya diterjemahkan sepenuhnya ke dalam bahasa Rusia sebagai pembolehubah tiruan. Pertama, dalam model analisis regresi kita sudah mempunyai pembolehubah palsu X dengan pekali Po> sentiasa sama dengan satu. Kedua, dan ini adalah perkara utama - semua prosedur analisis regresi (menganggarkan parameter model regresi, menyemak kepentingan pekalinya, dll.) Dilakukan apabila pembolehubah tiruan dimasukkan dengan cara yang sama seperti pembolehubah penjelasan kuantitatif biasa . Kepalsuan pembolehubah 2/ hanya terletak pada fakta bahawa ia secara kuantitatif menggambarkan ciri kualitatif.

Di samping menyemak kepentingan keseluruhan model, adalah perlu untuk menguji kepentingan pekali regresi menggunakan ujian Pelajar /-. Nilai minimum pekali regresi bg mesti sepadan dengan keadaan bifob-t, di mana bi ialah nilai pekali persamaan regresi pada skala semula jadi untuk ciri faktor ke-i ab. - min ralat kuasa dua bagi setiap pekali.

Mari kita kembali kepada kes umum (bukan Gaussian). Amalan analisis statistik multivariate telah menunjukkan bahawa pekali korelasi separa, yang ditakrifkan oleh hubungan (1.22) - (1.23), adalah, sebagai peraturan, ukuran yang memuaskan bagi hubungan linear yang dimurnikan antara x(1) dan untuk nilai tetap yang lain. pembolehubah dan dalam kes apabila taburan penunjuk yang dianalisis ((0), x(l . .., x(p>) berbeza daripada biasa. Menggunakan formula (1.22), pekali korelasi separa ditentukan dalam kes mana-mana taburan awal ciri (x(0 x(1 . .., x(p)), kami akan memasukkannya ke dalam alat matematik umum untuk analisis korelasi model linear... Pada masa yang sama, ia boleh ditafsirkan sebagai penunjuk daripada kedekatan sambungan yang telah dimurnikan, dipuratakan ke atas semua kemungkinan nilai pembolehubah mengganggu yang ditetapkan pada tahap tertentu. 1.2.3. Sifat statistik bagi pekali korelasi separa sampel (semak untuk kepentingan statistik perbezaannya daripada sifar, selang keyakinan). Apabila mengkaji sifat statistik bagi pekali korelasi separa sampel bagi susunan k (iaitu. e. apabila mengecualikan pengaruh tidak langsung k pembolehubah yang mengganggu), seseorang harus mengambil kesempatan daripada fakta (lihat, sebagai contoh, ) bahawa ia diedarkan dengan cara yang sama seperti pekali korelasi sampel biasa (berpasangan) antara pembolehubah yang sama dengan pembetulan tunggal, saiz sampel hendaklah dikurangkan dengan k unit, iaitu, andaikan ia sama dengan n -, dan bukan i. sebab tu

Untuk probit- atau ujian hipotesis tentang kehadiran sekatan ke atas pekali, khususnya, hipotesis tentang kepentingan satu atau sekumpulan pekali, boleh dijalankan menggunakan mana-mana tiga ujian - Wald, nisbah kemungkinan, pengganda Lagrange, dibincangkan dalam Bab 10 (bahagian 10.6) . Kebanyakan pakej ekonometrik yang melaksanakan probit- atau /o

Mari kita mulakan eksperimen dengan mengandaikan bahawa model yang mengandungi hanya k kesan utama adalah memadai, atau, dalam terminologi analisis regresi, kita mempunyai model tertib pertama. Jika kita mengambil pelan resolusi tepu III, maka kita boleh menyesuaikan model dengan tepat, tetapi kita tidak boleh menyemak kecukupannya. Walau bagaimanapun, jika (k + 1) bukan gandaan empat, pelan resolusi III tidak akan tepu, atau, jika (k + 1) masih gandaan empat, pelan resolusi IV boleh diambil. Dalam kedua-dua kes, kami akan dapat menganggarkan beberapa (campuran) interaksi pertama. Seterusnya, jika satu atau lebih titik percubaan diduakan, kami akan menganggarkan α2 secara bebas dan dapat menguji kepentingan interaksi berpasangan kami. Biarkan beberapa interaksi menjadi penting dan yang lain tidak. Maka mungkin masuk akal untuk mengambil model dengan semua interaksi. Walaupun sesetengah interaksi tidak signifikan, anggaran OLS tidak berat sebelah varians minimumnya bukanlah sifar (walaupun kecil). Jadi, jika semua faktor adalah kuantitatif, kita boleh mengambil polinomial tertib kedua (dengan semua interaksi berpasangan ditambah kuasa dua sempurna) dan bukannya model tertib pertama. Bandingkan juga dengan perbincangan dalam dan dalam, yang membincangkan amalan menyemak parameter individu. Jadi, daripada menguji kesan secara berasingan, kita boleh mengambil jumlah (gabungan) kuasa dua dan membandingkan purata kuasa duanya dengan anggaran bebas cr2.20

Jika kita menolak hipotesis tentang ketepatan model kita, kita biasanya beralih kepada model tertib lebih tinggi 21. Ini membawa kepada perancangan berjujukan. Kita boleh mulakan dengan reka bentuk bilangan eksperimen yang sangat kecil. Kami kemudian akan melihat bahawa reka bentuk resolusi III sesuai untuk mengkaji faktor k dalam sejumlah N = k + 1 eksperimen jika N ialah gandaan empat, jika tidak, kami mengambil reka bentuk seterusnya dengan Nlt gandaan empat. Jika AG bukan gandaan empat atau jika terdapat beberapa eksperimen tambahan, maka kita boleh menyemak sama ada model tertib pertama adalah mencukupi. Untuk melakukan ini, kita boleh mengira beberapa jumlah kuasa dua interaksi atau jumlah baki kuasa dua. Jika kita mempunyai anggaran bebas a2 (daripada eksperimen selari atau awal ) kita boleh menggunakan kriteria /"". Dan jika interaksi ternyata ketara, maka kita boleh beralih ke pelan resolusi IV. f Mujurlah, kita melihat bahawa tidak sukar untuk membina pelan resolusi IV daripada pelan resolusi III. Kita hanya perlu mengulang resolusi pelan III dengan tanda-tanda yang bertentangan, iaitu, sebagai tambahan kepada eksperimen Nr reka bentuk 22 resolusi III, yang telah kita jalankan, kita ambil Eksperimen NI. Mengikut definisi, reka bentuk resolusi IV memberikan anggaran kesan utama yang tidak dikelirukan dengan interaksi berpasangan. Oleh itu, daripada pelan resolusi IV kita boleh membuat kesimpulan dengan pasti sama ada sebarang faktor mempunyai kesan utama (dengan syarat tiada interaksi tiga atau lebih faktor, keadaan ini boleh diuji dalam ujian kecukupan di bawah reka bentuk resolusi IV). Jika kita mengandaikan bahawa faktor-faktor yang tidak mempunyai kesan utama juga tidak mempunyai interaksi, maka sangat mungkin, berdasarkan reka bentuk resolusi IV, kita akan mengecualikan beberapa faktor. Mempunyai faktor yang lebih sedikit bermakna bilangan eksperimen yang diperlukan untuk eksperimen itu berkurangan (rujuk Jadual 8). Faktor selebihnya boleh diperiksa dari segi resolusi V.

Ingat (lihat Bahagian 1.4. Bab 1) bahawa memandangkan model logit ialah model tak linear, pekali anggaran mempunyai tafsiran yang berbeza daripada tafsiran pekali dalam model linear. Dalam hal ini, dalam lajur ketiga jadual. Jadual 1 menunjukkan nilai kesan marginal untuk pembolehubah dengan anggaran pekali bererti statistik, dikira dengan nilai purata pembolehubah penjelasan untuk tempoh yang dipertimbangkan. Oleh itu, nilai 0.060 daripada kesan marginal untuk akhir tempoh pembolehubah dummy bermakna bahawa jika lelongan diadakan pada akhir tempoh antara semakan pematuhan dengan keperluan rizab, maka (memegang pembolehubah penjelasan lain tidak berubah) kemungkinan terhadap bank mengambil bahagian dalam lelongan risiko bahawa bank tidak akan mengambil bahagian dalam lelongan meningkat kira-kira 6% secara purata.

Menguji kepentingan model menggunakan ujian nisbah kemungkinan (ujian Wald) bermula dengan mengemukakan hipotesis utama:

Untuk menguji hipotesis ini, statistik sampel dikira

Di sini lnL ialah nilai nilai maksimum logaritma fungsi kemungkinan, dan lnL0 ialah nilai logaritma fungsi kemungkinan jika hipotesis utama adalah benar.

Jika hipotesis utama adalah benar, maka statistik sampel (4.7.1) diedarkan mengikut undang-undang 2 dengan (m-1) darjah kebebasan. Sempadan kawasan genting sebelah kanan K2 dicari menggunakan jadual titik genting khi kuasa dua mengikut aras keertian (1-b) dan (m-1) darjah kebebasan. Jika ketidaksamaan berlaku:

maka hipotesis utama ditolak, hipotesis alternatif diterima dan kita katakan, bahawa model itu adalah signifikan secara statistik. Jika tidak, mereka menerima hipotesis bahawa model itu tidak penting dan meneruskan untuk menyemaknya.

Untuk model pilihan binari, kepentingan faktor disemak dengan menguji setiap faktor хi, i=1,…, (m-1) hipotesis bentuk:

Statistik sampel yang digunakan untuk menguji hipotesis ini mempunyai taburan normal tanpa gejala dan dipanggil statistik-z. Sempadan kawasan kritikal dua belah dicari menggunakan jadual Laplace pada aras keertian tertentu (1-b).

Jika ketidaksamaan berlaku:

K 1

maka mereka menerima hipotesis utama tentang perbezaan tidak ketara daripada sifar pekali i dan membuat kesimpulan bahawa faktor sepadan adalah tidak signifikan untuk model.

Bagi model pilihan binari, konsep pekali penentuan tidak ditakrifkan. Walau bagaimanapun, apa yang dipanggil pekali penentuan pseudo ditentukan untuk mereka, yang tidak lagi mencirikan kuasa penjelasan model

Definisi 4.7.1. Pekali pseudo penentuan ialah nilai berikut:

Definisi 4.7.2. Indeks nisbah kemungkinan McFadden ialah ciri:

Perlu ditekankan bahawa jika parameter model pilihan binari tidak berbeza dengan ketara daripada sifar, maka kedua-dua pekali yang diperkenalkan adalah sama dengan sifar.

Dalam kuliah, kami melihat model regresi tak linear, khususnya, model untuk pembolehubah bersandar binari. Kami memeriksa model ini untuk dua fungsi regresi: logit (kami menggunakan fungsi logistik) dan probit (kami menggunakan fungsi taburan undang-undang taburan normal piawai). Anggaran parameter untuk fungsi regresi tersebut diperoleh menggunakan kaedah kemungkinan maksimum. Model ini diuji menggunakan ujian Wald, iaitu berdasarkan statistik yang mempunyai taburan khi kuasa dua. Apabila mengkaji model regresi multivariate, kami mentafsirkan anggaran parameter dalam j sebagai kesan marginal pembolehubah bebas pada y. Mari kembali kepada model pilihan binari. Jika kita cuba mencari terbitan P(Y=1|X), kita akan sampai pada ungkapan berikut:

di mana Z= 0+1x1+...m-1xm-1.

Dengan teorem pada terbitan fungsi kompleks, dan daripada sifat ketumpatan (terbitan fungsi taburan ialah ketumpatan taburan f(Z)), kita perolehi:

atau, menggunakan tatatanda kedua untuk anggaran parameter:

P(Y=1|X)=вjf(Z)

Seperti sebelum ini, bj menandakan anggaran parameter yang tidak diketahui.

Kemudian, kita boleh menaakul seperti berikut: ketumpatan taburan sentiasa bukan negatif, oleh itu tanda terbitan

hanya bergantung pada tanda anggaran parameter, tetapi akan menjadi fungsi semua pembolehubah bebas. Selain itu, jika anggaran parameter adalah positif, maka peningkatan dalam pembolehubah xj akan membawa kepada peningkatan dalam kebarangkalian

dan jika anggaran parameter adalah negatif, maka, dengan itu, kebarangkalian yang ditunjukkan akan berkurangan.

Komen. Jika faktor x ialah pembolehubah binari, maka konsep kesan marginal tidak boleh diperkenalkan untuknya.

Bagi setiap pembolehubah x (kuantitatif!!!), apa yang dipanggil kesan marginal purata diperkenalkan. Untuk melakukan ini, kirakan sampel min untuk pembolehubah kuantitatif dan peratusan "1" untuk perduaan, dan gantikannya ke dalam ungkapan untuk ketumpatan taburan dan bukannya pembolehubah.

Satu lagi soalan untuk perbincangan: bagaimana untuk meramalkan nilai y selepas menganggarkan parameter model logit (probit)? Sebagai contoh, teruskan seperti berikut. Gantikan nilai anggaran parameter dan nilai xj yang ditemui kepada Z dan hitung nilai pembolehubah. Jika Z>0, maka pertimbangkan bahawa Y=1, jika Z<0, то считают, что У=0. Замечание. Мы рассмотрели ситуацию, когда переменная у была измерена в номинальной шкале, но принимала всего два значения: 0 и 1. В общем случае, когда у может принимать несколько значений, например 0, 1, 2, 3, используют множественный (по у!!) логит или пробит. Кроме того, у может быть измерен в порядковой шкале, тогда в Стате используют порядковый логит (пробит) ologit (oprobit).

Komen. Selalunya dalam penyelidikan adalah perlu untuk menjalankan kajian ke atas sampel yang dipotong. Sebagai contoh, jika pendapatan isi rumah dikaji, terdapat situasi apabila responden yang berpendapatan sangat tinggi (contohnya, lebih daripada 1 juta rubel) harus dikecualikan daripada kajian, iaitu

Dalam kes sedemikian, model Tobit digunakan.

F(0+1x1+...m-1xm-1)

F(0+1x1+...m-1xm-1)

F(0+1x1+...m-1xm-1)

F(0+1x1+...m-1xm-1) - (F(0+1x1+...m-1xm-1))2