Jednostavna linearna regresija u excel primjerima. Brza linearna regresija u Excelu: linija trenda

Regresijska i korelacijska analiza – statističke metode istraživanje. Ovo su najčešći načini za prikaz ovisnosti parametra o jednoj ili više neovisnih varijabli.

U nastavku o određenim praktični primjeri Pogledajmo ove dvije među ekonomistima vrlo popularne analize. Također ćemo dati primjer dobivanja rezultata njihovim kombiniranjem.

Regresijska analiza u Excelu

Prikazuje utjecaj nekih vrijednosti (nezavisnih, neovisnih) na zavisnu varijablu. Na primjer, kako broj ekonomski aktivnog stanovništva ovisi o broju poduzeća, plaćama i drugim parametrima. Ili: kako strana ulaganja, cijene energenata i sl. utječu na razinu BDP-a.

Rezultat analize omogućuje vam da istaknete prioritete. I na temelju glavnih čimbenika predvidjeti i planirati razvoj prioritetna područja, donosi upravljačke odluke.

Regresija se događa:

  • linearno (y = a + bx);
  • parabolični (y = a + bx + cx 2);
  • eksponencijalni (y = a * exp(bx));
  • snaga (y = a*x^b);
  • hiperbolički (y = b/x + a);
  • logaritamski (y = b * 1n(x) + a);
  • eksponencijalni (y = a * b^x).

Pogledajmo primjer izrade regresijskog modela u Excelu i tumačenje rezultata. Uzmimo linearni tip regresije.

Zadatak. U 6 poduzeća analizirana je prosječna mjesečna plaća i broj zaposlenika koji odustaju. Potrebno je utvrditi ovisnost broja zaposlenika koji odustaju od prosječne plaće.

Model linearne regresije izgleda ovako:

Y = a 0 + a 1 x 1 +…+a k x k.

Gdje su a regresijski koeficijenti, x su utjecajne varijable, k je broj faktora.

U našem primjeru Y je pokazatelj odustajanja zaposlenika. Faktor utjecaja je plaća (x).

Excel ima ugrađene funkcije koje vam mogu pomoći u izračunavanju parametara modela linearne regresije. Ali dodatak "Analysis Package" to će učiniti brže.

Aktiviramo moćan analitički alat:

Nakon aktivacije, dodatak će biti dostupan na kartici Podaci.

Sada napravimo samu regresijsku analizu.



Prije svega, obraćamo pažnju na R-kvadrat i koeficijente.

R-kvadrat je koeficijent determinacije. U našem primjeru – 0,755, odnosno 75,5%. To znači da izračunati parametri modela objašnjavaju 75,5% odnosa između proučavanih parametara. Što je veći koeficijent determinacije, to kvalitetniji model. Dobro - iznad 0,8. Loše – manje od 0,5 (takva se analiza teško može smatrati razumnom). U našem primjeru - "nije loše".

Koeficijent 64,1428 pokazuje koliki će biti Y ako su sve varijable u modelu koji se razmatra jednake 0. To jest, na vrijednost analiziranog parametra utječu i drugi faktori koji nisu opisani u modelu.

Koeficijent -0,16285 pokazuje težinu varijable X na Y. Odnosno, prosječna mjesečna plaća unutar ovog modela utječe na broj onih koji su odustali s težinom od -0,16285 (ovo je mali stupanj utjecaja). Znak "-" označava negativan utjecaj: što je veća plaća, manje ljudi daje otkaz. Što je pošteno.



Korelacijska analiza u Excelu

Analiza korelacije pomaže utvrditi postoji li odnos između pokazatelja u jednom ili dva uzorka. Na primjer, između vremena rada stroja i troškova popravaka, cijene opreme i trajanja rada, visine i težine djece itd.

Ako postoji veza, onda povećanje jednog parametra dovodi do povećanja (pozitivna korelacija) ili smanjenja (negativna) drugog. Korelacijska analiza pomaže analitičaru odrediti može li se vrijednost jednog pokazatelja koristiti za predviđanje moguće vrijednosti drugog.

Koeficijent korelacije je označen s r. Varira od +1 do -1. Klasifikacija korelacija za različitim područjima bit će drugačije. Kada je koeficijent 0 linearna ovisnost ne postoji između uzoraka.

Pogledajmo kako koristiti Excel alati pronaći koeficijent korelacije.

Za pronalaženje uparenih koeficijenata koristi se funkcija CORREL.

Cilj: Utvrditi postoji li veza između vremena rada tokarilice i troškova njenog održavanja.

Postavite kursor u bilo koju ćeliju i pritisnite gumb fx.

  1. U kategoriji “Statistika” odaberite funkciju CORREL.
  2. Argument "Niz 1" - prvi raspon vrijednosti - vrijeme rada stroja: A2:A14.
  3. Argument "Niz 2" - drugi raspon vrijednosti - trošak popravka: B2:B14. Pritisnite OK.

Da biste odredili vrstu veze, morate pogledati apsolutni broj koeficijent (svako polje aktivnosti ima svoju ljestvicu).

Za korelacijska analiza nekoliko parametara (više od 2), prikladnije je koristiti "Analizu podataka" (dodatak "Paket analize"). Morate odabrati korelaciju s popisa i označiti niz. Sve.

Rezultirajući koeficijenti bit će prikazani u korelacijskoj matrici. Ovako:

Korelacijska i regresijska analiza

U praksi se ove dvije tehnike često koriste zajedno.

Primjer:


Sada su podaci regresijske analize postali vidljivi.

28 lis

Dobar dan, dragi čitatelji blog! Danas ćemo govoriti o nelinearnim regresijama. Otopina linearne regresije možete pogledati putem LINKA.

Ova metoda koristi se uglavnom u ekonomskom modeliranju i predviđanju. Cilj mu je promatrati i identificirati ovisnosti između dva pokazatelja.

Glavne vrste nelinearne regresije su:

  • polinom (kvadratni, kubni);
  • hiperbolički;
  • trijezan;
  • demonstrativan;
  • logaritamski

Također se može koristiti razne kombinacije. Na primjer, za analitiku vremenskih serija u bankarski sektor, osiguranje i demografske studije koriste Gompzerovu krivulju, koja je vrsta logaritamske regresije.

U predviđanju pomoću nelinearne regresije, najvažnije je pronaći koeficijent korelacije, koji će nam pokazati postoji li bliska veza između dva parametra ili ne. U pravilu, ako je koeficijent korelacije blizu 1, tada postoji veza, a prognoza će biti prilično točna. Još jedan važan element nelinearne regresije je prosječna relativna pogreška ( A ), ako je u intervalu<8…10%, значит модель достаточно точна.

Ovdje ćemo vjerojatno završiti teoretski blok i prijeći na praktične izračune.

Imamo tablicu prodaje automobila u razdoblju od 15 godina (označimo to X), broj koraka mjerenja bit će argument n, također imamo prihod za ta razdoblja (označimo to Y), moramo predvidjeti što prihod će biti u budućnosti. Napravimo sljedeću tablicu:

Za proučavanje trebat ćemo riješiti jednadžbu (ovisnost Y o X): y=ax 2 +bx+c+e. Ovo je kvadratna regresija po parovima. U ovom slučaju primjenjujemo metodu najmanjih kvadrata kako bismo saznali nepoznate argumente - a, b, c. To će dovesti do sustava algebarskih jednadžbi oblika:

Za rješavanje ovog sustava koristit ćemo se npr. Cramerovom metodom. Vidimo da su zbrojevi uključeni u sustav koeficijenti nepoznanica. Da bismo ih izračunali, tablici ćemo dodati nekoliko stupaca (D,E,F,G,H) i potpisati prema značenju izračuna - u stupcu D ćemo kvadrirati x, u E ćemo ga kockati, u F pomnožit ćemo eksponente x i y, u H kvadriramo x i pomnožimo s y.

Dobit ćete tablicu obrasca ispunjenu stvarima potrebnim za rješavanje jednadžbe.

Formirajmo matricu A sustav koji se sastoji od koeficijenata za nepoznanice na lijevim stranama jednadžbi. Smjestimo ga u ćeliju A22 i nazovimo ga " A=". Slijedimo sustav jednadžbi koje smo odabrali za rješavanje regresije.

Odnosno, u ćeliju B21 moramo smjestiti zbroj stupca u kojem smo podigli indikator X na četvrtu potenciju - F17. Pogledajmo samo ćeliju - “=F17”. Dalje, trebamo zbroj stupca gdje je X kubiran - E17, onda idemo striktno prema sustavu. Dakle, morat ćemo ispuniti cijelu matricu.

U skladu s Cramerovim algoritmom ukucat ćemo matricu A1, sličnu A, u koju umjesto elemenata prvog stupca treba smjestiti elemente desnih strana jednadžbi sustava. To jest, zbroj stupca X na kvadrat pomnožen s Y, zbroj stupca XY i zbroj stupca Y.

Također će nam trebati još dvije matrice - nazovimo ih A2 i A3 u kojima će se drugi i treći stupac sastojati od koeficijenata desnih strana jednadžbi. Slika će biti ovakva.

Slijedeći odabrani algoritam, morat ćemo izračunati vrijednosti determinanti (determinanti, D) dobivenih matrica. Poslužimo se formulom MOPRED. Rezultate ćemo smjestiti u ćelije J21:K24.

Koeficijente jednadžbe prema Crameru izračunat ćemo u ćelijama nasuprot odgovarajućih determinanti pomoću formule: a(u ćeliji M22) - “=K22/K21”; b(u ćeliji M23) - “=K23/K21”; S(u ćeliji M24) - “=K24/K21”.

Dobivamo željenu jednadžbu uparene kvadratne regresije:

y=-0,074x 2 +2,151x+6,523

Procijenimo blizinu linearnog odnosa pomoću indeksa korelacije.

Za izračun dodajte dodatni stupac J u tablicu (nazovimo ga y*). Izračun će biti sljedeći (prema regresijskoj jednadžbi koju smo dobili) - “=$m$22*B2*B2+$M$23*B2+$M$24.” Smjestimo ga u ćeliju J2. Sve što preostaje je povući marker za automatsko popunjavanje dolje do ćelije J16.

Za izračun zbrojeva (Y-Y prosjek) 2 dodajte stupce K i L u tablicu s odgovarajućim formulama. Izračunavamo prosjek za Y stupac pomoću funkcije AVERAGE.

U ćeliju K25 smjestit ćemo formulu za izračun indeksa korelacije - “=ROOT(1-(K17/L17))”.

Vidimo da je vrijednost od 0,959 vrlo blizu 1, što znači da postoji bliska nelinearna veza između prodaje i godina.

Ostaje procijeniti kvalitetu prilagodbe dobivene kvadratne regresijske jednadžbe (indeks determinacije). Izračunava se pomoću formule za kvadrat indeksa korelacije. Odnosno, formula u ćeliji K26 bit će vrlo jednostavna - "= K25 * K25".

Koeficijent od 0,920 blizu je 1, što ukazuje na visoku kvalitetu pristajanja.

Posljednji korak je izračunavanje relativne pogreške. Dodajmo stupac i tamo unesite formulu: “=ABS((C2-J2)/C2), ABS - modul, apsolutna vrijednost. Povucite marker prema dolje iu ćeliji M18 prikažite prosječnu vrijednost (PROSJEK), dodijelite postotni format ćelijama. Dobiveni rezultat - 7,79% je unutar prihvatljivih vrijednosti pogreške<8…10%. Значит вычисления достаточно точны.

Ako se ukaže potreba, pomoću dobivenih vrijednosti možemo napraviti graf.

Primjer datoteke nalazi se u prilogu - LINK!

kategorije:// od 28.10.2017

Regresijska analiza jedna je od najpopularnijih metoda statističkog istraživanja. Može se koristiti za utvrđivanje stupnja utjecaja nezavisnih varijabli na zavisnu varijablu. Microsoft Excel ima alate dizajnirane za izvođenje ove vrste analize. Pogledajmo što su i kako ih koristiti.

Povezivanje paketa analize

No, kako biste koristili funkciju koja vam omogućuje izvođenje regresijske analize, prvo morate aktivirati Analysis Package. Tek tada će se alati potrebni za ovaj postupak pojaviti na vrpci programa Excel.

  1. Prijeđite na karticu "Datoteka".
  2. Idite na odjeljak "Postavke".
  3. Otvara se prozor Excel Options. Idite na pododjeljak "Dodaci".
  4. Na samom dnu prozora koji se otvori pomaknite prekidač u bloku "Upravljanje" u položaj "Dodaci Excela", ako je u drugom položaju. Kliknite na gumb "Idi".
  5. Otvara se prozor s dostupnim Excel dodacima. Označite okvir pored "Analysis Package". Kliknite na gumb "OK".

Sada, kada odemo na karticu "Podaci", na vrpci u bloku alata "Analiza" vidjet ćemo novi gumb - "Analiza podataka".

Vrste regresijske analize

Postoji nekoliko vrsta regresija:

  • parabolični;
  • trijezan;
  • logaritamski;
  • eksponencijalni;
  • demonstrativan;
  • hiperbolički;
  • linearna regresija.

Kasnije ćemo detaljnije govoriti o izvođenju posljednje vrste regresijske analize u Excelu.

Linearna regresija u Excelu

U nastavku, kao primjer, nalazi se tablica koja prikazuje prosječnu dnevnu vanjsku temperaturu zraka i broj kupaca trgovine za odgovarajući radni dan. Otkrijmo regresijskom analizom kako točno vremenski uvjeti u obliku temperature zraka mogu utjecati na posjećenost maloprodajnog objekta.

Opća linearna regresijska jednadžba je sljedeća: Y = a0 + a1x1 +…+ akhk. U ovoj formuli Y označava varijablu na koju pokušavamo proučavati utjecaj faktora. U našem slučaju to je broj kupaca. Vrijednost x su različiti faktori koji utječu na varijablu. Parametri a su regresijski koeficijenti. Odnosno, oni su ti koji određuju značaj pojedinog faktora. Indeks k označava ukupan broj istih faktora.


Analiza rezultata analize

Rezultati regresijske analize prikazuju se u obliku tablice na mjestu navedenom u postavkama.

Jedan od glavnih pokazatelja je R-kvadrat. Označava kvalitetu modela. U našem slučaju taj koeficijent iznosi 0,705 ili oko 70,5%. Ovo je prihvatljiva razina kvalitete. Ovisnost manja od 0,5 je loša.

Još jedan važan pokazatelj nalazi se u ćeliji na sjecištu retka "Y-presjeka" i stupca "Koeficijenti". To pokazuje koju će vrijednost Y imati, au našem slučaju to je broj kupaca, sa svim ostalim faktorima jednakima nuli. U ovoj tablici ova vrijednost je 58,04.

Vrijednost na sjecištu stupaca “Varijabla X1” i “Koeficijenti” pokazuje razinu ovisnosti Y o X. U našem slučaju to je razina ovisnosti broja kupaca trgovine o temperaturi. Koeficijent od 1,31 smatra se prilično visokim pokazateljem utjecaja.

Kao što vidite, korištenjem programa Microsoft Excel vrlo je jednostavno izraditi tablicu regresijske analize. Ali samo obučena osoba može raditi s izlaznim podacima i razumjeti njihovu bit.

Drago nam je što smo vam mogli pomoći u rješavanju problema.

Postavite svoje pitanje u komentarima, detaljno opisujući bit problema. Naši stručnjaci pokušat će odgovoriti što je brže moguće.

Je li vam ovaj članak pomogao?

Metoda linearne regresije omogućuje nam da opišemo ravnu liniju koja najbolje odgovara nizu uređenih parova (x, y). Jednadžba za ravnu liniju, poznata kao linearna jednadžba, data je u nastavku:

ŷ - očekivana vrijednost y za danu vrijednost x,

x - nezavisna varijabla,

a - segment na y-osi za ravnu liniju,

b je nagib ravne crte.

Slika u nastavku grafički ilustrira ovaj koncept:

Gornja slika prikazuje liniju opisanu jednadžbom ŷ =2+0,5x. Y-presjecište je točka u kojoj pravac siječe y-os; u našem slučaju, a = 2. Nagib linije, b, omjer uspona linije i duljine linije, ima vrijednost 0,5. Pozitivan nagib znači da se linija diže slijeva nadesno. Ako je b = 0, linija je vodoravna, što znači da ne postoji odnos između zavisne i nezavisne varijable. Drugim riječima, promjena vrijednosti x ne utječe na vrijednost y.

ŷ i y često se brkaju. Graf prikazuje 6 poredanih parova točaka i pravac, prema zadanoj jednadžbi

Ova slika prikazuje točku koja odgovara uređenom paru x = 2 i y = 4. Imajte na umu da je očekivana vrijednost y prema liniji na X= 2 je ŷ. To možemo potvrditi sljedećom jednadžbom:

ŷ = 2 + 0,5h =2 +0,5(2) =3.

Vrijednost y predstavlja stvarnu točku, a vrijednost ŷ je očekivana vrijednost y pomoću linearne jednadžbe za danu vrijednost x.

Sljedeći korak je odrediti linearnu jednadžbu koja najbolje odgovara skupu uređenih parova, o tome smo govorili u prethodnom članku, gdje smo metodom najmanjih kvadrata odredili oblik jednadžbe.

Korištenje Excela za definiranje linearne regresije

Kako biste koristili alat za regresijsku analizu ugrađen u Excel, morate aktivirati dodatak Paket analiza. Možete ga pronaći klikom na karticu Datoteka -> Opcije(2007+), u dijaloškom okviru koji se pojavi MogućnostiExcel idite na karticu Dodaci. Na terenu Kontrolirati izabrati DodaciExcel i kliknite Ići. U prozoru koji se pojavi potvrdite okvir pored Paket analiza, klik U REDU.

U kartici Podaci u grupi Analiza pojavit će se novi gumb Analiza podataka.

Da bismo demonstrirali kako dodatak radi, upotrijebimo podatke iz prethodnog članka, gdje momak i djevojka dijele stol u kupaonici. Unesite podatke iz našeg primjera kade u stupce A i B praznog lista.

Idi na karticu Podaci, u grupi Analiza klik Analiza podataka. U prozoru koji se pojavi Analiza podataka odabrati Regresija kao što je prikazano na slici i kliknite OK.

U prozoru postavite potrebne regresijske parametre Regresija kao što je prikazano na slici:

Klik U REDU. Slika u nastavku prikazuje dobivene rezultate:

Ovi su rezultati u skladu s onima koje smo dobili vlastitim izračunima u prethodnom članku.

Regresijska analiza je statistička metoda istraživanja koja vam omogućuje da pokažete ovisnost određenog parametra o jednoj ili više neovisnih varijabli. U predračunalnoj eri njegovo je korištenje bilo prilično teško, posebice kada se radilo o velikim količinama podataka. Danas, nakon što ste naučili kako izgraditi regresiju u Excelu, možete riješiti složene statističke probleme u samo nekoliko minuta. U nastavku su konkretni primjeri iz područja ekonomije.

Vrste regresije

Sam ovaj koncept u matematiku je uveo Francis Galton 1886. godine. Regresija se događa:

  • linearni;
  • parabolični;
  • trijezan;
  • eksponencijalni;
  • hiperbolički;
  • demonstrativan;
  • logaritamski.

Primjer 1

Razmotrimo problem određivanja ovisnosti broja članova tima koji su dali otkaz o prosječnoj plaći u 6 industrijskih poduzeća.

Zadatak. U šest poduzeća analizirana je prosječna mjesečna plaća i broj zaposlenika koji su dobrovoljno dali otkaz. U tabelarnom obliku imamo:

Za zadatak određivanja ovisnosti broja radnika koji napuštaju posao o prosječnoj plaći u 6 poduzeća, regresijski model ima oblik jednadžbe Y = a0 + a1×1 +…+akxk, gdje su hi utjecajne varijable, ai su regresijski koeficijenti, a k je broj faktora.

Za ovaj zadatak Y je indikator zaposlenika koji daju otkaz, a faktor utjecaja je plaća koju označavamo s X.

Korištenje mogućnosti tabličnog procesora Excel

Regresijskoj analizi u Excelu mora prethoditi primjena ugrađenih funkcija na postojeće tablične podatke. Međutim, u ove svrhe bolje je koristiti vrlo koristan dodatak “Analysis Pack”. Za aktivaciju je potrebno:

  • na kartici "Datoteka" idite na odjeljak "Opcije";
  • u prozoru koji se otvori odaberite redak "Dodaci";
  • kliknite gumb "Idi" koji se nalazi ispod, desno od retka "Upravljanje";
  • potvrdite okvir pored naziva "Paket analize" i potvrdite svoje radnje klikom na "U redu".

Ako je sve učinjeno ispravno, potreban gumb pojavit će se na desnoj strani kartice "Podaci", koja se nalazi iznad Excel radnog lista.

Linearna regresija u Excelu

Sada kada imamo sve potrebne virtualne alate pri ruci za izvođenje ekonometrijskih izračuna, možemo početi rješavati naš problem. Da biste to učinili:

  • kliknite na gumb "Analiza podataka";
  • u prozoru koji se otvori kliknite na gumb "Regresija";
  • u kartici koja se pojavi unesite raspon vrijednosti za Y (broj zaposlenika koji odustaju) i za X (njihove plaće);
  • Svoje radnje potvrđujemo pritiskom na gumb "Ok".

Kao rezultat toga, program će automatski ispuniti novu proračunsku tablicu podacima regresijske analize. Obratiti pažnju! Excel vam omogućuje da ručno postavite mjesto koje želite za tu svrhu. Na primjer, to može biti isti list na kojem se nalaze vrijednosti Y i X ili čak nova radna knjiga posebno dizajnirana za pohranu takvih podataka.

Analiza rezultata regresije za R-kvadrat

U Excelu podaci dobiveni obradom podataka u primjeru koji se razmatra imaju oblik:

Prije svega, trebali biste obratiti pozornost na vrijednost R-kvadrata. Predstavlja koeficijent determinacije. U ovom primjeru R-kvadrat = 0,755 (75,5%), tj. izračunati parametri modela objašnjavaju odnos između parametara koji se razmatraju za 75,5%. Što je veća vrijednost koeficijenta determinacije, to je odabrani model prikladniji za određeni zadatak. Smatra se da ispravno opisuje stvarnu situaciju kada je vrijednost R-kvadrata iznad 0,8. Ako je R-kvadrat tcr, tada se hipoteza o beznačajnosti slobodnog člana linearne jednadžbe odbacuje.

U razmatranom problemu za slobodni član pomoću Excel alata dobiveno je da je t = 169,20903, a p = 2,89E-12, odnosno imamo nultu vjerojatnost da će točna hipoteza o beznačajnosti slobodnog člana biti odbačena. . Za koeficijent za nepoznatu t=5,79405, a p=0,001158. Drugim riječima, vjerojatnost da će ispravna hipoteza o beznačajnosti koeficijenta za nepoznanicu biti odbačena je 0,12%.

Stoga se može tvrditi da je rezultirajuća jednadžba linearne regresije primjerena.

Problem isplativosti kupnje paketa dionica

Višestruka regresija u Excelu izvodi se pomoću istog alata za analizu podataka. Razmotrimo konkretan problem primjene.

Uprava tvrtke NNN mora odlučiti o svrsishodnosti kupnje 20% udjela u MMM dd. Cijena paketa (SP) je 70 milijuna američkih dolara. NNN stručnjaci prikupili su podatke o sličnim transakcijama. Odlučeno je procijeniti vrijednost udjela prema takvim parametrima, izraženim u milijunima američkih dolara, kao što su:

  • računi prema dobavljačima (VK);
  • godišnji obujam prometa (VO);
  • potraživanja (VD);
  • trošak dugotrajne imovine (COF).

Osim toga, koristi se parametar duga poduzeća za plaće (V3 P) u tisućama američkih dolara.

Rješenje pomoću procesora proračunskih tablica Excel

Prije svega, trebate izraditi tablicu izvornih podataka. Ovako izgleda:

  • pozovite prozor "Analiza podataka";
  • odaberite odjeljak "Regresija";
  • u kućicu “Interval unosa Y” unesite raspon vrijednosti zavisnih varijabli iz stupca G;
  • Kliknite na ikonu s crvenom strelicom desno od prozora “Interval unosa X” i označite raspon svih vrijednosti iz stupaca B, C, D, F na listu.

Označite stavku "Novi radni list" i kliknite "U redu".

Dobiti regresijsku analizu za dati problem.

Studija rezultata i zaključaka

Regresijsku jednadžbu "prikupljamo" iz gore navedenih zaokruženih podataka u Excel proračunskoj tablici:

SP = 0,103*SOF + 0,541*VO – 0,031*VK +0,405*VD +0,691*VZP – 265,844.

U poznatijem matematičkom obliku, može se napisati kao:

y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,405*x4 +0,691*x5 – 265,844

Podaci za MMM dd prikazani su u tablici:

Zamjenom u regresijsku jednadžbu dobivamo brojku od 64,72 milijuna američkih dolara. To znači da se dionice MMM dd ne isplati kupovati, jer je njihova vrijednost od 70 milijuna dolara prilično prenapuhana.

Kao što vidite, korištenje Excel procesora za proračunske tablice i regresijske jednadžbe omogućilo je donošenje informirane odluke o izvedivosti vrlo specifične transakcije.

Sada znate što je regresija. Gore navedeni primjeri programa Excel pomoći će vam u rješavanju praktičnih problema u području ekonometrije.

Paket MS Excel omogućuje vam da većinu posla obavite vrlo brzo kada konstruirate jednadžbu linearne regresije. Važno je razumjeti kako interpretirati dobivene rezultate. Za izradu regresijskog modela morate odabrati Alati\Analiza podataka\Regresija (u Excelu 2007 ovaj način je u bloku Podaci/Analiza podataka/Regresija). Zatim kopirajte rezultate u blok za analizu.

Početni podaci:

Rezultati analize

Uključi u izvješće
Izračun parametara regresijske jednadžbe
Teorijski materijal
Regresijska jednadžba na standardnoj skali
Koeficijent višestruke korelacije (indeks višestruke korelacije)
Parcijalni koeficijenti elastičnosti
Usporedna procjena utjecaja analiziranih faktora na rezultirajuću karakteristiku (d - koeficijenti odvojenog određivanja)

Provjera kvalitete konstruirane regresijske jednadžbe
Značajnost regresijskih koeficijenata b i (t-statistika. Studentov test)
Značaj jednadžbe kao cjeline (F-statistika. Fisherov test). Koeficijent determinacije
Djelomični F-testovi

Razina značajnosti 0.005 0.01 0.025 0.05 0.1 0.25 0.4

Konstrukcija linearne regresije, procjena njezinih parametara i njihove značajnosti može se izvesti mnogo brže korištenjem Excel paketa za analizu (Regression). Razmotrimo interpretaciju rezultata dobivenih u općem slučaju ( k eksplanatorne varijable) prema primjeru 3.6.

U tablici regresijska statistika date su sljedeće vrijednosti:

Višestruki R – koeficijent višestruke korelacije;

R- kvadrat– koeficijent determinacije R 2 ;

Normalizirano R - kvadrat– prilagođeno R 2 prilagođeno broju stupnjeva slobode;

Standardna greška– standardna pogreška regresije S;

Zapažanja – broj opažanja n.

U tablici Analiza varijance dati su:

1. Stupac df - broj stupnjeva slobode jednak

za niz Regresija df = k;

za niz Ostatakdf = nk – 1;

za niz Ukupnodf = n– 1.

2. Stupac SS – zbroj kvadrata odstupanja jednak

za niz Regresija ;

za niz Ostatak ;

za niz Ukupno .

3. Stupac MS varijance određene formulom MS = SS/df:

za niz Regresija– faktorska disperzija;

za niz Ostatak– rezidualna varijanca.

4. Stupac F – izračunata vrijednost F-kriterij izračunat pomoću formule

F = MS(regresija)/ MS(ostatak).

5. Stupac Značaj F – vrijednost razine značajnosti koja odgovara izračunatoj F-statistika .

Značaj F= FDIST( F- statistika, df(regresija), df(ostatak)).

Ako je značaj F < стандартного уровня значимости, то R 2 je statistički značajan.

Izgledi Standardna greška t-statistika P-vrijednost Donjih 95% prvih 95%
Y 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Ova tablica pokazuje:

1. Izgledi– vrijednosti koeficijenata a, b.

2. Standardna pogreška– standardne pogreške regresijskih koeficijenata S a, S b.



3. t- statistika– izračunate vrijednosti t -kriteriji izračunati po formuli:

t-statistika = Koeficijenti/Standardna pogreška.

4.R-vrijednost (značaj t) je vrijednost razine značajnosti koja odgovara izračunatoj t- statistika.

R-vrijednost = STUDIDIST(t-statistika, df(ostatak)).

Ako R-značenje< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Donjih 95% i gornjih 95%– donje i gornje granice od 95% intervala pouzdanosti za koeficijente teorijske linearne regresijske jednadžbe.

POVLAČENJE OSTATKA
Promatranje Predviđeno y Ostaci e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

U tablici POVLAČENJE OSTATKA naznačeno:

u stupcu Promatranje– broj opažanja;

u stupcu Prorečeno g – izračunate vrijednosti zavisne varijable;

u stupcu Ostaci hrane e – razlika između promatrane i izračunate vrijednosti zavisne varijable.

Primjer 3.6. Postoje podaci (uslovne jedinice) o troškovima hrane g i prihod po stanovniku x za devet grupa obitelji:

x
g

Pomoću rezultata Excel paketa analiza (Regresija) analizirat ćemo ovisnost troškova prehrane o dohotku po glavi stanovnika.

Rezultati regresijske analize obično se zapisuju u obliku:

gdje su u zagradama navedene standardne pogreške regresijskih koeficijenata.

Koeficijenti regresije A = 65,92 i b= 0,107. Smjer komunikacije između g I x određuje predznak koeficijenta regresije b= 0,107, tj. veza je izravna i pozitivna. Koeficijent b= 0,107 pokazuje da s povećanjem dohotka po stanovniku za 1 konv. jedinice troškovi hrane rastu za 0,107 konvencionalnih jedinica. jedinice

Ocijenimo značajnost koeficijenata dobivenog modela. Značaj koeficijenata ( a, b) provjerava t-test:

P-vrijednost ( a) = 0,00080 < 0,01 < 0,05

P-vrijednost ( b) = 0,00016 < 0,01 < 0,05,

dakle, koeficijenti ( a, b) značajni su na razini od 1%, a još više na razini značajnosti od 5%. Dakle, koeficijenti regresije su značajni i model je adekvatan izvornim podacima.

Rezultati regresijske procjene kompatibilni su ne samo s dobivenim vrijednostima koeficijenata regresije, već i s određenim skupom njih (interval pouzdanosti). Uz vjerojatnost od 95%, intervali pouzdanosti za koeficijente su (38,16 – 93,68) za a i (0,0728 – 0,142) za b.

Kvaliteta modela ocjenjuje se koeficijentom determinacije R 2 .

Veličina R 2 = 0,884 znači da faktor dohotka po stanovniku može objasniti 88,4% varijacije (raspršenosti) u izdacima za hranu.

Značaj R 2 provjerava F- test: značaj F = 0,00016 < 0,01 < 0,05, следовательно, R 2 je značajan na razini od 1%, a još više na razini značajnosti od 5%.

U slučaju parne linearne regresije, koeficijent korelacije može se definirati kao . Dobivena vrijednost koeficijenta korelacije ukazuje da je odnos između izdataka za hranu i dohotka po glavi stanovnika vrlo tijesan.