സ്റ്റാറ്റിസ്റ്റിക്കയിലെ സ്റ്റാൻഡേർഡ് റിഗ്രഷൻ വിശകലനം. റിഗ്രഷൻ വിശകലനം

നിർണ്ണയത്തിന്റെ ഗുണകങ്ങൾ ഉപയോഗിച്ച് ഒരു റിഗ്രഷൻ സമവാക്യത്തിന്റെ ഗുണനിലവാരം വിലയിരുത്തുന്നു. ഫിഷേഴ്‌സ് എഫ് ടെസ്റ്റ് ഉപയോഗിച്ച് സമവാക്യത്തിന്റെ പ്രാധാന്യത്തെയും ബന്ധ ശക്തി സൂചകങ്ങളെയും കുറിച്ചുള്ള ശൂന്യമായ സിദ്ധാന്തം പരിശോധിക്കുന്നു.

ഗുണകങ്ങളുടെ സ്റ്റാൻഡേർഡ് പിശകുകൾ.

റിഗ്രഷൻ സമവാക്യം ഇതാണ്:

വൈ =3378,41 -494.59X 1 -35.00X 2 +75.74X 3 -15.81X 4 +80.10X 5 +59.84X 6 +
(1304,48) (226,77) (10,31) (277,57) (287,54) (35,31) (150,93)
+127.98X 7 -78.10X 8 -437.57X 9 +451.26X 10 -299.91X 11 -14.93X 12 -369.65X 13 (9)
(22,35) (31,19) (97,68) (331,79) (127,84) 86,06 (105,08)

"റിഗ്രഷൻ സ്റ്റാറ്റിസ്റ്റിക്സ്" (പട്ടിക 9) പട്ടിക പൂരിപ്പിക്കുന്നതിന് ഞങ്ങൾ കണ്ടെത്തുന്നു:

1. ബഹുവചനം ആർ- y, ŷ എന്നിവയ്‌ക്കിടയിലുള്ള r-കോറിലേഷൻ കോഫിഫിഷ്യന്റ്.

ഇത് ചെയ്യുന്നതിന്, y, ŷ എന്നീ അറേകൾ നൽകി COREL ഫംഗ്ഷൻ ഉപയോഗിക്കുക.

ഫലമായുണ്ടാകുന്ന സംഖ്യ 0.99 1 ന് അടുത്താണ്, ഇത് പരീക്ഷണാത്മക ഡാറ്റയും കണക്കാക്കിയ ഡാറ്റയും തമ്മിലുള്ള വളരെ ശക്തമായ ബന്ധം കാണിക്കുന്നു.

2. കണക്കുകൂട്ടലിനായി R-ചതുരംഞങ്ങൾ കണ്ടെത്തുന്നു:

വിശദീകരിച്ച പിശക് 17455259,48,

വിശദീകരിക്കാനാകാത്ത പിശക് .

അതിനാൽ, R-സ്ക്വയർ തുല്യമാണ്.

അതനുസരിച്ച്, പരീക്ഷണാത്മക ഡാറ്റയുടെ 97% ഫലമായുണ്ടാകുന്ന റിഗ്രഷൻ സമവാക്യം വഴി വിശദീകരിക്കാം.

3. നോർമലൈസ് ചെയ്ത R-സ്ക്വയർഫോർമുല ഉപയോഗിച്ച് കണ്ടെത്തുക

വിശദീകരണ വേരിയബിളുകളുടെ ഘടന മാറുമ്പോൾ വ്യത്യസ്ത റിഗ്രഷൻ മോഡലുകളെ താരതമ്യം ചെയ്യാൻ ഈ സൂചകം സഹായിക്കുന്നു.

4. സാധാരണ പിശക്- സാമ്പിൾ അവശിഷ്ട വ്യത്യാസത്തിന്റെ വർഗ്ഗമൂല്യം:

തൽഫലമായി, നമുക്ക് ഇനിപ്പറയുന്ന പട്ടിക ലഭിക്കും.

പട്ടിക 9.

"വേരിയൻസിന്റെ വിശകലനം" പട്ടിക പൂരിപ്പിക്കുന്നു

ഭൂരിഭാഗം ഡാറ്റയും ഇതിനകം മുകളിൽ നിന്ന് ലഭിച്ചിട്ടുണ്ട്. (വിശദീകരിക്കപ്പെട്ടതും വിശദീകരിക്കാത്തതുമായ പിശക്).

നമുക്ക് t wx:val="Cambria Math"/> കണക്കാക്കാം 13 = 1342712,27"> .



റിഗ്രഷൻ സമവാക്യത്തിന്റെ സ്ഥിതിവിവരക്കണക്കുകളുടെ പ്രാധാന്യം ഞങ്ങൾ വിലയിരുത്തും എഫ്- ഫിഷർ മാനദണ്ഡം. മൾട്ടിപ്പിൾ റിഗ്രഷൻ സമവാക്യം പ്രധാനമാണ് (അല്ലെങ്കിൽ, റിഗ്രഷൻ മോഡലിന്റെ പാരാമീറ്ററുകളുടെ പൂജ്യത്തിലേക്കുള്ള തുല്യതയെക്കുറിച്ചുള്ള ഹൈപ്പോഥസിസ് H 0, അതായത് നിരസിക്കപ്പെട്ടാൽ)

, (10)

ഫിഷേഴ്‌സ് എഫ് ടെസ്റ്റിന്റെ പട്ടിക മൂല്യം എവിടെയാണ്.

യഥാർത്ഥ മൂല്യം എഫ്- ഫോർമുല അനുസരിച്ച് മാനദണ്ഡം ഇതായിരിക്കും:

ഫിഷർ മാനദണ്ഡത്തിന്റെ പട്ടിക മൂല്യം കണക്കാക്കാൻ, ഫംഗ്ഷൻ FRIST ഉപയോഗിക്കുന്നു (ചിത്രം 4).

സ്വാതന്ത്ര്യത്തിന്റെ അളവ് 1: p=13

സ്വാതന്ത്ര്യത്തിന്റെ ഡിഗ്രി 2: n-p-1 = 20-13-1=6

ചിത്രം 4. Excel-ൽ FRIST ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു.

F പട്ടിക = 3.976< 16,88, следовательно, модель адекватна опытным данным.

പ്രാധാന്യം എഫ് FDIST ഫംഗ്ഷൻ ഉപയോഗിച്ച് കണക്കാക്കുന്നു. ഈ ഫംഗ്‌ഷൻ എഫ് പ്രോബബിലിറ്റി ഡിസ്‌ട്രിബ്യൂഷൻ (ഫിഷർ ഡിസ്ട്രിബ്യൂഷൻ) നൽകുകയും രണ്ട് ഡാറ്റാ സെറ്റുകൾക്ക് അവയുടെ ഫലങ്ങളിൽ വ്യത്യസ്‌ത അളവിലുള്ള വ്യാപനമുണ്ടോ എന്ന് നിർണ്ണയിക്കാൻ നിങ്ങളെ അനുവദിക്കുകയും ചെയ്യുന്നു.

ചിത്രം 5. Excel-ൽ FDIST ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു.

പ്രാധാന്യം F = 0.001.

സ്റ്റാറ്റിസ്റ്റിക്കൽ മോഡലിംഗിൽ, വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം വിലയിരുത്താൻ ഉപയോഗിക്കുന്ന ഒരു പഠനമാണ് റിഗ്രഷൻ വിശകലനം. ഒരു ആശ്രിത വേരിയബിളും ഒന്നോ അതിലധികമോ സ്വതന്ത്രമായവയും തമ്മിലുള്ള ബന്ധത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന ഒന്നിലധികം വേരിയബിളുകൾ മോഡലിംഗ് ചെയ്യുന്നതിനും വിശകലനം ചെയ്യുന്നതിനുമുള്ള മറ്റ് നിരവധി രീതികൾ ഈ ഗണിതശാസ്ത്ര രീതി ഉൾക്കൊള്ളുന്നു. കൂടുതൽ വ്യക്തമായി പറഞ്ഞാൽ, ഒരു സ്വതന്ത്ര വേരിയബിളിൽ ഒന്ന് മാറുകയും മറ്റ് സ്വതന്ത്ര വേരിയബിളുകൾ സ്ഥിരമായി നിലകൊള്ളുകയും ചെയ്താൽ ആശ്രിത വേരിയബിളിന്റെ സാധാരണ മൂല്യം എങ്ങനെ മാറുമെന്ന് മനസിലാക്കാൻ റിഗ്രഷൻ വിശകലനം സഹായിക്കുന്നു.

എല്ലാ സാഹചര്യങ്ങളിലും, ടാർഗെറ്റ് എസ്റ്റിമേറ്റ് എന്നത് സ്വതന്ത്ര വേരിയബിളുകളുടെ പ്രവർത്തനമാണ്, അതിനെ റിഗ്രഷൻ ഫംഗ്ഷൻ എന്ന് വിളിക്കുന്നു. റിഗ്രഷൻ വിശകലനത്തിൽ, ആശ്രിത വേരിയബിളിലെ മാറ്റത്തെ റിഗ്രഷന്റെ ഒരു ഫംഗ്‌ഷനായി ചിത്രീകരിക്കുന്നതും താൽപ്പര്യമുള്ളതാണ്, ഇത് പ്രോബബിലിറ്റി ഡിസ്‌ട്രിബ്യൂഷൻ ഉപയോഗിച്ച് വിവരിക്കാം.

റിഗ്രഷൻ അനാലിസിസ് പ്രശ്നങ്ങൾ

ഈ സ്ഥിതിവിവരക്കണക്ക് ഗവേഷണ രീതി പ്രവചനത്തിനായി വ്യാപകമായി ഉപയോഗിക്കുന്നു, അവിടെ അതിന്റെ ഉപയോഗത്തിന് കാര്യമായ നേട്ടമുണ്ട്, പക്ഷേ ചിലപ്പോൾ ഇത് മിഥ്യാധാരണകളിലേക്കോ തെറ്റായ ബന്ധങ്ങളിലേക്കോ നയിച്ചേക്കാം, അതിനാൽ പറഞ്ഞ വിഷയത്തിൽ ഇത് ശ്രദ്ധാപൂർവ്വം ഉപയോഗിക്കാൻ ശുപാർശ ചെയ്യുന്നു, ഉദാഹരണത്തിന്, പരസ്പരബന്ധം അർത്ഥമാക്കുന്നില്ല. കാര്യകാരണം.

റിഗ്രഷൻ വിശകലനത്തിനായി ധാരാളം രീതികൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്, അതായത് ലീനിയർ, ഓർഡിനറി ലിസ്റ്റ് സ്ക്വയർ റിഗ്രഷൻ, അവ പാരാമെട്രിക് ആണ്. ഡാറ്റയിൽ നിന്ന് കണക്കാക്കിയ അജ്ഞാത പാരാമീറ്ററുകളുടെ പരിമിതമായ എണ്ണം അനുസരിച്ച് റിഗ്രഷൻ ഫംഗ്ഷൻ നിർവചിക്കപ്പെട്ടിരിക്കുന്നു എന്നതാണ് അവരുടെ സാരം. നോൺ-പാരാമെട്രിക് റിഗ്രഷൻ അതിന്റെ പ്രവർത്തനത്തെ ഒരു പ്രത്യേക ഫംഗ്ഷനുകൾക്കുള്ളിൽ അനുവദിക്കുന്നു, അത് അനന്ത-മാനങ്ങളാകാം.

ഒരു സ്റ്റാറ്റിസ്റ്റിക്കൽ റിസർച്ച് രീതി എന്ന നിലയിൽ, റിഗ്രഷൻ വിശകലനം പ്രായോഗികമായി ഡാറ്റ സൃഷ്ടിക്കുന്ന പ്രക്രിയയുടെ രൂപത്തെയും അത് റിഗ്രഷൻ സമീപനവുമായി എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നു എന്നതിനെയും ആശ്രയിച്ചിരിക്കുന്നു. ഡാറ്റ പ്രോസസ്സ് ജനറേറ്റിംഗിന്റെ യഥാർത്ഥ രൂപം സാധാരണയായി ഒരു അജ്ഞാത സംഖ്യയായതിനാൽ, ഡാറ്റയുടെ റിഗ്രഷൻ വിശകലനം പലപ്പോഴും പ്രക്രിയയെക്കുറിച്ചുള്ള അനുമാനങ്ങളെ ഒരു പരിധിവരെ ആശ്രയിച്ചിരിക്കുന്നു. മതിയായ ഡാറ്റ ലഭ്യമാണെങ്കിൽ ഈ അനുമാനങ്ങൾ ചിലപ്പോൾ പരിശോധിക്കാവുന്നതാണ്. അനുമാനങ്ങൾ മിതമായ രീതിയിൽ ലംഘിക്കപ്പെടുമ്പോൾ പോലും റിഗ്രഷൻ മോഡലുകൾ പലപ്പോഴും ഉപയോഗപ്രദമാണ്, എന്നിരുന്നാലും അവ പരമാവധി കാര്യക്ഷമതയിൽ പ്രവർത്തിക്കില്ല.

ഒരു ഇടുങ്ങിയ അർത്ഥത്തിൽ, വർഗ്ഗീകരണത്തിൽ ഉപയോഗിക്കുന്ന വ്യതിരിക്തമായ പ്രതികരണ വേരിയബിളുകൾക്ക് വിരുദ്ധമായി, തുടർച്ചയായ പ്രതികരണ വേരിയബിളുകളുടെ അനുമാനത്തെ പ്രത്യേകമായി റിഗ്രഷൻ സൂചിപ്പിക്കാം. തുടർച്ചയായ ഔട്ട്പുട്ട് വേരിയബിൾ കേസിനെ ബന്ധപ്പെട്ട പ്രശ്നങ്ങളിൽ നിന്ന് വേർതിരിച്ചറിയാൻ മെട്രിക് റിഗ്രഷൻ എന്നും വിളിക്കുന്നു.

കഥ

റിഗ്രഷന്റെ ആദ്യ രൂപമാണ് അറിയപ്പെടുന്ന ഏറ്റവും കുറഞ്ഞ സ്ക്വയർ രീതി. 1805-ൽ ലെജൻഡ്രെയും 1809-ൽ ഗൗസും ഇത് പ്രസിദ്ധീകരിച്ചു. ജ്യോതിശാസ്ത്ര നിരീക്ഷണങ്ങളിൽ നിന്ന് സൂര്യനുചുറ്റും (പ്രധാനമായും ധൂമകേതുക്കൾ, എന്നാൽ പിന്നീട് പുതിയതായി കണ്ടെത്തിയ ചെറിയ ഗ്രഹങ്ങൾ) ഭ്രമണപഥം നിർണ്ണയിക്കുന്നതിനുള്ള പ്രശ്നത്തിന് ലെജൻഡറും ഗാസും ഈ രീതി പ്രയോഗിച്ചു. ഗാസ്-മാർക്കോവ് സിദ്ധാന്തത്തിന്റെ ഒരു പതിപ്പ് ഉൾപ്പെടെ 1821-ൽ ഏറ്റവും കുറഞ്ഞ സ്ക്വയർ സിദ്ധാന്തത്തിന്റെ കൂടുതൽ വികസനം ഗാസ് പ്രസിദ്ധീകരിച്ചു.

"റിഗ്രഷൻ" എന്ന പദം 19-ാം നൂറ്റാണ്ടിൽ ഒരു ജൈവ പ്രതിഭാസത്തെ വിവരിക്കുന്നതിനായി ഫ്രാൻസിസ് ഗാൽട്ടൺ ഉപയോഗിച്ചു. അവരുടെ പൂർവ്വികരിൽ നിന്നുള്ള പിൻഗാമികളുടെ ഉയരം സാധാരണ ശരാശരിയിലേക്ക് താഴോട്ടുപോകുന്നു എന്നതായിരുന്നു ആശയം. ഗാൾട്ടനെ സംബന്ധിച്ചിടത്തോളം, റിഗ്രഷനു ഈ ജീവശാസ്ത്രപരമായ അർത്ഥം മാത്രമേ ഉണ്ടായിരുന്നുള്ളൂ, എന്നാൽ പിന്നീട് അദ്ദേഹത്തിന്റെ പ്രവർത്തനം ഉദ്‌നി യോലിയും കാൾ പിയേഴ്സണും തുടരുകയും കൂടുതൽ പൊതുവായ സ്ഥിതിവിവരക്കണക്കിലേക്ക് കൊണ്ടുവരികയും ചെയ്തു. യൂലിന്റെയും പിയേഴ്സന്റെയും പ്രവർത്തനത്തിൽ, പ്രതികരണത്തിന്റെയും വിശദീകരണ വേരിയബിളുകളുടെയും സംയുക്ത വിതരണം ഗൗസിയൻ ആണെന്ന് അനുമാനിക്കപ്പെടുന്നു. 1922-ലെയും 1925-ലെയും പേപ്പറുകളിൽ ഫിഷർ ഈ അനുമാനം നിരസിച്ചു. പ്രതികരണ വേരിയബിളിന്റെ സോപാധിക വിതരണം ഗാസിയൻ ആണെന്ന് ഫിഷർ നിർദ്ദേശിച്ചു, എന്നാൽ സംയുക്ത വിതരണം ആവശ്യമില്ല. ഇക്കാര്യത്തിൽ, ഫിഷറിന്റെ നിർദ്ദേശം 1821-ലെ ഗൗസിന്റെ രൂപീകരണത്തോട് അടുത്താണ്. 1970-ന് മുമ്പ്, ഒരു റിഗ്രഷൻ വിശകലനത്തിന്റെ ഫലം ലഭിക്കാൻ ചിലപ്പോൾ 24 മണിക്കൂർ വരെ എടുത്തിരുന്നു.

റിഗ്രഷൻ വിശകലന രീതികൾ സജീവമായ ഗവേഷണത്തിന്റെ ഒരു മേഖലയായി തുടരുന്നു. സമീപ ദശകങ്ങളിൽ, ശക്തമായ റിഗ്രഷനുവേണ്ടി പുതിയ രീതികൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്; പരസ്പര ബന്ധമുള്ള പ്രതികരണങ്ങൾ ഉൾപ്പെടുന്ന റിഗ്രഷനുകൾ; വിവിധ തരത്തിലുള്ള നഷ്‌ടമായ ഡാറ്റ ഉൾക്കൊള്ളുന്ന റിഗ്രഷൻ രീതികൾ; നോൺപാരാമെട്രിക് റിഗ്രഷൻ; ബയേസിയൻ റിഗ്രഷൻ രീതികൾ; പ്രവചന വേരിയബിളുകൾ പിശക് ഉപയോഗിച്ച് അളക്കുന്ന റിഗ്രഷനുകൾ; നിരീക്ഷണങ്ങളേക്കാൾ കൂടുതൽ പ്രവചകരുള്ള റിഗ്രഷൻ, റിഗ്രഷനോടൊപ്പം കാരണവും ഫലവും.

റിഗ്രഷൻ മോഡലുകൾ

റിഗ്രഷൻ വിശകലന മോഡലുകളിൽ ഇനിപ്പറയുന്ന വേരിയബിളുകൾ ഉൾപ്പെടുന്നു:

  • അജ്ഞാത പാരാമീറ്ററുകൾ, നിയുക്ത ബീറ്റ, ഒരു സ്കെയിലറോ വെക്‌ടറോ ആകാം.
  • സ്വതന്ത്ര വേരിയബിളുകൾ, X.
  • ആശ്രിത വേരിയബിളുകൾ, Y.

റിഗ്രഷൻ വിശകലനം ഉപയോഗിക്കുന്ന ശാസ്ത്രത്തിന്റെ വിവിധ മേഖലകൾ ആശ്രിതവും സ്വതന്ത്രവുമായ വേരിയബിളുകൾക്ക് പകരം വ്യത്യസ്ത പദങ്ങൾ ഉപയോഗിക്കുന്നു, എന്നാൽ എല്ലാ സാഹചര്യങ്ങളിലും റിഗ്രഷൻ മോഡൽ Y യെ X, β എന്നിവയുടെ പ്രവർത്തനവുമായി ബന്ധപ്പെടുത്തുന്നു.

ഏകദേശ കണക്ക് സാധാരണയായി E(Y | X) = F(X, β) എന്നാണ് എഴുതുന്നത്. റിഗ്രഷൻ വിശകലനം നടത്താൻ, ഫംഗ്ഷന്റെ തരം നിർണ്ണയിക്കണം. സാധാരണയായി, ഡാറ്റയെ ആശ്രയിക്കാത്ത Y, X എന്നിവ തമ്മിലുള്ള ബന്ധത്തെക്കുറിച്ചുള്ള അറിവിനെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് ഇത്. അത്തരം അറിവ് ലഭ്യമല്ലെങ്കിൽ, ഫ്ലെക്സിബിൾ അല്ലെങ്കിൽ സൗകര്യപ്രദമായ ഫോം എഫ് തിരഞ്ഞെടുത്തു.

ആശ്രിത വേരിയബിൾ Y

അജ്ഞാത പാരാമീറ്ററുകളുടെ വെക്റ്റർ β ന് നീളം k ഉണ്ടെന്ന് നമുക്ക് അനുമാനിക്കാം. റിഗ്രഷൻ വിശകലനം നടത്താൻ, ഉപയോക്താവ് ആശ്രിത വേരിയബിളിനെക്കുറിച്ചുള്ള വിവരങ്ങൾ നൽകണം Y:

  • ഫോമിന്റെ (Y, X) N ഡാറ്റ പോയിന്റുകൾ നിരീക്ഷിക്കുകയാണെങ്കിൽ, ഇവിടെ N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • കൃത്യമായി N = K നിരീക്ഷിക്കുകയും F ഫംഗ്ഷൻ രേഖീയമാണെങ്കിൽ, Y = F(X, β) എന്ന സമവാക്യം ഏകദേശം പരിഹരിക്കുന്നതിന് പകരം കൃത്യമായി പരിഹരിക്കാൻ കഴിയും. X രേഖീയമായി സ്വതന്ത്രമായിരിക്കുന്നിടത്തോളം ഒരു അദ്വിതീയ പരിഹാരമുള്ള N-അജ്ഞാതങ്ങളുമായുള്ള (ഘടകങ്ങൾ β) ഒരു കൂട്ടം N-സമവാക്യങ്ങൾ പരിഹരിക്കുന്നതിന് ഇത് തുല്യമാണ്. F രേഖീയമല്ലാത്തതാണെങ്കിൽ, ഒരു പരിഹാരവും ഉണ്ടാകണമെന്നില്ല, അല്ലെങ്കിൽ പല പരിഹാരങ്ങളും നിലവിലുണ്ടാകാം.
  • N > ഡാറ്റാ പോയിന്റുകൾ നിരീക്ഷിക്കപ്പെടുന്നതാണ് ഏറ്റവും സാധാരണമായ സാഹചര്യം. ഈ സാഹചര്യത്തിൽ, ഡാറ്റയ്ക്ക് ഏറ്റവും അനുയോജ്യമായ β-നുള്ള ഒരു അദ്വിതീയ മൂല്യം കണക്കാക്കാൻ ആവശ്യമായ വിവരങ്ങൾ ഡാറ്റയിലുണ്ട്, കൂടാതെ ഡാറ്റയിലേക്കുള്ള ആപ്ലിക്കേഷൻ β-ൽ അമിതമായി നിർണ്ണയിക്കപ്പെട്ട സിസ്റ്റമായി കാണാൻ കഴിയുന്ന ഒരു റിഗ്രഷൻ മോഡലും.

പിന്നീടുള്ള സന്ദർഭത്തിൽ, റിഗ്രഷൻ വിശകലനം ഇതിനായി ഉപകരണങ്ങൾ നൽകുന്നു:

  • അജ്ഞാതമായ β പാരാമീറ്ററുകൾക്കുള്ള പരിഹാരം കണ്ടെത്തുന്നത്, ഉദാഹരണത്തിന്, Y യുടെ അളന്നതും പ്രവചിച്ചതുമായ മൂല്യം തമ്മിലുള്ള ദൂരം കുറയ്ക്കും.
  • ചില സ്റ്റാറ്റിസ്റ്റിക്കൽ അനുമാനങ്ങൾക്ക് കീഴിൽ, റിഗ്രഷൻ വിശകലനം അജ്ഞാതമായ പാരാമീറ്ററുകളെക്കുറിച്ച് സ്ഥിതിവിവരക്കണക്കുകൾ നൽകുന്നതിന് അധിക വിവരങ്ങൾ ഉപയോഗിക്കുന്നു β, ആശ്രിത വേരിയബിൾ Y യുടെ പ്രവചിച്ച മൂല്യങ്ങൾ.

ആവശ്യമായ സ്വതന്ത്ര അളവുകളുടെ എണ്ണം

മൂന്ന് അജ്ഞാത പാരാമീറ്ററുകൾ ഉള്ള ഒരു റിഗ്രഷൻ മോഡൽ പരിഗണിക്കുക: β 0 , β 1 ഒപ്പം β 2 . സ്വതന്ത്ര വേരിയബിൾ വെക്റ്റർ X ന്റെ അതേ മൂല്യത്തിൽ പരീക്ഷണം നടത്തുന്നയാൾ 10 അളവുകൾ നടത്തിയെന്ന് കരുതുക. ഈ സാഹചര്യത്തിൽ, റിഗ്രഷൻ വിശകലനം ഒരു തനതായ മൂല്യങ്ങൾ ഉണ്ടാക്കുന്നില്ല. നിങ്ങൾക്ക് ചെയ്യാൻ കഴിയുന്ന ഏറ്റവും മികച്ചത്, ആശ്രിത വേരിയബിളായ Y യുടെ ശരാശരിയും സ്റ്റാൻഡേർഡ് ഡീവിയേഷനും കണക്കാക്കുക എന്നതാണ്. അതുപോലെ, X ന്റെ രണ്ട് വ്യത്യസ്ത മൂല്യങ്ങൾ അളക്കുന്നതിലൂടെ, നിങ്ങൾക്ക് റിഗ്രഷനുവേണ്ടി ആവശ്യമായ ഡാറ്റ രണ്ട് അജ്ഞാതർ ഉപയോഗിച്ച് നേടാനാകും, എന്നാൽ മൂന്നോ അതിലധികമോ അജ്ഞാതർ ഉപയോഗിച്ചല്ല.

സ്വതന്ത്ര വേരിയബിൾ വെക്റ്റർ X ന്റെ മൂന്ന് വ്യത്യസ്ത മൂല്യങ്ങളിലാണ് പരീക്ഷണത്തിന്റെ അളവുകൾ നടത്തിയതെങ്കിൽ, റിഗ്രഷൻ വിശകലനം β-ലെ മൂന്ന് അജ്ഞാത പാരാമീറ്ററുകൾക്കായി ഒരു അദ്വിതീയ എസ്റ്റിമേറ്റ് നൽകും.

പൊതുവായ ലീനിയർ റിഗ്രഷന്റെ കാര്യത്തിൽ, മുകളിലെ പ്രസ്താവന, മാട്രിക്സ് X T X ഇൻവെർട്ടിബിൾ ആയിരിക്കണമെന്ന ആവശ്യത്തിന് തുല്യമാണ്.

സ്റ്റാറ്റിസ്റ്റിക്കൽ അനുമാനങ്ങൾ

അജ്ഞാത പാരാമീറ്ററുകളുടെ എണ്ണത്തേക്കാൾ N അളവുകളുടെ എണ്ണം കൂടുതലാണെങ്കിൽ കെ, അളക്കൽ പിശകുകൾ ε i , ഒരു ചട്ടം പോലെ, അളവുകളിൽ അടങ്ങിയിരിക്കുന്ന അധിക വിവരങ്ങൾ പിന്നീട് പ്രചരിപ്പിക്കുകയും അജ്ഞാത പാരാമീറ്ററുകളെക്കുറിച്ചുള്ള സ്ഥിതിവിവരക്കണക്കുകൾക്കായി ഉപയോഗിക്കുകയും ചെയ്യുന്നു. ഈ അധിക വിവരങ്ങളെ സ്വാതന്ത്ര്യത്തിന്റെ റിഗ്രഷൻ ഡിഗ്രി എന്ന് വിളിക്കുന്നു.

അടിസ്ഥാന അനുമാനങ്ങൾ

റിഗ്രഷൻ വിശകലനത്തിനുള്ള ക്ലാസിക് അനുമാനങ്ങളിൽ ഇവ ഉൾപ്പെടുന്നു:

  • അനുമാന പ്രവചനത്തിന്റെ പ്രതിനിധിയാണ് സാമ്പിൾ.
  • പിശക് പദം പൂജ്യത്തിന്റെ ശരാശരിയുള്ള ഒരു റാൻഡം വേരിയബിളാണ്, ഇത് വിശദീകരണ വേരിയബിളുകളിൽ സോപാധികമാണ്.
  • സ്വതന്ത്ര വേരിയബിളുകൾ പിശകുകളില്ലാതെ അളക്കുന്നു.
  • സ്വതന്ത്ര വേരിയബിളുകൾ (പ്രവചനങ്ങൾ) എന്ന നിലയിൽ, അവ രേഖീയമായി സ്വതന്ത്രമാണ്, അതായത്, മറ്റുള്ളവയുടെ രേഖീയ സംയോജനമായി ഒരു പ്രവചനത്തെയും പ്രകടിപ്പിക്കാൻ സാധ്യമല്ല.
  • പിശകുകൾ പരസ്പര ബന്ധമില്ലാത്തതാണ്, അതായത്, ഡയഗണലുകളുടെ പിശക് കോവേറിയൻസ് മാട്രിക്സ്, ഓരോ നോൺ-സീറോ മൂലകവും പിശക് വേരിയൻസ് ആണ്.
  • നിരീക്ഷണങ്ങളിൽ ഉടനീളം പിശക് വ്യത്യാസം സ്ഥിരമാണ് (ഹോമോസെഡാസ്റ്റിസിറ്റി). ഇല്ലെങ്കിൽ, ഭാരം കുറഞ്ഞ സ്ക്വയറുകളോ മറ്റ് രീതികളോ ഉപയോഗിക്കാം.

കുറഞ്ഞ ചതുരങ്ങൾ കണക്കാക്കുന്നതിനുള്ള ഈ മതിയായ വ്യവസ്ഥകൾക്ക് ആവശ്യമായ ഗുണങ്ങളുണ്ട്; പ്രത്യേകിച്ചും, ഈ അനുമാനങ്ങൾ അർത്ഥമാക്കുന്നത് പാരാമീറ്റർ എസ്റ്റിമേറ്റുകൾ വസ്തുനിഷ്ഠവും സ്ഥിരതയുള്ളതും കാര്യക്ഷമവുമായിരിക്കും, പ്രത്യേകിച്ചും ലീനിയർ എസ്റ്റിമേറ്ററുകളുടെ ക്ലാസിൽ കണക്കിലെടുക്കുമ്പോൾ. തെളിവുകൾ അപൂർവ്വമായി വ്യവസ്ഥകളെ തൃപ്തിപ്പെടുത്തുന്നു എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്. അതായത്, അനുമാനങ്ങൾ ശരിയല്ലെങ്കിലും രീതി ഉപയോഗിക്കുന്നു. അനുമാനങ്ങളിൽ നിന്നുള്ള വ്യതിയാനം ചിലപ്പോൾ മോഡൽ എത്രത്തോളം ഉപയോഗപ്രദമാണ് എന്നതിന്റെ അളവുകോലായി ഉപയോഗിക്കാം. ഈ അനുമാനങ്ങളിൽ പലതും കൂടുതൽ വിപുലമായ രീതികളിൽ അയവുവരുത്താവുന്നതാണ്. സ്റ്റാറ്റിസ്റ്റിക്കൽ അനാലിസിസ് റിപ്പോർട്ടുകളിൽ സാമ്പിൾ ഡാറ്റയെക്കുറിച്ചുള്ള ടെസ്റ്റുകളുടെ വിശകലനവും മോഡലിന്റെ ഉപയോഗത്തിനുള്ള രീതിശാസ്ത്രവും ഉൾപ്പെടുന്നു.

കൂടാതെ, ചില സന്ദർഭങ്ങളിൽ വേരിയബിളുകൾ പോയിന്റ് ലൊക്കേഷനുകളിൽ അളക്കുന്ന മൂല്യങ്ങളെ സൂചിപ്പിക്കുന്നു. സ്റ്റാറ്റിസ്റ്റിക്കൽ അനുമാനങ്ങൾ ലംഘിക്കുന്ന വേരിയബിളുകളിൽ സ്പേഷ്യൽ ട്രെൻഡുകളും സ്പേഷ്യൽ ഓട്ടോകോറിലേഷനുകളും ഉണ്ടാകാം. ഭൂമിശാസ്ത്രപരമായ വെയ്റ്റഡ് റിഗ്രഷൻ മാത്രമാണ് അത്തരം ഡാറ്റ കൈകാര്യം ചെയ്യുന്ന ഒരേയൊരു രീതി.

ലീനിയർ റിഗ്രഷന്റെ ഒരു സവിശേഷത, ആശ്രിത വേരിയബിൾ, അതായത് Yi, പരാമീറ്ററുകളുടെ ഒരു രേഖീയ സംയോജനമാണ്. ഉദാഹരണത്തിന്, ലളിതമായ ലീനിയർ റിഗ്രഷൻ ഒരു സ്വതന്ത്ര വേരിയബിൾ ഉപയോഗിക്കുന്നു, x i , കൂടാതെ രണ്ട് പാരാമീറ്ററുകൾ, β 0, β 1 എന്നിവ മോഡൽ n-പോയിന്റുകൾക്ക്.

ഒന്നിലധികം ലീനിയർ റിഗ്രഷനിൽ, ഒന്നിലധികം സ്വതന്ത്ര വേരിയബിളുകൾ അല്ലെങ്കിൽ അവയുടെ പ്രവർത്തനങ്ങൾ ഉണ്ട്.

ഒരു പോപ്പുലേഷനിൽ നിന്ന് റാൻഡം സാമ്പിൾ എടുക്കുമ്പോൾ, അതിന്റെ പാരാമീറ്ററുകൾ ഒരു സാമ്പിൾ ലീനിയർ റിഗ്രഷൻ മോഡൽ ലഭിക്കാൻ അനുവദിക്കുന്നു.

ഈ വശത്തിൽ, ഏറ്റവും ജനപ്രിയമായത് ഏറ്റവും കുറഞ്ഞ സ്ക്വയർ രീതിയാണ്. ചതുരാകൃതിയിലുള്ള അവശിഷ്ടങ്ങളുടെ ആകെത്തുക കുറയ്ക്കുന്ന പാരാമീറ്റർ എസ്റ്റിമേറ്റുകൾ ലഭിക്കാൻ ഇത് ഉപയോഗിക്കുന്നു. ഈ ഫംഗ്‌ഷന്റെ ഇത്തരത്തിലുള്ള മിനിമൈസേഷൻ (ഇത് ലീനിയർ റിഗ്രഷന്റെ സാധാരണമാണ്) ഒരു കൂട്ടം സാധാരണ സമവാക്യങ്ങളിലേക്കും പാരാമീറ്ററുകളുള്ള ഒരു കൂട്ടം ലീനിയർ സമവാക്യങ്ങളിലേക്കും നയിക്കുന്നു, അവ പാരാമീറ്റർ എസ്റ്റിമേറ്റുകൾ നേടുന്നതിന് പരിഹരിക്കുന്നു.

പോപ്പുലേഷൻ പിശക് പൊതുവെ പ്രചരിപ്പിക്കപ്പെടുന്നു എന്ന അനുമാനത്തിൽ, ഒരു ഗവേഷകന് ഈ സ്റ്റാൻഡേർഡ് പിശക് എസ്റ്റിമേറ്റുകൾ ഉപയോഗിച്ച് ആത്മവിശ്വാസ ഇടവേളകൾ സൃഷ്ടിക്കാനും അതിന്റെ പാരാമീറ്ററുകളെക്കുറിച്ച് അനുമാന പരിശോധനകൾ നടത്താനും കഴിയും.

നോൺ-ലീനിയർ റിഗ്രഷൻ വിശകലനം

പരാമീറ്ററുകളുമായി ബന്ധപ്പെട്ട് ഫംഗ്ഷൻ രേഖീയമല്ലാത്ത ഒരു ഉദാഹരണം, ഒരു ആവർത്തന നടപടിക്രമം ഉപയോഗിച്ച് സ്ക്വയറുകളുടെ ആകെത്തുക ചെറുതാക്കണമെന്ന് സൂചിപ്പിക്കുന്നു. ലീനിയർ, നോൺലീനിയർ മിനിമം സ്ക്വയർ രീതികൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ നിർവചിക്കുന്ന നിരവധി സങ്കീർണതകൾ ഇത് അവതരിപ്പിക്കുന്നു. തൽഫലമായി, ഒരു നോൺ-ലീനിയർ രീതി ഉപയോഗിക്കുമ്പോൾ റിഗ്രഷൻ വിശകലനത്തിന്റെ ഫലങ്ങൾ ചിലപ്പോൾ പ്രവചനാതീതമാണ്.

ശക്തിയുടെയും സാമ്പിൾ വലുപ്പത്തിന്റെയും കണക്കുകൂട്ടൽ

നിരീക്ഷണങ്ങളുടെ എണ്ണവും മോഡലിലെ സ്വതന്ത്ര വേരിയബിളുകളുടെ എണ്ണവും സംബന്ധിച്ച് സ്ഥിരമായ രീതികളൊന്നുമില്ല. ഡോബ്രയും ഹാർഡിനും നിർദ്ദേശിച്ച ആദ്യ നിയമം N = t^n പോലെ കാണപ്പെടുന്നു, ഇവിടെ N എന്നത് സാമ്പിൾ വലുപ്പമാണ്, n എന്നത് സ്വതന്ത്ര വേരിയബിളുകളുടെ എണ്ണമാണ്, കൂടാതെ t എന്നത് മോഡലിന് ആവശ്യമുള്ള കൃത്യത കൈവരിക്കാൻ ആവശ്യമായ നിരീക്ഷണങ്ങളുടെ എണ്ണമാണ്. ഒരു സ്വതന്ത്ര വേരിയബിൾ മാത്രം. ഉദാഹരണത്തിന്, 1000 രോഗികൾ (N) അടങ്ങുന്ന ഒരു ഡാറ്റാ സെറ്റ് ഉപയോഗിച്ച് ഒരു ഗവേഷകൻ ഒരു ലീനിയർ റിഗ്രഷൻ മോഡൽ നിർമ്മിക്കുന്നു. രേഖ (m) കൃത്യമായി നിർവചിക്കുന്നതിന് അഞ്ച് നിരീക്ഷണങ്ങൾ ആവശ്യമാണെന്ന് ഗവേഷകൻ തീരുമാനിക്കുകയാണെങ്കിൽ, മോഡലിന് പിന്തുണയ്ക്കാൻ കഴിയുന്ന സ്വതന്ത്ര വേരിയബിളുകളുടെ പരമാവധി എണ്ണം 4 ആണ്.

മറ്റ് രീതികൾ

റിഗ്രഷൻ മോഡൽ പാരാമീറ്ററുകൾ സാധാരണയായി ഏറ്റവും കുറഞ്ഞ സ്ക്വയർ രീതി ഉപയോഗിച്ചാണ് കണക്കാക്കുന്നതെങ്കിലും, വളരെ കുറച്ച് തവണ മാത്രം ഉപയോഗിക്കുന്ന മറ്റ് രീതികളുണ്ട്. ഉദാഹരണത്തിന്, ഇവ ഇനിപ്പറയുന്ന രീതികളാണ്:

  • ബയേസിയൻ രീതികൾ (ഉദാഹരണത്തിന്, ബയേസിയൻ ലീനിയർ റിഗ്രഷൻ).
  • ശതമാനം തെറ്റുകൾ കുറയ്ക്കുന്നത് കൂടുതൽ ഉചിതമെന്ന് കരുതുന്ന സാഹചര്യങ്ങളിൽ ഉപയോഗിക്കുന്ന ശതമാനം റിഗ്രഷൻ.
  • ഏറ്റവും ചെറിയ സമ്പൂർണ്ണ വ്യതിയാനങ്ങൾ, അത് ക്വാണ്ടൈൽ റിഗ്രഷനിലേക്ക് നയിക്കുന്ന ഔട്ട്‌ലയറുകളുടെ സാന്നിധ്യത്തിൽ കൂടുതൽ ശക്തമാണ്.
  • നോൺപാരാമെട്രിക് റിഗ്രഷൻ, ഇതിന് ധാരാളം നിരീക്ഷണങ്ങളും കണക്കുകൂട്ടലുകളും ആവശ്യമാണ്.
  • നൽകിയിരിക്കുന്ന ഇൻപുട്ട് സ്‌പെയ്‌സിൽ അർത്ഥവത്തായ ഒരു ഡിസ്റ്റൻസ് മെട്രിക് കണ്ടെത്താൻ പഠിച്ച വിദൂര പഠന മെട്രിക്.

സോഫ്റ്റ്വെയർ

എല്ലാ പ്രധാന സ്റ്റാറ്റിസ്റ്റിക്കൽ സോഫ്‌റ്റ്‌വെയർ പാക്കേജുകളും ഏറ്റവും കുറഞ്ഞ സ്‌ക്വയർ റിഗ്രഷൻ വിശകലനം നടത്തുന്നു. ചില സ്പ്രെഡ്ഷീറ്റ് ആപ്ലിക്കേഷനുകളിലും ചില കാൽക്കുലേറ്ററുകളിലും ലളിതമായ ലീനിയർ റിഗ്രഷനും മൾട്ടിപ്പിൾ റിഗ്രഷൻ വിശകലനവും ഉപയോഗിക്കാം. പല സ്റ്റാറ്റിസ്റ്റിക്കൽ സോഫ്‌റ്റ്‌വെയർ പാക്കേജുകൾക്കും വിവിധ തരം നോൺ-പാരാമെട്രിക്, റോബസ്റ്റ് റിഗ്രഷൻ ചെയ്യാൻ കഴിയുമെങ്കിലും, ഈ രീതികൾ നിലവാരം കുറഞ്ഞവയാണ്; വ്യത്യസ്ത സോഫ്‌റ്റ്‌വെയർ പാക്കേജുകൾ വ്യത്യസ്ത രീതികൾ നടപ്പിലാക്കുന്നു. പരീക്ഷാ വിശകലനം, ന്യൂറോ ഇമേജിംഗ് തുടങ്ങിയ മേഖലകളിൽ ഉപയോഗിക്കുന്നതിന് പ്രത്യേക റിഗ്രഷൻ സോഫ്റ്റ്‌വെയർ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്.

റിഗ്രഷൻ വിശകലനത്തിന്റെ പ്രധാന ലക്ഷ്യംഒന്നോ അതിലധികമോ ഘടകങ്ങളുടെ സ്വാധീനം മൂലമാണ് ഫലപ്രദമായ സ്വഭാവത്തിലെ മാറ്റം സംഭവിക്കുന്ന ആശയവിനിമയത്തിന്റെ വിശകലന രൂപം നിർണ്ണയിക്കുന്നത്, കൂടാതെ ഫലപ്രദമായ സ്വഭാവത്തെ സ്വാധീനിക്കുന്ന മറ്റെല്ലാ ഘടകങ്ങളുടെയും ഗണത്തെ സ്ഥിരവും ശരാശരി മൂല്യങ്ങളായി കണക്കാക്കുന്നു.
റിഗ്രഷൻ അനാലിസിസ് പ്രശ്നങ്ങൾ:
a) ആശ്രിതത്വത്തിന്റെ രൂപം സ്ഥാപിക്കൽ. പ്രതിഭാസങ്ങൾ തമ്മിലുള്ള ബന്ധത്തിന്റെ സ്വഭാവവും രൂപവും സംബന്ധിച്ച്, പോസിറ്റീവ് ലീനിയർ, നോൺലീനിയർ, നെഗറ്റീവ് ലീനിയർ, നോൺ ലീനിയർ റിഗ്രഷൻ എന്നിവ തമ്മിൽ വേർതിരിക്കപ്പെടുന്നു.
ബി) റിഗ്രഷൻ ഫംഗ്ഷൻ ഒരു തരം അല്ലെങ്കിൽ മറ്റൊന്നിന്റെ ഗണിത സമവാക്യത്തിന്റെ രൂപത്തിൽ നിർണ്ണയിക്കുകയും ആശ്രിത വേരിയബിളിൽ വിശദീകരണ വേരിയബിളുകളുടെ സ്വാധീനം സ്ഥാപിക്കുകയും ചെയ്യുന്നു.
c) ആശ്രിത വേരിയബിളിന്റെ അജ്ഞാത മൂല്യങ്ങളുടെ എസ്റ്റിമേഷൻ. റിഗ്രഷൻ ഫംഗ്ഷൻ ഉപയോഗിച്ച്, നിങ്ങൾക്ക് ആശ്രിത വേരിയബിളിന്റെ മൂല്യങ്ങൾ വിശദീകരണ വേരിയബിളുകളുടെ നിർദ്ദിഷ്ട മൂല്യങ്ങളുടെ ഇടവേളയിൽ പുനർനിർമ്മിക്കാം (അതായത്, ഇന്റർപോളേഷൻ പ്രശ്നം പരിഹരിക്കുക) അല്ലെങ്കിൽ നിർദ്ദിഷ്ട ഇടവേളയ്ക്ക് പുറത്തുള്ള പ്രക്രിയയുടെ ഗതി വിലയിരുത്തുക (അതായത്, എക്സ്ട്രാപോളേഷൻ പ്രശ്നം പരിഹരിക്കുക). ആശ്രിത വേരിയബിളിന്റെ മൂല്യത്തിന്റെ ഒരു എസ്റ്റിമേറ്റ് ആണ് ഫലം.

y, x: എന്നീ രണ്ട് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധത്തിന്റെ സമവാക്യമാണ് ജോടിയാക്കിയ റിഗ്രഷൻ, ഇവിടെ y എന്നത് ആശ്രിത വേരിയബിളാണ് (ഫലമായ ആട്രിബ്യൂട്ട്); x ഒരു സ്വതന്ത്ര വിശദീകരണ വേരിയബിളാണ് (സവിശേഷത-ഘടകം).

ലീനിയർ, നോൺലീനിയർ റിഗ്രഷനുകൾ ഉണ്ട്.
ലീനിയർ റിഗ്രഷൻ: y = a + bx + ε
നോൺ-ലീനിയർ റിഗ്രഷനുകളെ രണ്ട് ക്ലാസുകളായി തിരിച്ചിരിക്കുന്നു: വിശകലനത്തിൽ ഉൾപ്പെടുത്തിയിരിക്കുന്ന വിശദീകരണ വേരിയബിളുകളുമായി ബന്ധപ്പെട്ട് രേഖീയമല്ലാത്ത റിഗ്രഷനുകൾ, എന്നാൽ കണക്കാക്കിയ പാരാമീറ്ററുകളുമായി ബന്ധപ്പെട്ട് ലീനിയർ, കണക്കാക്കിയ പാരാമീറ്ററുകളുമായി ബന്ധപ്പെട്ട് രേഖീയമല്ലാത്ത റിഗ്രഷനുകൾ.
വിശദീകരണ വേരിയബിളുകളിൽ രേഖീയമല്ലാത്ത റിഗ്രഷനുകൾ:

കണക്കാക്കിയ പാരാമീറ്ററുകളുമായി ബന്ധപ്പെട്ട് രേഖീയമല്ലാത്ത റിഗ്രഷനുകൾ: ഒരു റിഗ്രഷൻ സമവാക്യത്തിന്റെ നിർമ്മാണം അതിന്റെ പാരാമീറ്ററുകൾ കണക്കാക്കുന്നതിലേക്ക് വരുന്നു. പാരാമീറ്ററുകളിലെ ലീനിയർ റിഗ്രഷനുകളുടെ പാരാമീറ്ററുകൾ കണക്കാക്കാൻ, ഏറ്റവും കുറഞ്ഞ സ്ക്വയർ രീതി (OLS) ഉപയോഗിക്കുന്നു. ഏറ്റവും കുറഞ്ഞ സ്ക്വയറുകളുടെ രീതി അത്തരം പാരാമീറ്റർ എസ്റ്റിമേറ്റുകൾ നേടുന്നത് സാധ്യമാക്കുന്നു, അതിൽ ഫലമായുണ്ടാകുന്ന സ്വഭാവ സവിശേഷതയായ y യുടെ യഥാർത്ഥ മൂല്യങ്ങളുടെ സ്ക്വയർ വ്യതിയാനങ്ങളുടെ ആകെത്തുക സൈദ്ധാന്തികമായവയിൽ നിന്ന് വളരെ കുറവാണ്, അതായത്.
.
ലീനിയർ, നോൺ-ലീനിയർ സമവാക്യങ്ങൾക്ക്, a, b എന്നിവയ്ക്കായി ഇനിപ്പറയുന്ന സിസ്റ്റം പരിഹരിച്ചിരിക്കുന്നു:

ഈ സിസ്റ്റത്തിൽ നിന്ന് പിന്തുടരുന്ന റെഡിമെയ്ഡ് ഫോർമുലകൾ നിങ്ങൾക്ക് ഉപയോഗിക്കാം:

പഠിക്കുന്ന പ്രതിഭാസങ്ങൾ തമ്മിലുള്ള ബന്ധത്തിന്റെ അടുപ്പം ലീനിയർ റിഗ്രഷനുള്ള ജോഡി കോറിലേഷന്റെ ലീനിയർ കോഫിഫിഷ്യന്റ് വിലയിരുത്തുന്നു:

പരസ്പര ബന്ധ സൂചികയും - നോൺ ലീനിയർ റിഗ്രഷനു വേണ്ടി:

നിർമ്മിത മോഡലിന്റെ ഗുണനിലവാരം നിർണ്ണയത്തിന്റെ കോഫിഫിഷ്യന്റ് (ഇൻഡക്സ്), അതുപോലെ തന്നെ ഏകദേശത്തിന്റെ ശരാശരി പിശക് എന്നിവയാൽ വിലയിരുത്തപ്പെടും.
ശരാശരി ഏകദേശ പിശക് - യഥാർത്ഥ മൂല്യങ്ങളിൽ നിന്ന് കണക്കാക്കിയ മൂല്യങ്ങളുടെ ശരാശരി വ്യതിയാനം:
.
മൂല്യങ്ങളുടെ അനുവദനീയമായ പരിധി 8-10% ൽ കൂടുതലല്ല.
ഫാക്ടർ x അതിന്റെ ശരാശരി മൂല്യത്തിൽ നിന്ന് 1% മാറുമ്പോൾ ഫലം y അതിന്റെ ശരാശരി മൂല്യത്തിൽ നിന്ന് എത്ര ശതമാനം മാറുമെന്ന് ശരാശരി ഇലാസ്തികത ഗുണകം കാണിക്കുന്നു:
.

ആശ്രിത വേരിയബിളിന്റെ വ്യത്യാസം വിശകലനം ചെയ്യുക എന്നതാണ് വ്യതിയാനത്തിന്റെ വിശകലനത്തിന്റെ ലക്ഷ്യം:
,
ചതുരാകൃതിയിലുള്ള വ്യതിയാനങ്ങളുടെ ആകെ തുക എവിടെയാണ്;
- റിഗ്രഷൻ മൂലമുള്ള ചതുരാകൃതിയിലുള്ള വ്യതിയാനങ്ങളുടെ ആകെത്തുക ("വിശദീകരിച്ചത്" അല്ലെങ്കിൽ "ഘടകാംശം");
- ചതുരാകൃതിയിലുള്ള വ്യതിയാനങ്ങളുടെ ശേഷിക്കുന്ന തുക.
തത്ഫലമായുണ്ടാകുന്ന സ്വഭാവസവിശേഷതയായ y യുടെ മൊത്തത്തിലുള്ള വ്യതിയാനത്തിൽ റിഗ്രഷൻ വഴി വിശദീകരിക്കുന്ന വ്യതിയാനത്തിന്റെ പങ്ക് നിർണ്ണയിക്കുന്നത് R2-ന്റെ ഗുണകം (സൂചിക) ആണ്:

കോഫിഫിഷ്യന്റ് അല്ലെങ്കിൽ കോറിലേഷൻ ഇൻഡക്സിന്റെ ചതുരമാണ് നിർണ്ണയത്തിന്റെ ഗുണകം.

എഫ്-ടെസ്റ്റ് - റിഗ്രഷൻ സമവാക്യത്തിന്റെ ഗുണനിലവാരം വിലയിരുത്തൽ - റിഗ്രഷൻ സമവാക്യത്തിന്റെ സ്ഥിതിവിവരക്കണക്ക് അപ്രധാനവും ബന്ധത്തിന്റെ സാമീപ്യത്തിന്റെ സൂചകവും സംബന്ധിച്ച പരികല്പന No പരിശോധിക്കുന്നത് ഉൾക്കൊള്ളുന്നു. ഇത് ചെയ്യുന്നതിന്, യഥാർത്ഥ എഫ് വസ്തുതയും ഫിഷർ എഫ് മാനദണ്ഡത്തിന്റെ നിർണായകമായ (പട്ടിക) എഫ് പട്ടിക മൂല്യങ്ങളും തമ്മിൽ താരതമ്യം ചെയ്യുന്നു. എഫ് വസ്തുത നിർണ്ണയിക്കുന്നത് ഘടകത്തിന്റെയും അവശിഷ്ട വ്യതിയാനങ്ങളുടെയും മൂല്യങ്ങളുടെ അനുപാതത്തിൽ നിന്ന് സ്വാതന്ത്ര്യത്തിന്റെ ഡിഗ്രിയിൽ കണക്കാക്കുന്നു:
,
ഇവിടെ n എന്നത് ജനസംഖ്യാ യൂണിറ്റുകളുടെ എണ്ണമാണ്; m എന്നത് വേരിയബിളുകൾക്കുള്ള പാരാമീറ്ററുകളുടെ എണ്ണമാണ് x.
എഫ് പട്ടിക എന്നത് ഒരു നിശ്ചിത അളവിലുള്ള സ്വാതന്ത്ര്യത്തിലും പ്രാധാന്യത്തിലും ക്രമരഹിതമായ ഘടകങ്ങളുടെ സ്വാധീനത്തിൽ മാനദണ്ഡത്തിന്റെ പരമാവധി സാധ്യമായ മൂല്യമാണ്. പ്രാധാന്യം ലെവൽ a എന്നത് ശരിയായ സിദ്ധാന്തം ശരിയാണെങ്കിൽ അത് നിരസിക്കാനുള്ള സാധ്യതയാണ്. സാധാരണയായി a എന്നത് 0.05 അല്ലെങ്കിൽ 0.01 ന് തുല്യമാണ്.
എഫ് ടേബിൾ ആണെങ്കിൽ< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >എഫ് വസ്തുത, അപ്പോൾ എച്ച് ഒ എന്ന പരികല്പന നിരസിക്കപ്പെടുന്നില്ല, കൂടാതെ റിഗ്രഷൻ സമവാക്യത്തിന്റെ സ്റ്റാറ്റിസ്റ്റിക്കൽ അപ്രധാനതയും വിശ്വാസ്യതയും തിരിച്ചറിയപ്പെടുന്നു.
റിഗ്രഷൻ, കോറിലേഷൻ കോഫിഫിഷ്യന്റുകളുടെ സ്ഥിതിവിവരക്കണക്ക് പ്രാധാന്യം വിലയിരുത്തുന്നതിന്, ഓരോ സൂചകത്തിനുമുള്ള വിദ്യാർത്ഥികളുടെ ടി-ടെസ്റ്റും ആത്മവിശ്വാസ ഇടവേളകളും കണക്കാക്കുന്നു. സൂചകങ്ങളുടെ ക്രമരഹിതമായ സ്വഭാവത്തെക്കുറിച്ച് ഒരു സിദ്ധാന്തം മുന്നോട്ട് വയ്ക്കുന്നു, അതായത്. പൂജ്യത്തിൽ നിന്നുള്ള അവരുടെ നിസ്സാരമായ വ്യത്യാസത്തെക്കുറിച്ച്. വിദ്യാർത്ഥികളുടെ ടി-ടെസ്റ്റ് ഉപയോഗിച്ച് റിഗ്രഷൻ, കോറിലേഷൻ കോഫിഫിഷ്യന്റുകളുടെ പ്രാധാന്യം വിലയിരുത്തുന്നത് അവയുടെ മൂല്യങ്ങളെ ക്രമരഹിതമായ പിശകിന്റെ വ്യാപ്തിയുമായി താരതമ്യം ചെയ്തുകൊണ്ടാണ്:
; ; .
ലീനിയർ റിഗ്രഷൻ പാരാമീറ്ററുകളുടെയും കോറിലേഷൻ കോഫിഫിഷ്യന്റിന്റെയും ക്രമരഹിതമായ പിശകുകൾ സൂത്രവാക്യങ്ങളാൽ നിർണ്ണയിക്കപ്പെടുന്നു:



ടി-സ്റ്റാറ്റിസ്റ്റിക്സിന്റെ യഥാർത്ഥവും നിർണായകവുമായ (പട്ടിക) മൂല്യങ്ങൾ താരതമ്യപ്പെടുത്തുമ്പോൾ - t ടേബിളും t വസ്തുതയും - ഞങ്ങൾ Ho എന്ന സിദ്ധാന്തം അംഗീകരിക്കുകയോ നിരസിക്കുകയോ ചെയ്യുന്നു.
ഫിഷർ എഫ്-ടെസ്റ്റും സ്റ്റുഡന്റ് ടി-സ്റ്റാറ്റിസ്റ്റിക്സും തമ്മിലുള്ള ബന്ധം തുല്യതയാൽ പ്രകടിപ്പിക്കപ്പെടുന്നു

ടി ടേബിൾ ആണെങ്കിൽ< t факт то H o отклоняется, т.е. a, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t എന്നത് പരികല്പന Ho നിരസിക്കപ്പെടുന്നില്ല എന്നതും a, b അല്ലെങ്കിൽ രൂപീകരണത്തിന്റെ ക്രമരഹിതമായ സ്വഭാവം അംഗീകരിക്കപ്പെട്ടതുമാണ്.
ആത്മവിശ്വാസ ഇടവേള കണക്കാക്കാൻ, ഓരോ സൂചകത്തിനും ഞങ്ങൾ പരമാവധി പിശക് D നിർണ്ണയിക്കുന്നു:
, .
ആത്മവിശ്വാസ ഇടവേളകൾ കണക്കാക്കുന്നതിനുള്ള സൂത്രവാക്യങ്ങൾ ഇനിപ്പറയുന്നവയാണ്:
; ;
; ;
ആത്മവിശ്വാസ ഇടവേളയിൽ പൂജ്യം വീഴുകയാണെങ്കിൽ, അതായത്. താഴ്ന്ന പരിധി നെഗറ്റീവ് ആണെങ്കിൽ, ഉയർന്ന പരിധി പോസിറ്റീവ് ആണെങ്കിൽ, കണക്കാക്കിയ പാരാമീറ്റർ പൂജ്യമായി കണക്കാക്കുന്നു, കാരണം ഇതിന് ഒരേസമയം പോസിറ്റീവ്, നെഗറ്റീവ് മൂല്യങ്ങൾ എടുക്കാൻ കഴിയില്ല.
റിഗ്രഷൻ സമവാക്യത്തിലേക്ക് അനുബന്ധ (പ്രവചനം) മൂല്യം പകരം വച്ചാണ് പ്രവചന മൂല്യം നിർണ്ണയിക്കുന്നത്. പ്രവചനത്തിന്റെ ശരാശരി സാധാരണ പിശക് കണക്കാക്കുന്നു:
,
എവിടെ
പ്രവചനത്തിനായുള്ള ഒരു ആത്മവിശ്വാസ ഇടവേള നിർമ്മിച്ചിരിക്കുന്നു:
; ;
എവിടെ .

ഉദാഹരണ പരിഹാരം

ടാസ്ക് നമ്പർ 1. 199X-ൽ യുറൽ മേഖലയിലെ ഏഴ് പ്രദേശങ്ങൾക്ക്, രണ്ട് സ്വഭാവസവിശേഷതകളുടെ മൂല്യങ്ങൾ അറിയപ്പെടുന്നു.
പട്ടിക 1.
ആവശ്യമാണ്: 1. x-ൽ y യുടെ ആശ്രിതത്വം വ്യക്തമാക്കുന്നതിന്, ഇനിപ്പറയുന്ന ഫംഗ്‌ഷനുകളുടെ പാരാമീറ്ററുകൾ കണക്കാക്കുക:
a) ലീനിയർ;
b) പവർ (രണ്ട് ഭാഗങ്ങളുടെയും ലോഗരിതം എടുത്ത് വേരിയബിളുകളുടെ രേഖീയവൽക്കരണ നടപടിക്രമം നിങ്ങൾ ആദ്യം നടത്തണം);
സി) പ്രകടനാത്മകം;
d) ഒരു ഇക്വിലാറ്ററൽ ഹൈപ്പർബോള (ഈ മോഡലിനെ എങ്ങനെ പ്രീ-ലീനിയറൈസ് ചെയ്യാമെന്നും നിങ്ങൾ കണ്ടെത്തേണ്ടതുണ്ട്).
2. ഏകദേശത്തിന്റെ ശരാശരി പിശകും ഫിഷേഴ്‌സ് എഫ് ടെസ്റ്റും ഉപയോഗിച്ച് ഓരോ മോഡലും വിലയിരുത്തുക.

പരിഹാരം (ഓപ്ഷൻ നമ്പർ 1)

ലീനിയർ റിഗ്രഷന്റെ a, b പരാമീറ്ററുകൾ കണക്കാക്കാൻ (ഒരു കാൽക്കുലേറ്റർ ഉപയോഗിച്ച് കണക്കുകൂട്ടൽ നടത്താം).
സാധാരണ സമവാക്യങ്ങളുടെ ഒരു സിസ്റ്റം പരിഹരിക്കുക ഒപ്പം ബി:
പ്രാരംഭ ഡാറ്റയെ അടിസ്ഥാനമാക്കി, ഞങ്ങൾ കണക്കാക്കുന്നു :
വൈ x yx x 2 y 2 എ ഐ
എൽ 68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
ആകെ 405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
ബുധൻ. അർത്ഥം (ആകെ/എൻ) 57,89 54,90 3166,05 3048,34 3383,68 എക്സ് എക്സ് 8,1
എസ് 5,74 5,86 എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ്
s 2 32,92 34,34 എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ്


റിഗ്രഷൻ സമവാക്യം: y = 76,88 - 0,35എക്സ്.ശരാശരി പ്രതിദിന വേതനത്തിൽ 1 റബ്ബിന്റെ വർദ്ധനവ്. ഭക്ഷ്യ ഉൽപന്നങ്ങൾ വാങ്ങുന്നതിനുള്ള ചെലവുകളുടെ വിഹിതം ശരാശരി 0.35 ശതമാനം പോയിന്റ് കുറയുന്നു.
നമുക്ക് ലീനിയർ ജോഡി കോറിലേഷൻ കോഫിഫിഷ്യന്റ് കണക്കാക്കാം:

കണക്ഷൻ മിതമായതും വിപരീതവുമാണ്.
നമുക്ക് നിർണ്ണയത്തിന്റെ ഗുണകം നിർണ്ണയിക്കാം:

ഫലത്തിലെ 12.7% വ്യത്യാസം x ഘടകത്തിലെ വ്യതിയാനത്താൽ വിശദീകരിക്കപ്പെടുന്നു. റിഗ്രഷൻ സമവാക്യത്തിലേക്ക് യഥാർത്ഥ മൂല്യങ്ങൾ മാറ്റിസ്ഥാപിക്കുന്നു X,നമുക്ക് സൈദ്ധാന്തിക (കണക്കാക്കിയ) മൂല്യങ്ങൾ നിർണ്ണയിക്കാം . ശരാശരി ഏകദേശ പിശകിന്റെ മൂല്യം നമുക്ക് കണ്ടെത്താം:

ശരാശരി, കണക്കാക്കിയ മൂല്യങ്ങൾ യഥാർത്ഥ മൂല്യങ്ങളിൽ നിന്ന് 8.1% വ്യതിചലിക്കുന്നു.
നമുക്ക് F-മാനദണ്ഡം കണക്കാക്കാം:

1 മുതൽ< എഫ് < ¥ , പരിഗണിക്കണം എഫ് -1 .
തത്ഫലമായുണ്ടാകുന്ന മൂല്യം അനുമാനം അംഗീകരിക്കേണ്ടതിന്റെ ആവശ്യകതയെ സൂചിപ്പിക്കുന്നു എന്നാൽ ഓതിരിച്ചറിഞ്ഞ ആശ്രിതത്വത്തിന്റെ ക്രമരഹിതമായ സ്വഭാവവും സമവാക്യത്തിന്റെ പാരാമീറ്ററുകളുടെ സ്ഥിതിവിവരക്കണക്ക് അപ്രധാനവും കണക്ഷന്റെ അടുപ്പത്തിന്റെ സൂചകവും.
1ബി.ഒരു പവർ മോഡലിന്റെ നിർമ്മാണത്തിന് മുമ്പായി വേരിയബിളുകളുടെ രേഖീയവൽക്കരണ നടപടിക്രമം നടത്തുന്നു. ഉദാഹരണത്തിൽ, സമവാക്യത്തിന്റെ ഇരുവശങ്ങളുടെയും ലോഗരിതം എടുത്താണ് രേഖീയവൽക്കരണം നടത്തുന്നത്:


എവിടെY=lg(y), X=lg(x), C=lg(a).

കണക്കുകൂട്ടലുകൾക്കായി ഞങ്ങൾ പട്ടികയിലെ ഡാറ്റ ഉപയോഗിക്കുന്നു. 1.3

പട്ടിക 1.3

വൈ എക്സ് YX Y2 X 2 എ ഐ
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
ആകെ 12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
ശരാശരി മൂല്യം 1,7605 1,7370 3,0572 3,1011 3,0194 എക്സ് എക്സ് 28,27 8,0
σ 0,0425 0,0484 എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ്
σ 2 0,0018 0,0023 എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ്

നമുക്ക് സിയും ബിയും കണക്കാക്കാം:


നമുക്ക് ഒരു രേഖീയ സമവാക്യം ലഭിക്കും: .
അതിന്റെ ശക്തി നിർവഹിച്ചുകഴിഞ്ഞാൽ, നമുക്ക് ലഭിക്കുന്നു:

ഈ സമവാക്യത്തിലേക്ക് യഥാർത്ഥ മൂല്യങ്ങൾ മാറ്റിസ്ഥാപിക്കുന്നു X,ഫലത്തിന്റെ സൈദ്ധാന്തിക മൂല്യങ്ങൾ ഞങ്ങൾ നേടുന്നു. അവ ഉപയോഗിച്ച്, ഞങ്ങൾ സൂചകങ്ങൾ കണക്കാക്കും: കണക്ഷന്റെ ഇറുകിയ - പരസ്പര ബന്ധ സൂചികയും ശരാശരി ഏകദേശ പിശകും

പവർ-ലോ മോഡലിന്റെ സവിശേഷതകൾ സൂചിപ്പിക്കുന്നത് അത് രേഖീയ പ്രവർത്തനത്തേക്കാൾ മികച്ച ബന്ധത്തെ വിവരിക്കുന്നു എന്നാണ്.

1c. ഒരു എക്‌സ്‌പോണൻഷ്യൽ കർവിന്റെ സമവാക്യം നിർമ്മിക്കുന്നു

സമവാക്യത്തിന്റെ ഇരുവശങ്ങളുടേയും ലോഗരിതം എടുത്ത് വേരിയബിളുകളെ രേഖീയമാക്കുന്നതിനുള്ള ഒരു നടപടിക്രമത്തിന് മുമ്പായി:

കണക്കുകൂട്ടലുകൾക്കായി ഞങ്ങൾ പട്ടിക ഡാറ്റ ഉപയോഗിക്കുന്നു.

വൈ x Yx Y2 x 2 എ ഐ
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
ആകെ 12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
ബുധൻ. zn. 1,7605 54,9 96,5711 3,1011 3048,34 എക്സ് എക്സ് 28,68 8,0
σ 0,0425 5,86 എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ്
σ 2 0,0018 34,339 എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ് എക്സ്

റിഗ്രഷൻ പാരാമീറ്ററുകളുടെ മൂല്യങ്ങൾ എ ഒപ്പം INതുക:


തത്ഫലമായുണ്ടാകുന്ന രേഖീയ സമവാക്യം ഇതാണ്: . തത്ഫലമായുണ്ടാകുന്ന സമവാക്യം നമുക്ക് ശക്തമാക്കി സാധാരണ രൂപത്തിൽ എഴുതാം:

പരസ്പര ബന്ധ സൂചികയിലൂടെ കണക്ഷന്റെ അടുപ്പം ഞങ്ങൾ വിലയിരുത്തും:

വൈ=എഫ്(x), സ്വതന്ത്ര വേരിയബിളിന്റെ ഓരോ മൂല്യവും വരുമ്പോൾ xഅളവിന്റെ ഒരു പ്രത്യേക മൂല്യവുമായി പൊരുത്തപ്പെടുന്നു വൈ, അതേ മൂല്യത്തിലേക്ക് റിഗ്രഷൻ കണക്ഷനോടൊപ്പം xകേസിനെ ആശ്രയിച്ച് അളവിന്റെ വ്യത്യസ്ത മൂല്യങ്ങളുമായി പൊരുത്തപ്പെടാം വൈ. ഓരോ മൂല്യത്തിനും എങ്കിൽ x=x iനിരീക്ഷിച്ചു എൻ ഐമൂല്യങ്ങൾ വൈ 1 …വൈ ഇൻ 1 കാന്തിമാനം വൈ, അപ്പോൾ ഗണിതത്തിന്റെ ആശ്രിതത്വം അർത്ഥമാക്കുന്നത് =( വൈ 1 +…+വൈ ഇൻ 1)/എൻ ഐനിന്ന് x=x iഈ പദത്തിന്റെ സ്ഥിതിവിവരക്കണക്ക് അർത്ഥത്തിൽ ഒരു റിഗ്രഷൻ ആണ്.

സ്ഥിതിവിവരക്കണക്കിലെ ഈ പദം ആദ്യമായി ഉപയോഗിച്ചത് ഫ്രാൻസിസ് ഗാൽട്ടൺ (1886) മനുഷ്യന്റെ ശാരീരിക സ്വഭാവസവിശേഷതകളുടെ പാരമ്പര്യത്തെക്കുറിച്ചുള്ള പഠനവുമായി ബന്ധപ്പെട്ടാണ്. മനുഷ്യന്റെ ഉയരം സ്വഭാവസവിശേഷതകളിൽ ഒന്നായി എടുത്തു; പൊതുവേ, ഉയരമുള്ള പിതാക്കന്മാരുടെ മക്കൾ, ഉയരം കുറഞ്ഞ പിതാക്കന്മാരുടെ മക്കളേക്കാൾ ഉയരമുള്ളവരായി മാറിയതിൽ അതിശയിക്കാനില്ല. മക്കളുടെ ഉയരങ്ങളിലെ വ്യത്യാസം അച്ഛന്റെ ഉയരങ്ങളിലെ വ്യത്യാസത്തേക്കാൾ ചെറുതായിരുന്നു എന്നതാണ് കൂടുതൽ രസകരമായത്. മക്കളുടെ ഉയരം ശരാശരിയിലേക്ക് മടങ്ങാനുള്ള പ്രവണത പ്രകടമായത് ഇങ്ങനെയാണ് ( മധ്യസ്ഥതയിലേക്കുള്ള പിന്മാറ്റം), അതായത്, "റിഗ്രഷൻ". 56 ഇഞ്ച് ഉയരമുള്ള പിതാക്കന്മാരുടെ മക്കളുടെ ശരാശരി ഉയരം കണക്കാക്കി, 58 ഇഞ്ച് ഉയരമുള്ള പിതാക്കന്മാരുടെ മക്കളുടെ ശരാശരി ഉയരം കണക്കാക്കി ഈ വസ്തുത തെളിയിക്കപ്പെട്ടു. തുടർന്ന് ഓർഡിനേറ്റിനൊപ്പം ഒരു വിമാനത്തിൽ വെച്ച് ഫലങ്ങൾ ആസൂത്രണം ചെയ്തു. ആൺമക്കളുടെ ശരാശരി ഉയരം പ്ലോട്ട് ചെയ്ത അക്ഷം. , x-അക്ഷത്തിൽ - പിതാക്കന്മാരുടെ ശരാശരി ഉയരത്തിന്റെ മൂല്യങ്ങൾ. പോയിന്റുകൾ (ഏകദേശം) 45°-ൽ താഴെ ചെരിവിന്റെ പോസിറ്റീവ് കോൺ ഉള്ള ഒരു നേർരേഖയിൽ കിടക്കുന്നു; റിഗ്രഷൻ രേഖീയമായിരുന്നു എന്നത് പ്രധാനമാണ്.

അതിനാൽ, ഒരു ജോടി റാൻഡം വേരിയബിളുകളുടെ ബൈവേരിയേറ്റ് ഡിസ്ട്രിബ്യൂഷനിൽ നിന്ന് ഒരു സാമ്പിൾ ഉണ്ടെന്ന് പറയാം ( എക്സ്, വൈ). വിമാനത്തിലെ നേർരേഖ ( x, y) ഫംഗ്ഷന്റെ തിരഞ്ഞെടുത്ത അനലോഗ് ആയിരുന്നു

ഈ ഉദാഹരണത്തിൽ, റിഗ്രഷൻ വൈഓൺ എക്സ്ഒരു രേഖീയ പ്രവർത്തനമാണ്. റിഗ്രഷൻ എങ്കിൽ വൈഓൺ എക്സ്ലീനിയറിൽ നിന്ന് വ്യത്യസ്തമാണ്, അപ്പോൾ നൽകിയിരിക്കുന്ന സമവാക്യങ്ങൾ യഥാർത്ഥ റിഗ്രഷൻ സമവാക്യത്തിന്റെ രേഖീയ ഏകദേശമാണ്.

പൊതുവേ, ഒരു റാൻഡം വേരിയബിളിന്റെ റിഗ്രഷൻ മറ്റൊന്നിൽ രേഖീയമായിരിക്കണമെന്നില്ല. ക്രമരഹിതമായ രണ്ട് വേരിയബിളുകളിലേക്ക് സ്വയം പരിമിതപ്പെടുത്തേണ്ട ആവശ്യമില്ല. റിഗ്രഷൻ സമവാക്യത്തിന്റെ പൊതുവായ രൂപം നിർണ്ണയിക്കുക, റിഗ്രഷൻ സമവാക്യത്തിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ള അജ്ഞാത പാരാമീറ്ററുകളുടെ എസ്റ്റിമേറ്റ് നിർമ്മിക്കുക, റിഗ്രഷൻ സംബന്ധിച്ച സ്റ്റാറ്റിസ്റ്റിക്കൽ അനുമാനങ്ങൾ പരീക്ഷിക്കുക എന്നിവ സ്റ്റാറ്റിസ്റ്റിക്കൽ റിഗ്രഷൻ പ്രശ്നങ്ങളിൽ ഉൾപ്പെടുന്നു. റിഗ്രഷൻ വിശകലനത്തിന്റെ ചട്ടക്കൂടിനുള്ളിൽ ഈ പ്രശ്നങ്ങൾ പരിഹരിക്കപ്പെടുന്നു.

പിന്നോക്കാവസ്ഥയുടെ ഒരു ലളിതമായ ഉദാഹരണം വൈഎഴുതിയത് എക്സ്തമ്മിലുള്ള ബന്ധമാണ് വൈഒപ്പം എക്സ്, ഇത് ബന്ധത്താൽ പ്രകടിപ്പിക്കുന്നു: വൈ=യു(എക്സ്)+ε, എവിടെ യു(x)=(വൈ | എക്സ്=x), റാൻഡം വേരിയബിളുകൾ എക്സ്ε എന്നിവ സ്വതന്ത്രമാണ്. പ്രവർത്തനപരമായ കണക്റ്റിവിറ്റി പഠിക്കാൻ ഒരു പരീക്ഷണം രൂപകൽപ്പന ചെയ്യുമ്പോൾ ഈ പ്രാതിനിധ്യം ഉപയോഗപ്രദമാണ് വൈ=യു(x) ക്രമരഹിതമായ അളവുകൾക്കിടയിൽ വൈഒപ്പം x. പ്രായോഗികമായി, സമവാക്യത്തിലെ റിഗ്രഷൻ ഗുണകങ്ങൾ. വൈ=യു(x) അജ്ഞാതവും പരീക്ഷണാത്മക ഡാറ്റയിൽ നിന്ന് കണക്കാക്കിയവയുമാണ്.

ലീനിയർ റിഗ്രഷൻ (പ്രോപെഡ്യൂട്ടിക്സ്)

ആശ്രിതത്വം നമുക്ക് സങ്കൽപ്പിക്കാം വൈനിന്ന് xഒരു ഫസ്റ്റ് ഓർഡർ ലീനിയർ മോഡലിന്റെ രൂപത്തിൽ:

മൂല്യങ്ങൾ എന്ന് ഞങ്ങൾ അനുമാനിക്കും xപിശക് കൂടാതെ നിർണ്ണയിക്കപ്പെടുന്നു, β 0, β 1 എന്നിവയാണ് മോഡൽ പാരാമീറ്ററുകൾ, കൂടാതെ ε എന്നത് പിശകാണ്, ഇതിന്റെ വിതരണം പൂജ്യം ശരാശരി മൂല്യവും സ്ഥിരമായ വ്യതിയാനവും σ 2 ഉള്ള സാധാരണ നിയമം അനുസരിക്കുന്നു. β പാരാമീറ്ററുകളുടെ മൂല്യങ്ങൾ മുൻകൂട്ടി അറിയില്ല, അവ ഒരു കൂട്ടം പരീക്ഷണ മൂല്യങ്ങളിൽ നിന്ന് നിർണ്ണയിക്കണം ( x i, y i), =1, …, എൻ. അങ്ങനെ നമുക്ക് എഴുതാം:

മോഡൽ പ്രവചിച്ച മൂല്യം എന്നാണ് ഇവിടെ അർത്ഥമാക്കുന്നത് വൈനൽകിയത് x, ബി 0 ഒപ്പം ബി 1 - മോഡൽ പാരാമീറ്ററുകളുടെ സാമ്പിൾ എസ്റ്റിമേറ്റുകൾ, കൂടാതെ - ഏകദേശ പിശകുകളുടെ മൂല്യങ്ങൾ.

തന്നിരിക്കുന്ന മോഡലിന്റെ പാരാമീറ്ററുകളും അവയുടെ വ്യതിയാനങ്ങളും കണക്കാക്കുന്നതിന് ഏറ്റവും കുറഞ്ഞ സ്ക്വയർ രീതി ഇനിപ്പറയുന്ന ഫോർമുലകൾ നൽകുന്നു:

ഇവിടെ ശരാശരി മൂല്യങ്ങൾ സാധാരണ പോലെ നിർണ്ണയിക്കപ്പെടുന്നു: , കൂടാതെ എസ് ഇ 2 റിഗ്രഷൻ അവശിഷ്ടത്തെ സൂചിപ്പിക്കുന്നു, ഇത് മോഡൽ ശരിയാണെങ്കിൽ σ 2 വ്യതിയാനത്തിന്റെ ഏകദേശമാണ്.

റിഗ്രഷൻ കോഫിഫിഷ്യന്റുകളുടെ സ്റ്റാൻഡേർഡ് പിശകുകൾ ശരാശരിയുടെ സ്റ്റാൻഡേർഡ് പിശകിന് സമാനമായി ഉപയോഗിക്കുന്നു - ആത്മവിശ്വാസ ഇടവേളകൾ കണ്ടെത്തുന്നതിനും അനുമാനങ്ങൾ പരിശോധിക്കുന്നതിനും. ഉദാഹരണത്തിന്, റിഗ്രഷൻ കോഫിഫിഷ്യന്റ് പൂജ്യത്തിന് തുല്യമാണ്, അതായത് മോഡലിന് അത് അപ്രധാനമാണ് എന്ന സിദ്ധാന്തം പരിശോധിക്കാൻ ഞങ്ങൾ വിദ്യാർത്ഥികളുടെ പരിശോധന ഉപയോഗിക്കുന്നു. വിദ്യാർത്ഥികളുടെ സ്ഥിതിവിവരക്കണക്കുകൾ: ടി=ബി/എസ് ബി. ലഭിച്ച മൂല്യത്തിനായുള്ള പ്രോബബിലിറ്റി ആണെങ്കിൽ ഒപ്പം എൻ−2 ഡിഗ്രി സ്വാതന്ത്ര്യം വളരെ ചെറുതാണ്, ഉദാഹരണത്തിന്,<0,05 - гипотеза отвергается. Напротив, если нет оснований отвергнуть гипотезу о равенстве нулю, скажем ബി 1 - കുറഞ്ഞത് ഈ രൂപത്തിലെങ്കിലും ആവശ്യമുള്ള റിഗ്രഷന്റെ നിലനിൽപ്പിനെക്കുറിച്ചോ അധിക നിരീക്ഷണങ്ങൾ ശേഖരിക്കുന്നതിനെക്കുറിച്ചോ ചിന്തിക്കാൻ കാരണമുണ്ട്. സ്വതന്ത്ര പദം പൂജ്യത്തിന് തുല്യമാണെങ്കിൽ ബി 0, പിന്നെ നേർരേഖ ഉത്ഭവത്തിലൂടെ കടന്നുപോകുന്നു, ചരിവിന്റെ എസ്റ്റിമേറ്റ് തുല്യമാണ്

,

അതിന്റെ സ്റ്റാൻഡേർഡ് പിശകും

റിഗ്രഷൻ ഗുണകങ്ങളായ β 0, β 1 എന്നിവയുടെ യഥാർത്ഥ മൂല്യങ്ങൾ സാധാരണയായി അറിയില്ല. അവരുടെ കണക്കുകൾ മാത്രമേ അറിയൂ ബി 0 ഒപ്പം ബി 1 . മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, യഥാർത്ഥ റിഗ്രഷൻ ലൈൻ സാമ്പിൾ ഡാറ്റയിൽ നിന്ന് നിർമ്മിച്ചതിനേക്കാൾ വ്യത്യസ്തമായി പ്രവർത്തിച്ചേക്കാം. റിഗ്രഷൻ ലൈനിനുള്ള കോൺഫിഡൻസ് റീജിയൻ നിങ്ങൾക്ക് കണക്കാക്കാം. ഏത് മൂല്യത്തിനും xഅനുബന്ധ മൂല്യങ്ങൾ വൈസാധാരണ വിതരണം. റിഗ്രഷൻ സമവാക്യത്തിന്റെ മൂല്യമാണ് ശരാശരി. അതിന്റെ എസ്റ്റിമേറ്റിന്റെ അനിശ്ചിതത്വം സാധാരണ റിഗ്രഷൻ പിശകിന്റെ സവിശേഷതയാണ്:

ഇപ്പോൾ നമുക്ക് പോയിന്റിലെ റിഗ്രഷൻ സമവാക്യത്തിന്റെ മൂല്യത്തിനായുള്ള 100(1−α/2) ശതമാനം ആത്മവിശ്വാസ ഇടവേള കണക്കാക്കാം. x:

,

എവിടെ ടി(1−α/2, എൻ−2) - ടി- വിദ്യാർത്ഥികളുടെ വിതരണത്തിന്റെ മൂല്യം. 10 പോയിന്റുകൾ (സോളിഡ് ഡോട്ടുകൾ) ഉപയോഗിച്ച് നിർമ്മിച്ച ഒരു റിഗ്രഷൻ ലൈൻ ചിത്രം കാണിക്കുന്നു, അതുപോലെ തന്നെ ഡോട്ട് ലൈനുകളാൽ പരിമിതപ്പെടുത്തിയിരിക്കുന്ന റിഗ്രഷൻ ലൈനിന്റെ 95% ആത്മവിശ്വാസ മേഖലയും. 95% പ്രോബബിലിറ്റി ഉപയോഗിച്ച്, യഥാർത്ഥ രേഖ ഈ പ്രദേശത്തിനുള്ളിൽ എവിടെയോ സ്ഥിതിചെയ്യുന്നുണ്ടെന്ന് നമുക്ക് പറയാം. അല്ലെങ്കിൽ, ഞങ്ങൾ സമാന ഡാറ്റാ സെറ്റുകൾ (സർക്കിളുകൾ സൂചിപ്പിക്കുന്നത്) ശേഖരിക്കുകയും അവയിൽ റിഗ്രഷൻ ലൈനുകൾ നിർമ്മിക്കുകയും ചെയ്താൽ (നീലയിൽ സൂചിപ്പിച്ചിരിക്കുന്നു), 100-ൽ 95 കേസുകളിലും ഈ നേർരേഖകൾ ആത്മവിശ്വാസമേഖലയിൽ നിന്ന് പുറത്തുപോകില്ല. (ദൃശ്യവൽക്കരിക്കാൻ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക) ചില പോയിന്റുകൾ ആത്മവിശ്വാസ മേഖലയ്ക്ക് പുറത്തായിരുന്നു എന്നത് ശ്രദ്ധിക്കുക. ഇത് തികച്ചും സ്വാഭാവികമാണ്, കാരണം നമ്മൾ സംസാരിക്കുന്നത് റിഗ്രഷൻ ലൈനിന്റെ ആത്മവിശ്വാസ മേഖലയെക്കുറിച്ചാണ്, അല്ലാതെ മൂല്യങ്ങളെക്കുറിച്ചല്ല. മൂല്യങ്ങളുടെ വ്യാപനത്തിൽ റിഗ്രഷൻ ലൈനിന് ചുറ്റുമുള്ള മൂല്യങ്ങളുടെ വ്യാപനവും ഈ വരിയുടെ തന്നെ സ്ഥാനത്തിന്റെ അനിശ്ചിതത്വവും അടങ്ങിയിരിക്കുന്നു, അതായത്:

ഇവിടെ എം- അളവെടുപ്പിന്റെ ആവൃത്തി വൈനൽകിയത് x. ശരാശരിക്ക് 100(1−α/2) ശതമാനം ആത്മവിശ്വാസ ഇടവേള (പ്രവചന ഇടവേള) എംമൂല്യങ്ങൾ വൈചെയ്യും:

.

ചിത്രത്തിൽ, ഈ 95% ആത്മവിശ്വാസമുള്ള മേഖല എം=1 സോളിഡ് ലൈനുകളാൽ പരിമിതപ്പെടുത്തിയിരിക്കുന്നു. അളവിന്റെ സാധ്യമായ എല്ലാ മൂല്യങ്ങളുടെയും 95% ഈ മേഖലയിലാണ് വൈമൂല്യങ്ങളുടെ പഠിച്ച ശ്രേണിയിൽ x.

സാഹിത്യം

ലിങ്കുകൾ

  • (ഇംഗ്ലീഷ്)

വിക്കിമീഡിയ ഫൗണ്ടേഷൻ. 2010.

മറ്റ് നിഘണ്ടുവുകളിൽ "റിഗ്രഷൻ (ഗണിതശാസ്ത്രം)" എന്താണെന്ന് കാണുക:

    വിക്കിനിഘണ്ടുവിൽ "റിഗ്രഷൻ" എന്ന ലേഖനം ഉണ്ട്. റിഗ്രഷൻ (ലാറ്റിൻ റിഗ്രെസിയോ "റിവേഴ്സ് മൂവ്മെന്റ്, റിട്ടേൺ") പല അർത്ഥങ്ങളുണ്ട് ... വിക്കിപീഡിയ

    പ്രവർത്തനത്തെക്കുറിച്ച്, കാണുക: ഇന്റർപോളന്റ്. ഇന്റർപോളേഷൻ, കംപ്യൂട്ടേഷണൽ മാത്തമാറ്റിക്സിലെ ഇന്റർപോളേഷൻ എന്നത് അറിയപ്പെടുന്ന മൂല്യങ്ങളുടെ നിലവിലുള്ള വ്യതിരിക്തമായ ഒരു കൂട്ടത്തിൽ നിന്ന് ഒരു അളവിന്റെ ഇന്റർമീഡിയറ്റ് മൂല്യങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള ഒരു രീതിയാണ്. ശാസ്ത്രവും... ... വിക്കിപീഡിയയും നേരിടുന്ന പലരും

    ഈ പദത്തിന് മറ്റ് അർത്ഥങ്ങളുണ്ട്, ശരാശരി അർത്ഥം കാണുക. ഗണിതശാസ്ത്രത്തിലും സ്ഥിതിവിവരക്കണക്കുകളിലും, കേന്ദ്ര പ്രവണതയുടെ ഏറ്റവും സാധാരണമായ അളവുകോലുകളിൽ ഒന്നാണ് ഗണിത ശരാശരി, ഇത് എല്ലാ നിരീക്ഷിച്ച മൂല്യങ്ങളുടെയും ആകെത്തുകയെ പ്രതിനിധീകരിക്കുന്നു ... ... വിക്കിപീഡിയ

    ജാപ്പനീസ് മെഴുകുതിരികളുമായി ആശയക്കുഴപ്പത്തിലാകരുത്. ഗ്രാഫ് 1. മൈക്കൽസൺ മോർലി പരീക്ഷണത്തിന്റെ ഫലങ്ങൾ ... വിക്കിപീഡിയ

    തുടക്കക്കാർക്ക് · കമ്മ്യൂണിറ്റി · പോർട്ടലുകൾ · അവാർഡുകൾ · പദ്ധതികൾ · അഭ്യർത്ഥനകൾ · വിലയിരുത്തൽ ഭൂമിശാസ്ത്രം · ചരിത്രം · സമൂഹം · വ്യക്തിത്വങ്ങൾ · മതം · കായികം · സാങ്കേതികവിദ്യ · ശാസ്ത്രം · കല · തത്ത്വചിന്ത ... വിക്കിപീഡിയ

    റിഗ്രഷനും കോറിലേഷൻ അനാലിസിസും- മാന്ദ്യവും പരസ്പര ബന്ധവും വിശകലനം. ഒരു ആശ്രിത വേരിയബിളും ചില സ്വതന്ത്ര വേരിയബിളുകളും അല്ലെങ്കിൽ വേരിയബിളുകളും തമ്മിലുള്ള ശരാശരി ബന്ധം ഗണിതശാസ്ത്രപരമായി കണക്കാക്കുന്നതിനുള്ള സ്റ്റാറ്റിസ്റ്റിക്കൽ വിവരങ്ങളെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു കണക്കുകൂട്ടലാണ്. ലളിതം...... എൻസൈക്ലോപീഡിയ ഓഫ് ബാങ്കിംഗ് ആൻഡ് ഫിനാൻസ്

    ലോഗോ തരം ഗണിത മോഡലിംഗ് പ്രോഗ്രാം ഡെവലപ്പർ ... വിക്കിപീഡിയ

  • ട്യൂട്ടോറിയൽ

സ്ഥിതിവിവരക്കണക്കുകൾക്ക് പുതിയതും ശബ്ദമുയർത്തുന്നതുമായ വിഷയങ്ങളിൽ നിന്ന് ശക്തമായ PR പിന്തുണ അടുത്തിടെ ലഭിച്ചു - യന്ത്ര പഠനംഒപ്പം ബിഗ് ഡാറ്റ. ഈ തരംഗത്തിൽ കയറാൻ ആഗ്രഹിക്കുന്നവർ സുഹൃത്തുക്കളെ ഉണ്ടാക്കണം റിഗ്രഷൻ സമവാക്യങ്ങൾ. 2-3 തന്ത്രങ്ങൾ പഠിച്ച് പരീക്ഷയിൽ വിജയിക്കുക മാത്രമല്ല, ദൈനംദിന ജീവിതത്തിൽ നിന്നുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനും കഴിയുന്നത് ഉചിതമാണ്: വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം കണ്ടെത്തുക, കൂടാതെ ശബ്ദത്തിൽ നിന്ന് സിഗ്നൽ വേർതിരിച്ചറിയാൻ കഴിയും.



ഇതിനായി ഞങ്ങൾ പ്രോഗ്രാമിംഗ് ഭാഷയും വികസന അന്തരീക്ഷവും ഉപയോഗിക്കും ആർ, അത്തരം ജോലികൾക്ക് തികച്ചും അനുയോജ്യമാണ്. അതേ സമയം, സ്വന്തം ലേഖനങ്ങളുടെ സ്ഥിതിവിവരക്കണക്കുകൾ അടിസ്ഥാനമാക്കി ഹബ്രാപോസ്റ്റ് റേറ്റിംഗ് നിർണ്ണയിക്കുന്നത് എന്താണെന്ന് നമുക്ക് പരിശോധിക്കാം.

റിഗ്രഷൻ വിശകലനത്തിന്റെ ആമുഖം

y, x എന്നീ വേരിയബിളുകൾ തമ്മിൽ പരസ്പര ബന്ധമുണ്ടെങ്കിൽ, രണ്ട് അളവുകൾ തമ്മിലുള്ള പ്രവർത്തനപരമായ ബന്ധം നിർണ്ണയിക്കേണ്ടത് ആവശ്യമാണ്. ശരാശരി മൂല്യത്തിന്റെ ആശ്രിതത്വം വിളിക്കുന്നു x-ൽ y യുടെ റിഗ്രഷൻ.


റിഗ്രഷൻ വിശകലനത്തിന്റെ അടിസ്ഥാനം ഏറ്റവും കുറഞ്ഞ ചതുര രീതി (LSM), ഏത് പ്രകാരം റിഗ്രഷൻ സമവാക്യം വ്യത്യാസങ്ങളുടെ ചതുരങ്ങളുടെ ആകെത്തുക വളരെ കുറവുള്ള ഒരു ഫംഗ്ഷൻ ആയി കണക്കാക്കുന്നു.



18-ആം വയസ്സിൽ കാൾ ഗൗസ് MNC കണ്ടുപിടിച്ചു, അല്ലെങ്കിൽ പുനർനിർമ്മിച്ചു, പക്ഷേ ഫലങ്ങൾ ആദ്യമായി പ്രസിദ്ധീകരിച്ചത് 1805-ൽ ലെജൻഡ്രെയാണ്. സ്ഥിരീകരിക്കാത്ത ഡാറ്റ അനുസരിച്ച്, പുരാതന ചൈനയിൽ ഈ രീതി അറിയപ്പെട്ടിരുന്നു, അവിടെ നിന്ന് ജപ്പാനിലേക്ക് കുടിയേറി, അതിനുശേഷം മാത്രമാണ് ഇത് വന്നത്. യൂറോപ്പ്. യൂറോപ്യന്മാർ ഇത് രഹസ്യമാക്കി വെച്ചില്ല, 1801-ൽ കുള്ളൻ ഗ്രഹമായ സെറസിന്റെ സഞ്ചാരപഥം കണ്ടെത്തുന്നതിനായി ഇത് വിജയകരമായി ഉൽപ്പാദിപ്പിക്കുകയും ചെയ്തു.


ഫംഗ്ഷന്റെ തരം, ഒരു ചട്ടം പോലെ, മുൻകൂട്ടി നിശ്ചയിച്ചിരിക്കുന്നു, കൂടാതെ അജ്ഞാത പാരാമീറ്ററുകളുടെ ഒപ്റ്റിമൽ മൂല്യങ്ങൾ കുറഞ്ഞത് ചതുരങ്ങൾ ഉപയോഗിച്ച് തിരഞ്ഞെടുക്കുന്നു. ഒരു റിഗ്രഷനു ചുറ്റുമുള്ള മൂല്യങ്ങളുടെ വ്യാപനത്തിനുള്ള മെട്രിക് വ്യതിയാനമാണ്.


  • റിഗ്രഷൻ സമവാക്യങ്ങളുടെ സിസ്റ്റത്തിലെ ഗുണകങ്ങളുടെ എണ്ണമാണ് k.

മിക്കപ്പോഴും, ഒരു ലീനിയർ റിഗ്രഷൻ മോഡൽ ഉപയോഗിക്കുന്നു, ബീജഗണിത തന്ത്രങ്ങളുടെയും y, x വേരിയബിളുകളുടെ വിവിധ പരിവർത്തനങ്ങളുടെയും സഹായത്തോടെ എല്ലാ നോൺലീനിയർ ഡിപൻഡൻസികളും ഒരു രേഖീയ രൂപത്തിലേക്ക് ചുരുക്കുന്നു.

ലീനിയർ റിഗ്രഷൻ

ലീനിയർ റിഗ്രഷൻ സമവാക്യങ്ങൾ ഇങ്ങനെ എഴുതാം



മാട്രിക്സ് രൂപത്തിൽ ഇത് ഇതുപോലെ കാണപ്പെടും


  • y - ആശ്രിത വേരിയബിൾ;
  • x - സ്വതന്ത്ര വേരിയബിൾ;
  • β - കുറഞ്ഞ ചതുരങ്ങൾ ഉപയോഗിച്ച് കണ്ടെത്തേണ്ട ഗുണകങ്ങൾ;
  • ε - പിശക്, വിശദീകരിക്കാത്ത പിശക്, രേഖീയ ആശ്രിതത്വത്തിൽ നിന്നുള്ള വ്യതിയാനം;


ഒരു റാൻഡം വേരിയബിളിനെ രണ്ട് പദങ്ങളുടെ ആകെത്തുകയായി വ്യാഖ്യാനിക്കാം:



മറ്റൊരു പ്രധാന ആശയം കോറിലേഷൻ കോഫിഫിഷ്യന്റ് R 2 ആണ്.


ലീനിയർ റിഗ്രഷന്റെ പരിമിതികൾ

ഒരു ലീനിയർ റിഗ്രഷൻ മോഡൽ ഉപയോഗിക്കുന്നതിന്, വേരിയബിളുകളുടെ വിതരണത്തെയും ഗുണങ്ങളെയും കുറിച്ച് ചില അനുമാനങ്ങൾ ആവശ്യമാണ്.



മേൽപ്പറഞ്ഞ വ്യവസ്ഥകൾ പാലിക്കുന്നില്ലെന്ന് എങ്ങനെ കണ്ടെത്താം? ശരി, ഒന്നാമതായി, മിക്കപ്പോഴും ഇത് ചാർട്ടിൽ നഗ്നനേത്രങ്ങൾക്ക് ദൃശ്യമാണ്.


ചിതറിക്കിടക്കുന്നതിന്റെ വൈവിധ്യം


സ്വതന്ത്ര വേരിയബിളിനൊപ്പം വേരിയൻസ് വർദ്ധിക്കുന്നതിനനുസരിച്ച്, നമുക്ക് ഒരു ഫണൽ ആകൃതിയിലുള്ള ഗ്രാഫ് ഉണ്ട്.



ചില സന്ദർഭങ്ങളിൽ, രേഖീയമല്ലാത്ത റിഗ്രഷനും ഗ്രാഫിൽ വളരെ വ്യക്തമായി കാണാം.


എന്നിരുന്നാലും, ലീനിയർ റിഗ്രഷന്റെ വ്യവസ്ഥകൾ പാലിക്കുന്നുണ്ടോ അല്ലെങ്കിൽ ലംഘിക്കപ്പെട്ടിട്ടുണ്ടോ എന്ന് നിർണ്ണയിക്കാൻ വളരെ കർശനമായ ഔപചാരിക മാർഗങ്ങളുണ്ട്.




ഈ ഫോർമുലയിൽ - മറ്റ് ഘടകങ്ങളും തമ്മിലുള്ള പരസ്പര നിർണ്ണയത്തിന്റെ ഗുണകം. VIF-കളിൽ ഒരെണ്ണമെങ്കിലും> 10 ആണെങ്കിൽ, മൾട്ടികോളിനാരിറ്റിയുടെ സാന്നിധ്യം അനുമാനിക്കുന്നത് തികച്ചും ന്യായമാണ്.


മേൽപ്പറഞ്ഞ എല്ലാ വ്യവസ്ഥകളും പാലിക്കുന്നത് ഞങ്ങൾക്ക് വളരെ പ്രധാനമായിരിക്കുന്നത് എന്തുകൊണ്ട്? എല്ലാ കാര്യങ്ങളും ഗോസ്-മാർക്കോവ് സിദ്ധാന്തം, ഈ നിയന്ത്രണങ്ങൾ പാലിച്ചാൽ മാത്രമേ OLS അനുമാനം കൃത്യവും കാര്യക്ഷമവുമാകൂ.

ഈ പരിമിതികളെ എങ്ങനെ മറികടക്കാം

ഒന്നോ അതിലധികമോ നിയന്ത്രണങ്ങൾ ലംഘിക്കുന്നത് വധശിക്ഷയല്ല.

  1. വേരിയബിളുകൾ രൂപാന്തരപ്പെടുത്തുന്നതിലൂടെ റിഗ്രഷന്റെ രേഖീയത മറികടക്കാൻ കഴിയും, ഉദാഹരണത്തിന് സ്വാഭാവിക ലോഗരിതം ഫംഗ്ഷൻ ln വഴി.
  2. അതുപോലെ, ആശ്രിത വേരിയബിളിന്റെ ln, അല്ലെങ്കിൽ sqrt പരിവർത്തനങ്ങൾ അല്ലെങ്കിൽ വെയ്റ്റഡ് OLS ഉപയോഗിച്ച്, വൈവിധ്യമാർന്ന വ്യതിയാനത്തിന്റെ പ്രശ്നം പരിഹരിക്കാൻ കഴിയും.
  3. മൾട്ടികോളിനാരിറ്റിയുടെ പ്രശ്നം ഇല്ലാതാക്കാൻ, വേരിയബിളുകൾ ഇല്ലാതാക്കുന്ന രീതി ഉപയോഗിക്കുന്നു. എന്നതാണ് അതിന്റെ സാരം വളരെ പരസ്പര ബന്ധമുള്ള വിശദീകരണ വേരിയബിളുകൾ റിഗ്രഷനിൽ നിന്ന് ഒഴിവാക്കപ്പെടുന്നു, അത് വീണ്ടും വിലയിരുത്തുന്നു. ഒഴിവാക്കേണ്ട വേരിയബിളുകൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള മാനദണ്ഡം കോറിലേഷൻ കോഫിഫിഷ്യന്റാണ്. ഈ പ്രശ്നം പരിഹരിക്കാൻ മറ്റൊരു വഴിയുണ്ട്, അത് അന്തർലീനമായ മൾട്ടികോളിനെയർ ആയ വേരിയബിളുകൾ അവയുടെ ലീനിയർ കോമ്പിനേഷൻ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു. ഈ ലിസ്റ്റ് സമഗ്രമല്ല, കൂടുതൽ ഉണ്ട് ഘട്ടം ഘട്ടമായുള്ള റിഗ്രഷൻമറ്റ് രീതികളും.

നിർഭാഗ്യവശാൽ, സ്വാഭാവിക ലോഗരിതം ഉപയോഗിച്ച് ലീനിയർ റിഗ്രേഷന്റെ എല്ലാ വ്യവസ്ഥ ലംഘനങ്ങളും വൈകല്യങ്ങളും ഇല്ലാതാക്കാൻ കഴിയില്ല. അവിടെയുണ്ടെങ്കിൽ അസ്വസ്ഥതകളുടെ സ്വയബന്ധംഉദാഹരണത്തിന്, ഒരു പടി പിന്നോട്ട് പോയി പുതിയതും മികച്ചതുമായ ഒരു മോഡൽ നിർമ്മിക്കുന്നതാണ് നല്ലത്.

ഹബ്രെയിലെ നേട്ടങ്ങളുടെ ലീനിയർ റിഗ്രഷൻ

അതിനാൽ, മതിയായ സൈദ്ധാന്തിക ബാഗേജ്, നിങ്ങൾക്ക് മോഡൽ തന്നെ നിർമ്മിക്കാൻ കഴിയും.
ആ ചെറിയ പച്ച സംഖ്യ എന്തിനെ ആശ്രയിച്ചിരിക്കുന്നു എന്നതിനെക്കുറിച്ച് എനിക്ക് വളരെക്കാലമായി ജിജ്ഞാസയുണ്ട്, ഇത് ഹബ്രെയിലെ ഒരു പോസ്റ്റിന്റെ റേറ്റിംഗിനെ സൂചിപ്പിക്കുന്നു. എന്റെ സ്വന്തം പോസ്റ്റുകളുടെ ലഭ്യമായ എല്ലാ സ്ഥിതിവിവരക്കണക്കുകളും ശേഖരിച്ച ശേഷം, അത് ഒരു ലീനിയർ റിഗ്രഷൻ മോഡലിലൂടെ പ്രവർത്തിപ്പിക്കാൻ ഞാൻ തീരുമാനിച്ചു.


ഒരു tsv ഫയലിൽ നിന്ന് ഡാറ്റ ലോഡ് ചെയ്യുന്നു.


> ഹിസ്റ്റ്<- read.table("~/habr_hist.txt", header=TRUE) >ഹിസ്റ്റ്
പോയിന്റുകൾ വായിക്കുന്നു comm faves fb ബൈറ്റുകൾ 31 11937 29 19 13 10265 93 34122 71 98 74 14995 32 12153 12 147 17 22476 30 168302 72 16851 351 351 46 18824 12 16571 44 149 35 9972 18 9651 16 86 49 11370 59 29610 82 29 333 10131 26 8605 25 65 11 13050 20 11266 14 48 8 9884 ...
  • പോയിന്റുകൾ- ലേഖന റേറ്റിംഗ്
  • വായിക്കുന്നു- കാഴ്ചകളുടെ എണ്ണം.
  • com- അഭിപ്രായങ്ങളുടെ എണ്ണം.
  • ഇഷ്ടപ്പെടുന്നു- ബുക്ക്മാർക്കുകളിലേക്ക് ചേർത്തു.
  • fb- സോഷ്യൽ നെറ്റ്‌വർക്കുകളിൽ പങ്കിട്ടു (fb + vk).
  • ബൈറ്റുകൾ- ബൈറ്റുകളിൽ നീളം.

മൾട്ടികോളിനാരിറ്റി പരിശോധന.


> കോർ(ഹിസ്റ്റ്) പോയിന്റുകൾ comm faves fb ബൈറ്റ്സ് പോയിന്റുകൾ 1.0000000 0.5641858 0.61489369 0.24104452 0.61696653 0.19502379 വായിക്കുന്നു 0.560.00050750505 118 9 0.57092464 0.24359202 comm 0.6148937 0.5478520 1.00000000 -0.01511207 0.51551030 0.08829029 0.0882902945151515 07 1.0 0000000 0.23659894 0.14583018 fb 0.6169665 0.5709246 0.51551030 0.23659894 1.00000000 0.067822 ബൈറ്റുകൾ 0.1950238 0.2435920 0.08829029 0.14583018 0.06782256 1.00000000

എന്റെ പ്രതീക്ഷകൾക്ക് വിരുദ്ധമായി ഏറ്റവും വലിയ തിരിച്ചുവരവ്ലേഖനത്തിന്റെ കാഴ്ചകളുടെ എണ്ണത്തിലല്ല, മറിച്ച് സോഷ്യൽ നെറ്റ്‌വർക്കുകളിലെ കമന്റുകളിൽ നിന്നും പോസ്റ്റുകളിൽ നിന്നും. കാഴ്‌ചകളുടെയും അഭിപ്രായങ്ങളുടെയും എണ്ണത്തിന് കൂടുതൽ ശക്തമായ ബന്ധമുണ്ടാകുമെന്ന് ഞാൻ കരുതി, പക്ഷേ ബന്ധം തികച്ചും മിതമാണ് - സ്വതന്ത്ര വേരിയബിളുകളൊന്നും ഒഴിവാക്കേണ്ട ആവശ്യമില്ല.


ഇപ്പോൾ യഥാർത്ഥ മോഡൽ തന്നെ, ഞങ്ങൾ lm ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു.


regmodel<- lm(points ~., data = hist) summary(regmodel) Call: lm(formula = points ~ ., data = hist) Residuals: Min 1Q Median 3Q Max -26.920 -9.517 -0.559 7.276 52.851 Coefficients: Estimate Std. Error t value Pr(>|t|) (ഇന്റർസെപ്റ്റ്) 1.029e+01 7.198e+00 1.430 0.1608 വായിക്കുന്നു 8.832e-05 3.158e-04 0.280 0.7812 comm 1.356e-01 5.2018 02 3.492e-02 0.785 0.4374 fb 1.162e-01 4.691e-02 2.476 0.0177 * ബൈറ്റുകൾ 3.960e-04 4.219e-04 0.939 0.3537 --- സിഗ്നിഫ്. കോഡുകൾ: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ശേഷിക്കുന്ന സ്റ്റാൻഡേർഡ് പിശക്: 16.65 സ്വാതന്ത്ര്യത്തിന്റെ 39 ഡിഗ്രിയിൽ ഒന്നിലധികം R-സ്ക്വയർ: 0.5384, ക്രമീകരിച്ച R-സ്ക്വയർ: 0.4792 സ്ഥിതിവിവരക്കണക്ക്: 9.099 5, 39 ഡിഎഫ്, പി-മൂല്യം: 8.476e-06

ആദ്യ വരിയിൽ ഞങ്ങൾ ലീനിയർ റിഗ്രഷൻ പാരാമീറ്ററുകൾ സജ്ജമാക്കി. ലൈൻ പോയിന്റുകൾ ~. ആശ്രിത വേരിയബിൾ പോയിന്റുകളും മറ്റെല്ലാ വേരിയബിളുകളും റിഗ്രസറുകളായി നിർവചിക്കുന്നു. പോയിന്റ് ~ റീഡുകൾ, ഒരു കൂട്ടം വേരിയബിളുകൾ - പോയിന്റുകൾ ~ റീഡുകൾ + കോം എന്നിവയിലൂടെ നിങ്ങൾക്ക് ഒരൊറ്റ സ്വതന്ത്ര വേരിയബിൾ നിർവചിക്കാം.


ഇപ്പോൾ ലഭിച്ച ഫലങ്ങൾ മനസ്സിലാക്കുന്നതിലേക്ക് പോകാം.




രേഖീയമല്ലാത്ത ഘടകങ്ങളെ സുഗമമാക്കിക്കൊണ്ട് നിങ്ങൾക്ക് മോഡൽ മെച്ചപ്പെടുത്താൻ ശ്രമിക്കാം: സോഷ്യൽ നെറ്റ്‌വർക്കുകളിലെ അഭിപ്രായങ്ങളും പോസ്റ്റുകളും. fb, comm എന്നീ വേരിയബിളുകളുടെ മൂല്യങ്ങൾ അവയുടെ ശക്തികൾ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കാം.


> hist$fb = hist$fb^(4/7) > hist$comm = hist$comm^(2/3)

ലീനിയർ റിഗ്രഷൻ പാരാമീറ്ററുകളുടെ മൂല്യങ്ങൾ പരിശോധിക്കാം.


> റെഗ് മോഡൽ<- lm(points ~., data = hist) >സംഗ്രഹം(regmodel) കോൾ: lm(ഫോർമുല = പോയിന്റുകൾ ~., ഡാറ്റ = ഹിസ്റ്റ്) അവശിഷ്ടങ്ങൾ: കുറഞ്ഞത് 1Q മീഡിയൻ 3Q മാക്സ് -22.972 -11.362 -0.603 7.977 49.549 ഗുണകങ്ങൾ: എസ്റ്റിമേറ്റ് സ്‌റ്റേറ്റ്. പിശക് ടി മൂല്യം പിആർ (> | ടി |) (തടസ്സം) 2.823e+00 7.305e+00 0.387 0.70123 റീഡുകൾ -6.278e-05 3.227E-04.195 0.84674 Comm 1.84674 Comm 1.4010201.401202 3e-02 3.421e -02 0.805 0.42585 fb 1.601e+00 5.575e-01 2.872 0.00657 ** ബൈറ്റുകൾ 2.688e-04 4.108e-04 0.654 0.51677 --- അടയാളപ്പെടുത്തുക. കോഡുകൾ: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ശേഷിക്കുന്ന സ്റ്റാൻഡേർഡ് പിശക്: 16.21 സ്വാതന്ത്ര്യത്തിന്റെ 39 ഡിഗ്രിയിൽ ഒന്നിലധികം R-സ്ക്വയർ: 0.5624, ക്രമീകരിച്ച R-സ്ക്വയർ: 0.5062 സ്ഥിതിവിവരക്കണക്ക്: 10.02 5, 39 ഡിഎഫ്, പി-മൂല്യം: 3.186e-06

നമുക്ക് കാണാനാകുന്നതുപോലെ, പൊതുവേ, മോഡലിന്റെ പ്രതികരണശേഷി വർദ്ധിച്ചു, പാരാമീറ്ററുകൾ മുറുകെ പിടിക്കുകയും കൂടുതൽ സിൽക്ക് ആയിത്തീരുകയും ചെയ്തു, എഫ്-സ്റ്റാറ്റിസ്റ്റിക്സ് വർദ്ധിച്ചു, അതുപോലെ തന്നെ നിർണ്ണയത്തിന്റെ ക്രമീകരിച്ച ഗുണകവും.


ലീനിയർ റിഗ്രഷൻ മോഡലിന്റെ പ്രയോഗക്ഷമതയ്ക്കുള്ള വ്യവസ്ഥകൾ പാലിക്കുന്നുണ്ടോ എന്ന് പരിശോധിക്കാം? ഡർബിൻ-വാട്‌സൺ, അസ്വസ്ഥതകളുടെ ഓട്ടോകോറിലേഷൻ ടെസ്റ്റ് ചെയ്യുന്നു.


> dwtest(hist$points ~., ഡാറ്റ = ഹിസ്റ്റ്) Durbin-Watson ടെസ്റ്റ് ഡാറ്റ: hist$points ~ . DW = 1.585, p-value = 0.07078 ഇതര സിദ്ധാന്തം: യഥാർത്ഥ ഓട്ടോകോറിലേഷൻ 0 നേക്കാൾ വലുതാണ്

അവസാനമായി, ബ്രൂഷ്-പാഗൻ ടെസ്റ്റ് ഉപയോഗിച്ച് വ്യത്യാസത്തിന്റെ വൈവിധ്യം പരിശോധിക്കുന്നു.


> bptest(hist$points ~., data = hisst) വിദ്യാർത്ഥികളാക്കിയ ബ്രൂഷ്-പാഗൻ ടെസ്റ്റ് ഡാറ്റ: hist$points ~ . BP = 6.5315, df = 5, p-value = 0.2579

ഒടുവിൽ

തീർച്ചയായും, Habr-വിഷയങ്ങളുടെ റേറ്റിംഗുകൾക്കായുള്ള ഞങ്ങളുടെ ലീനിയർ റിഗ്രഷൻ മോഡൽ ഏറ്റവും വിജയിച്ചില്ല. ഡാറ്റയിലെ വ്യതിയാനത്തിന്റെ പകുതിയിൽ കൂടുതൽ വിശദീകരിക്കാൻ ഞങ്ങൾക്ക് കഴിഞ്ഞില്ല. വൈവിധ്യമാർന്ന വ്യാപനത്തിൽ നിന്ന് മുക്തി നേടുന്നതിന് ഘടകങ്ങൾ ശരിയാക്കേണ്ടതുണ്ട്; യാന്ത്രിക ബന്ധവും വ്യക്തമല്ല. പൊതുവേ, ഏതെങ്കിലും ഗുരുതരമായ വിലയിരുത്തലിന് മതിയായ ഡാറ്റ ഇല്ല.


എന്നാൽ മറുവശത്ത്, ഇത് നല്ലതാണ്. അല്ലാത്തപക്ഷം, ഹബ്രെയിൽ തിടുക്കത്തിൽ എഴുതുന്ന ഏതൊരു ട്രോൾ പോസ്റ്റിനും ഉയർന്ന റേറ്റിംഗ് സ്വയമേവ ലഭിക്കും, പക്ഷേ ഭാഗ്യവശാൽ ഇത് അങ്ങനെയല്ല.

ഉപയോഗിച്ച വസ്തുക്കൾ

  1. കോബ്സാർ എ. ഐ.പ്രയോഗിച്ച ഗണിത സ്ഥിതിവിവരക്കണക്കുകൾ. - എം.: ഫിസ്മത്ലിറ്റ്, 2006.
  2. വില്യം എച്ച് ഗ്രീൻഇക്കണോമെട്രിക് അനാലിസിസ്

ടാഗുകൾ: ടാഗുകൾ ചേർക്കുക