Abstrakte Deklarata Histori

Analiza e korrelacionit dhe regresionit në Excel: udhëzime për ekzekutim. Studimi i varësisë statistikore të ndryshimeve në vetitë e rezervuarit dhe lëngjeve të rezervuarit si rezultat i zhvillimit të vendburimeve të naftës Regresioni parabolik dhe polinomial

Të dhënat e mëposhtme janë në dispozicion vende të ndryshme në indeksin e çmimeve me pakicë për ushqimet (x) dhe në indeksin e prodhimit industrial (y).

Indeksi i çmimeve të ushqimit me pakicë (x)Indeksi i prodhimit industrial (y)
1 100 70
2 105 79
3 108 85
4 113 84
5 118 85
6 118 85
7 110 96
8 115 99
9 119 100
10 118 98
11 120 99
12 124 102
13 129 105
14 132 112

Kërkohet:

1. Për të karakterizuar varësinë e y nga x, llogaritni parametrat e funksioneve të mëposhtme:

A) lineare;

B) qetësues;

B) një hiperbolë barabrinjës.

3. Vlerësoni rëndësinë statistikore të parametrave të regresionit dhe korrelacionit.

4. Bëni një parashikim të vlerës së indeksit të prodhimit industrial y me vlerën e parashikuar të indeksit të çmimit të ushqimit me pakicë x=138.

Zgjidhja:

1. Për të llogaritur parametrat e regresionit linear

Zgjidhja e sistemit ekuacionet normale në lidhje me a dhe b:

Le të ndërtojmë një tabelë të të dhënave të llogaritura, siç tregohet në Tabelën 1.

Tabela 1 Të dhënat e vlerësuara për vlerësimin e regresionit linear

Nr.Xxyx 2y 2
1 100 70 7000 10000 4900 74,26340 0,060906
2 105 79 8295 11025 6241 79,92527 0,011712
3 108 85 9180 11664 7225 83,32238 0,019737
4 113 84 9492 12769 7056 88,98425 0,059336
5 118 85 10030 13924 7225 94,64611 0,113484
6 118 85 10030 13924 7225 94,64611 0,113484
7 110 96 10560 12100 9216 85,58713 0,108467
8 115 99 11385 13225 9801 91,24900 0,078293
9 119 100 11900 14161 10000 95,77849 0,042215
10 118 98 11564 13924 9604 94,64611 0,034223
11 120 99 11880 14400 9801 96,91086 0,021102
12 124 102 12648 15376 10404 101,4404 0,005487
13 129 105 13545 16641 11025 107,1022 0,020021
14 132 112 14784 17424 12544 110,4993 0,013399
Gjithsej: 1629 1299 152293 190557 122267 1299,001 0,701866
Mesatarja: 116,3571 92,78571 10878,07 13611,21 8733,357 X X
8,4988 11,1431 X X X X X
72,23 124,17 X X X X X

Vlera mesatare përcaktohet nga formula:

Devijimi standard llogaritet duke përdorur formulën:

dhe vendosni rezultatin në tabelën 1.

Duke vendosur në katror vlerën që rezulton, marrim variancën:

Parametrat e ekuacionit mund të përcaktohen gjithashtu duke përdorur formulat:

Pra, ekuacioni i regresionit është:

Prandaj, me një rritje të indeksit të çmimeve të ushqimeve me pakicë me 1, indeksi i prodhimit industrial rritet mesatarisht me 1.13.

Le të llogarisim koeficientin e korrelacionit të çiftit linear:

Lidhja është e drejtpërdrejtë dhe mjaft e ngushtë.

Le të përcaktojmë koeficientin e përcaktimit:

Variacioni në rezultat është 74.59% i shpjeguar nga ndryshimi në faktorin x.

Duke zëvendësuar vlerat aktuale të x në ekuacionin e regresionit, ne përcaktojmë vlerat teorike (të llogaritura).

prandaj parametrat e ekuacionit përcaktohen drejt.

Le të llogarisim gabimin mesatar të përafrimit - devijimin mesatar të vlerave të llogaritura nga ato aktuale:

Mesatarisht, vlerat e llogaritura devijojnë nga ato aktuale me 5.01%.

Ne do të vlerësojmë cilësinë e ekuacionit të regresionit duke përdorur testin F.

F-testi konsiston në testimin e hipotezës H 0 për papërfillshmërinë statistikore të ekuacionit të regresionit dhe treguesit të afërsisë së marrëdhënies. Për ta bërë këtë, bëhet një krahasim midis faktit aktual F dhe vlerave kritike (tabelore) të tabelës F të kriterit Fisher F.

Fakti F përcaktohet nga formula:

ku n është numri i njësive të popullsisë;

m është numri i parametrave për variablat x.

Vlerësimet e marra të ekuacionit të regresionit lejojnë që ai të përdoret për parashikim.

Nëse vlera e parashikuar e indeksit të çmimeve të ushqimit me pakicë është x = 138, atëherë vlera e parashikuar e indeksit të prodhimit industrial do të jetë:

2. Regresioni i fuqisë ka formën:

Për të përcaktuar parametrat, kryhet logaritmi i funksionit të fuqisë:

Për të përcaktuar parametrat e funksionit logaritmik, ndërtohet një sistem ekuacionesh normale duke përdorur metodën e katrorëve më të vegjël:

Le të ndërtojmë një tabelë të të dhënave të llogaritura, siç tregohet në Tabelën 2.

Tabela 2 Të dhënat e llogaritura për vlerësimin e regresionit të fuqisë

Nr.Xlg xlg ylg x*lg y(log x) 2(log y) 2
1 100 70 2,000000 1,845098 3,690196 4,000000 3,404387
2 105 79 2,021189 1,897627 3,835464 4,085206 3,600989
3 108 85 2,033424 1,929419 3,923326 4,134812 3,722657
4 113 84 2,053078 1,924279 3,950696 4,215131 3,702851
5 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
6 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
7 110 96 2,041393 1,982271 4,046594 4,167284 3,929399
8 115 99 2,060698 1,995635 4,112401 4,246476 3,982560
9 119 100 2,075547 2,000000 4,151094 4,307895 4,000000
10 118 98 2,071882 1,991226 4,125585 4,292695 3,964981
11 120 99 2,079181 1,995635 4,149287 4,322995 3,982560
12 124 102 2,093422 2,008600 4,204847 4,382414 4,034475
13 129 105 2,110590 2,021189 4,265901 4,454589 4,085206
14 132 112 2,120574 2,049218 4,345518 4,496834 4,199295
Gjithsej 1629 1299 28,90474 27,49904 56,79597 59,69172 54,05467
Vlera mesatare 116,3571 92,78571 2,064624 1,964217 4,056855 4,263694 3,861048
8,4988 11,1431 0,031945 0,053853 X X X
72,23 124,17 0,001021 0,0029 X X X

Vazhdimi i Tabelës 2 Të dhënat e llogaritura për vlerësimin e regresionit të fuqisë

Nr.X
1 100 70 74,16448 17,34292 0,059493 519,1886
2 105 79 79,62057 0,385112 0,007855 190,0458
3 108 85 82,95180 4,195133 0,024096 60,61728
4 113 84 88,59768 21,13866 0,054734 77,1887
5 118 85 94,35840 87,57961 0,110099 60,61728
6 118 85 94,35840 87,57961 0,110099 60,61728
7 110 96 85,19619 116,7223 0,11254 10,33166
8 115 99 90,88834 65,79901 0,081936 38,6174
9 119 100 95,52408 20,03384 0,044759 52,04598
10 118 98 94,35840 13,26127 0,037159 27,18882
11 120 99 96,69423 5,316563 0,023291 38,6174
12 124 102 101,4191 0,337467 0,005695 84,90314
13 129 105 107,4232 5,872099 0,023078 149,1889
14 132 112 111,0772 0,85163 0,00824 369,1889
Gjithsej 1629 1299 1296,632 446,4152 0,703074 1738,357
Vlera mesatare 116,3571 92,78571 X X X X
8,4988 11,1431 X X X X
72,23 124,17 X X X X

Duke zgjidhur një sistem ekuacionesh normale, ne përcaktojmë parametrat e funksionit logaritmik.

Ne marrim një ekuacion linear:

Pasi kemi kryer fuqizimin e tij, marrim:

Duke zëvendësuar vlerat aktuale të x në këtë ekuacion, marrim vlerat teorike të rezultatit. Në bazë të tyre, ne do të llogarisim treguesit: ngushtësia e lidhjes - indeksi i korrelacionit dhe gabimi mesatar i përafrimit.

Lidhja është mjaft e ngushtë.

Mesatarisht, vlerat e llogaritura devijojnë nga ato aktuale me 5.02%.

Kështu, H 0 - hipoteza për natyrën e rastësishme të karakteristikave të vlerësuara hidhet poshtë dhe njihet rëndësia dhe besueshmëria e tyre statistikore.

Vlerësimet e marra të ekuacionit të regresionit lejojnë që ai të përdoret për parashikim. Nëse vlera e parashikuar e indeksit të çmimeve të ushqimit me pakicë është x = 138, atëherë vlera e parashikuar e indeksit të prodhimit industrial do të jetë:

Për të përcaktuar parametrat e këtij ekuacioni, përdoret një sistem ekuacionesh normale:

Le të bëjmë një ndryshim të variablave

dhe marrim sistemin e mëposhtëm ekuacionet normale:

Duke zgjidhur një sistem ekuacionesh normale, ne përcaktojmë parametrat e hiperbolës.

Le të krijojmë një tabelë të të dhënave të llogaritura, siç tregohet në tabelën 3.

Tabela 3 Të dhëna të llogaritura për vlerësimin e varësisë hiperbolike

Nr.Xzyz
1 100 70 0,010000000 0,700000 0,0001000 4900
2 105 79 0,009523810 0,752381 0,0000907 6241
3 108 85 0,009259259 0,787037 0,0000857 7225
4 113 84 0,008849558 0,743363 0,0000783 7056
5 118 85 0,008474576 0,720339 0,0000718 7225
6 118 85 0,008474576 0,720339 0,0000718 7225
7 110 96 0,009090909 0,872727 0,0000826 9216
8 115 99 0,008695652 0,860870 0,0000756 9801
9 119 100 0,008403361 0,840336 0,0000706 10000
10 118 98 0,008474576 0,830508 0,0000718 9604
11 120 99 0,008333333 0,825000 0,0000694 9801
12 124 102 0,008064516 0,822581 0,0000650 10404
13 129 105 0,007751938 0,813953 0,0000601 11025
14 132 112 0,007575758 0,848485 0,0000574 12544
Gjithsej: 1629 1299 0,120971823 11,13792 0,0010510 122267
Mesatarja: 116,3571 92,78571 0,008640844 0,795566 0,0000751 8733,357
8,4988 11,1431 0,000640820 X X X
72,23 124,17 0,000000411 X X X

Vazhdimi i Tabelës 3 Të dhënat e llogaritura për vlerësimin e varësisë hiperbolike

Një lloj tjetër i regresionit me një faktor është përafrimi nga polinomet e fuqisë të formës:

Është e natyrshme të dëshirojmë të marrim varësinë më të thjeshtë të mundshme, duke u kufizuar në polinomet e fuqisë së shkallës së dytë, d.m.th. varësia parabolike:
(5.5.2)

Le të llogarisim derivatet e pjesshme në lidhje me koeficientët b 0 , b 1 Dhe b 2 :



(5.5.3)

Duke barazuar derivatet me zero, marrim një sistem normal ekuacionesh:

(5.5.4)

Zgjidhja e sistemit të ekuacioneve normale (5.5.2) për një rast të caktuar vlerash x i * , y i * ;
marrim vlerat optimale b 0 , b 1 Dhe b 2 . Për përafrimin sipas varësisë (5.5.2) dhe aq më tepër (5.5.1), formula të thjeshta për llogaritjen e koeficientëve nuk janë marrë dhe, si rregull, ato llogariten duke përdorur procedura standarde në formën e matricës:

(5.5.5)

Figura 5.5.1 tregon një shembull tipik të përafrimit nga një varësi parabolike:

9 (5;9)

(1;1)

1

1 2 3 4 5 x

Fig.5.5.1. Koordinatat e pikave eksperimentale dhe të përafërta

varësia e tyre parabolike

Shembulli 5.1. Përafroni rezultatet eksperimentale të dhëna në tabelën 5.1.1 me një ekuacion të regresionit linear
.

Tabela 5.1.1

Le të ndërtojmë pika eksperimentale sipas koordinatave të treguara në tabelën 5.1.1 në grafikun e paraqitur në figurën 5.1.1.

9

4

1 2 3 4 5 x

Sipas figurës 5.1.1, në të cilën do të vizatojmë një vijë të drejtë për një vlerësim paraprak, do të konkludojmë se ekziston një jolinearitet i shprehur qartë në vendndodhjen e pikave eksperimentale, por nuk është shumë domethënës dhe për këtë arsye ka kuptim. për t'i përafruar ato me një varësi lineare. Vini re se për të marrë një përfundim të saktë matematikor, është e nevojshme të ndërtohet një vijë e drejtë duke përdorur metodën katrorët më të vegjël.

Para se të kryeni analizën e regresionit, këshillohet të llogaritni

koeficienti linear i korrelacionit ndërmjet variablave X Dhe :

Rëndësia e marrëdhënies së korrelacionit përcaktohet nga vlera kritike e koeficientit të korrelacionit linear, e llogaritur duke përdorur formulën:

Vlera kritike e testit të Studentit t Kreta gjetur sipas tabelave statistikore për nivelin e rekomanduar të rëndësisë α=0,05 dhe për n-2 shkallët e lirisë. Nëse vlera e llogaritur r xy jo më pak se vlera kritike r Kreta, pastaj korrelacioni ndërmjet variablave x Dhe y konsiderohet thelbësore. Le të bëjmë llogaritjet:










Për faktin se
arrijmë në përfundimin se korrelacioni ndërmjet variablave X Dhe është domethënëse dhe mund të jetë lineare.

Le të llogarisim koeficientët e ekuacionit të regresionit:

Kështu, kemi marrë një ekuacion të regresionit linear:

Duke përdorur ekuacionin e regresionit, ne vizatojmë një vijë të drejtë në Fig. 5.1.2.

y (5;9.8)

9

4

(0;-0.2) 1 2 3 4 5 x

Fig.5.1.2. Koordinatat e pikave eksperimentale dhe të përafërta

varësia e tyre lineare

Duke përdorur ekuacionin e regresionit, ne llogarisim vlerat e funksionit bazuar në pikat eksperimentale të tabelës 5.1.1 dhe diferencën midis vlerave eksperimentale dhe të llogaritura të funksionit, të cilat i paraqesim në tabelën 5.1.2.

Tabela 5.1.2


Le të llogarisim gabimin mesatar katror dhe raportin e tij me vlerën mesatare:

Për sa i përket raportit të gabimit standard me vlerën mesatare, është arritur një rezultat jo i kënaqshëm, pasi është tejkaluar vlera e rekomanduar prej 0.05.

Le të vlerësojmë nivelin e rëndësisë së koeficientëve të ekuacionit të regresionit duke përdorur T-testin Student:


Nga tabela statistikore për 3 shkallë lirie, le të shkruajmë rreshtat me nivelin e rëndësisë - dhe vlerën e kriterit të Studentit t në tabelën 5.1.3.

Tabela 5.1.3

Niveli i rëndësisë së koeficientëve të ekuacionit të regresionit:


Vini re se sipas nivelit të rëndësisë për koeficientin është marrë një rezultat i kënaqshëm dhe për koeficientin e pakënaqshme.

Le të vlerësojmë cilësinë e ekuacionit të regresionit që rezulton duke përdorur tregues të llogaritur në bazë të analizës së variancës:

Ekzaminimi:

Rezultati i kontrollit është pozitiv, gjë që tregon korrektësinë e llogaritjeve të kryera.

Le të llogarisim kriterin Fisher:

me dy shkallë lirie:

Duke përdorur tabelat statistikore, gjejmë vlerat kritike të kriterit Fisher për dy shkallëzime të rekomanduara të nivelit të rëndësisë:


Meqenëse vlera e llogaritur e testit Fisher tejkalon vlerën kritike për nivelin e rëndësisë prej 0.01, do të supozojmë se niveli i rëndësisë sipas testit Fisher është më i vogël se 0.01, i cili do të konsiderohet i kënaqshëm.

Le të llogarisim koeficientin e përcaktimit të shumëfishtë:

për dy shkallë lirie

Duke përdorur tabelën statistikore për nivelin e rekomanduar të rëndësisë prej 0.05 dhe dy shkallë lirie të gjetura, gjejmë vlerën kritike të koeficientit të përcaktimit të shumëfishtë:

Meqenëse vlera e llogaritur e koeficientit të përcaktimit të shumëfishtë tejkalon vlerën kritike për nivelin e rëndësisë
, pastaj niveli i rëndësisë sipas koeficientit të përcaktimit të shumëfishtë
dhe rezultati i marrë për treguesin e paraqitur do të konsiderohet i kënaqshëm.

Kështu, parametrat e përllogaritur të përftuar për sa i përket raportit të gabimit standard me vlerën mesatare dhe nivelit të rëndësisë sipas testit të Studentit janë të pakënaqshëm, prandaj këshillohet të zgjidhet një varësi tjetër e përafërt për përafrim.

Shembulli 5.2. Përafrimi i shpërndarjes eksperimentale të numrave të rastit nga një varësi matematikore

Shpërndarja eksperimentale e numrave të rastësishëm të dhëna në tabelën 5.1.1, kur përafrohet nga një varësi lineare, nuk çoi në një rezultat të kënaqshëm, përfshirë. për shkak të parëndësisë së koeficientit të ekuacionit të regresionit me një term të lirë, prandaj, për të përmirësuar cilësinë e përafrimit, ne do të përpiqemi ta kryejmë atë duke përdorur një varësi lineare pa një term të lirë:

Le të llogarisim vlerën e koeficientit të ekuacionit të regresionit:

Kështu, kemi marrë ekuacionin e regresionit:

Duke përdorur ekuacionin e marrë të regresionit, ne llogarisim vlerat e funksionit dhe diferencën midis vlerave eksperimentale dhe të llogaritura të funksionit, të cilat i paraqesim në formën e tabelës 5.2.1.

Tabela 5.2.1

x i

Sipas ekuacionit të regresionit
në figurën 5.2.1 do të vizatojmë një vijë të drejtë.

y (5; 9.73 )

(0;0) 1 2 3 4 5 x

Fig.5.2.1. Koordinatat e pikave eksperimentale dhe të përafërta

varësia e tyre lineare

Për të vlerësuar cilësinë e përafrimit, ne do të kryejmë llogaritjet e treguesve të cilësisë të ngjashme me llogaritjet e dhëna në shembullin 5.1.

(mbetet i vjetër);

me 4 shkallë lirie;

Për

Bazuar në rezultatet e përafrimit, vërejmë se për sa i përket nivelit të rëndësisë së koeficientit të ekuacionit të regresionit, është marrë një rezultat i kënaqshëm; Raporti i gabimit standard me mesataren është përmirësuar, por është ende mbi vlerën e rekomanduar prej 0.05, prandaj rekomandohet të përsëritet përafrimi me një marrëdhënie matematikore më komplekse.

Shembulli 5.3. Për të përmirësuar cilësinë e përafrimit të shembujve 5.1 dhe 5.2, ne do të kryejmë një përafrim jolinear nga varësia
. Për ta bërë këtë, fillimisht do të bëjmë llogaritjet e ndërmjetme dhe do t'i vendosim rezultatet e tyre në tabelën 5.3.1.

vlerat

Tabela 5.3.1

X 2

(lnX) 2

lnX lnY

Le të llogarisim shtesë:

Le të përafrojmë varësinë
. Duke përdorur formulat (5.3.7), (5.3.8) llogarisim koeficientët b 0 Dhe b 1 :

Duke përdorur formulat (5.3.11) llogarisim koeficientët A 0 Dhe A 1 :


Për llogaritjen e gabimit standard, janë kryer llogaritjet e ndërmjetme, të paraqitura në tabelën 5.3.2.

Tabela 5.3.2

Y i

y i

Shuma: 7.5968

Gabimi standard i përafrimit doli të ishte shumë më i madh se në dy shembujt e mëparshëm, kështu që ne i konsiderojmë rezultatet e përafrimit të papërdorshme.

Shembulli 5.4. Le të përpiqemi të përafrojmë me një varësi tjetër jolineare
. Duke përdorur formulat (5.3.9), (5.3.10) sipas tabelës 5.3.1, ne llogarisim koeficientët b 0 Dhe b 1 :

Ne kemi një varësi të ndërmjetme:

Duke përdorur formulat (5.3.13) llogarisim koeficientët C 0 Dhe C 1 :


Ne morëm varësinë përfundimtare:

Për të llogaritur gabimin standard, ne do të kryejmë llogaritjet e ndërmjetme dhe do t'i vendosim në tabelën 5.4.1.

Tabela 5.4.1

Y i

y i

Shuma: 21.83152

Le të llogarisim gabimin standard:

Gabimi standard i përafrimit doli të ishte shumë më i madh se në shembullin e mëparshëm, kështu që ne i konsiderojmë rezultatet e përafrimit të papërdorshme.

Shembulli 5.5. Përafrimi i shpërndarjes eksperimentale të numrave të rastit nga një varësi matematikore y = b · lnx

Të dhënat fillestare, si në shembujt e mëparshëm, janë paraqitur në Tabelën 5.4.1 dhe Fig. 5.4.1.

Tabela 5.4.1

Bazuar në analizën e Fig. 5.4.1 dhe tabelës 5.4.1, vërejmë se me vlera më të vogla të argumentit (në fillim të tabelës), funksioni ndryshon më shumë sesa me vlera më të mëdha (në fund të tabelës), prandaj duket e këshillueshme që të ndryshohet shkalla e argumentit dhe të futet një funksion logaritmik në ekuacionin e regresionit prej tij dhe të përafrohet me varësinë matematikore të mëposhtme:

. Duke përdorur formulën (5.4.3) llogarisim koeficientin b:

Për të vlerësuar cilësinë e përafrimit, ne do të kryejmë llogaritjet e ndërmjetme të paraqitura në tabelën 5.4.2, nga të cilat do të llogarisim madhësinë e gabimit dhe raportin e gabimit standard me vlerën mesatare.

Tabela 5.4.2


Meqenëse raporti i gabimit standard me vlerën mesatare tejkalon vlerën e rekomanduar prej 0.05, rezultati do të konsiderohet i pakënaqshëm. Në veçanti, vërejmë se devijimi më i madh jepet nga vlera x=1, pasi me këtë vlerë lnx=0. Prandaj, ne do të përafrojmë varësinë y = b 0 +b 1 lnx

Llogaritjet ndihmëse i paraqesim në formën e tabelës 5.4.3.

Tabela 5.4.3

Duke përdorur formulat (5.4.6) dhe (5.4.7) llogarisim koeficientët b 0 dhe b 1 :

9 (5;9.12)

4

1 (1;0.93)

1 2 3 4 5 x

Për të vlerësuar cilësinë e përafrimit, ne do të kryejmë llogaritjet ndihmëse dhe do të përcaktojmë nivelin e rëndësisë së koeficientëve të gjetur dhe raportin e gabimit standard me vlerën mesatare.

Niveli i rëndësisë pak mbi vlerën e rekomanduar prej 0.05 (
).


Për shkak të faktit se sipas treguesit kryesor - raporti i gabimit standard me vlerën mesatare - u mor një tepricë pothuajse e dyfishtë e nivelit të rekomanduar prej 0.05, ne do t'i konsiderojmë rezultatet të pranueshme. Vini re se vlera e llogaritur e testit të Studentit t b 0 =2,922 të ndryshme nga kritike
me një sasi relativisht të vogël.

Shembulli 5.6. Le të përafrojmë të dhënat eksperimentale të Shembullit 5.1 me varësinë hiperbolike
. Për të llogaritur koeficientët b 0 dhe b 1 Le të bëjmë llogaritjet paraprake të dhëna në tabelën 5.6.1.

Tabela 5.6.1

X i

x i =1/X i

x i 2

x i y i

Bazuar në rezultatet e Tabelës 5.6.1 duke përdorur formulat (5.4.8) dhe (5.4.9), ne llogarisim koeficientët b 0 dhe b 1 :

Kështu, fitohet një ekuacion i regresionit hiperbolik

.

Rezultatet e llogaritjeve ndihmëse për vlerësimin e cilësisë së përafrimit janë dhënë në tabelën 5.6.2.

Tabela 5.6.2

X i

Bazuar në rezultatet e tabelës 5.6.2, ne llogarisim gabimin standard dhe raportin e gabimit standard me vlerën mesatare:


Për shkak të faktit se raporti i gabimit standard me vlerën mesatare e kalon vlerën e rekomanduar prej 0.05, konkludojmë se rezultatet e përafrimit janë të papërshtatshme.

Shembulli 5.7.

Për të llogaritur vlerat specifike të të ardhurave nga funksionimi i vinçave me fije në varësi të kohës së punës së mirëmbajtjes, është e nevojshme të merret një varësi parabolike.

Le të llogarisim koeficientët e kësaj varësie b 0 , b 1 , b 11 në formë matrice sipas formulës:

Ekuacionet jolineare të regresionit që lidhin treguesin efektiv me vlerat optimale për kryerjen e mirëmbajtjes parandaluese të vinçave të kullës janë marrë duke përdorur procedurën e regresionit të shumëfishtë të paketës së aplikimit Statistica 6.0. Në vijim, paraqesim rezultatet e analizës së regresionit për treguesin efektiv të performancës sipas tabelës 5.7.1.

Tabela 5.7.1

Tabela 5.7.2 tregon rezultatet e regresionit jolinear për treguesin efektiv të performancës dhe Tabela 5.7.3 tregon rezultatet e analizës së mbetjeve.

Tabela 5.7.2

Tabela 5.7.3

Oriz. 3.7.36. Analiza e mbetjeve.

Kështu, kemi marrë një ekuacion të regresionit të shumëfishtë për variablin
:

Raporti i gabimit standard me kuptimin:

14780/1017890=0,0145 < 0,05.

Meqenëse raporti i gabimit standard me vlerën mesatare nuk e kalon vlerën e rekomanduar prej 0.05, rezultatet e përafrimit mund të konsiderohen të pranueshme. Si pengesë sipas tabelës 5.7.2, duhet theksuar se të gjithë koeficientët e llogaritur tejkalojnë nivelin e rekomanduar të rëndësisë prej 0.05.

Le të shqyrtojmë ndërtimin e një ekuacioni regresioni të formës .

Përpilimi i një sistemi ekuacionesh normale për gjetjen e koeficientëve të regresionit parabolik kryhet në mënyrë të ngjashme me përpilimin e ekuacioneve normale të regresionit linear.

Pas transformimeve marrim:

.

Duke zgjidhur një sistem ekuacionesh normale, fitohen koeficientët e ekuacionit të regresionit.

,

Ku , A .

Një ekuacion i shkallës së dytë përshkruan të dhënat eksperimentale dukshëm më mirë se një ekuacion i shkallës së parë nëse ulja e variancës në krahasim me variancën e regresionit linear është domethënëse (jo e rastësishme). Rëndësia e ndryshimit midis dhe vlerësohet nga kriteri Fisher:

ku numri është marrë nga tabelat statistikore referuese (Shtojca 1) sipas shkallëve të lirisë dhe nivelit të rëndësisë së zgjedhur.

Procedura për kryerjen e punës llogaritëse:

1. Njihuni me material teorik, të përcaktuara në udhëzime ose në literaturë shtesë.

2. Llogaritni shanset ekuacioni linear regresioni. Për ta bërë këtë, ju duhet të llogaritni shumat. Llogaritni me lehtësi shumat menjëherë , të cilat janë të dobishme për llogaritjen e koeficientëve të një ekuacioni parabolik.

3. Llogaritni vlerat e llogaritura të parametrit të daljes duke përdorur ekuacionin.

4. Llogaritni variancën totale dhe të mbetur, , si dhe kriterin e Fisher.

Ku – matricë, elementet e së cilës janë koeficientët e sistemit të ekuacioneve normale;

– një vektor, elementët e të cilit janë koeficientë të panjohur;

– matrica e anëve të djathta të sistemit të ekuacioneve.

7. Llogaritni vlerat e llogaritura të parametrit të daljes duke përdorur ekuacionin .

8. Llogaritni variancën e mbetur, si dhe kriterin Fisher.



9. Nxirrni përfundime.

10. Ndërtoni grafikët e ekuacioneve të regresionit dhe të dhënave fillestare.

11. Plotësoni punën llogaritëse.

Shembull i llogaritjes.

Duke përdorur të dhëna eksperimentale për varësinë e densitetit të avullit të ujit nga temperatura, merrni ekuacionet e regresionit të formës dhe . Kryeni analiza statistikore dhe nxirrni një përfundim për marrëdhënien më të mirë empirike.

0,0512 0,0687 0,081 0,1546 0,2516 0,3943 0,5977 0,8795

Përpunimi i të dhënave eksperimentale u krye në përputhje me rekomandimet për punën. Llogaritjet për përcaktimin e parametrave të ekuacionit linear janë dhënë në tabelën 1.

Tabela 1 - Gjetja e parametrave të një varësie lineare të formës
Dendësia e avullit të ujit në vijën e ngopjes
t i,°C , ohm t i 2 kalc.
0,0512 2,05 -0,0403 -0,0915 0,0084 0,0669
0,0687 3,16 0,0248 -0,0439 0,0019 0,0582
0,0811 4,22 0,0899 0,0089 0,0001 0,0523
0,1546 9,9 0,2202 0,06565 0,0043 0,0241
0,2516 19,12 0,3505 0,09894 0,0098 0,0034
0,3943 34,70 0,4808 0,08654 0,0075 0,0071
0,5977 59,77 0,6111 0,01344 0,0002 0,0829
0,8795 98,50 0,7414 -0,13807 0,0191 0,3245
shuma 2,4786 231,41 0,0512 0,6194
mesatare 72,25 0,3098 5822,5 28,93
b 0 = -0,4747 D 1 ost 2 = 0,0085
b 1 = 0,0109 Dy 2 = 0,0885
F= 10,368
F T =3,87 F>F Modeli T është adekuat

.

Për të përcaktuar parametrat e regresionit parabolik, fillimisht u përcaktuan elementët e matricës së koeficientit dhe matricës së anëve të djathta të sistemit të ekuacioneve normale. Pastaj koeficientët u llogaritën në mjedisin MathCad:

Të dhënat e llogaritjes janë dhënë në tabelën 2.

Emërtimet në tabelën 2:

.

konkluzione

Ekuacioni parabolik përshkruan dukshëm më mirë të dhënat eksperimentale mbi varësinë e densitetit të avullit nga temperatura, pasi vlera e llogaritur e kriterit Fisher tejkalon ndjeshëm vlerën e tabelës prej 4.39. Prandaj, përfshirja e një termi kuadratik në një ekuacion polinom ka kuptim.

Rezultatet e fituara janë paraqitur në formë grafike (Fig. 3).

Figura 3 – Interpretimi grafik i rezultateve të llogaritjes.

Vija me pika është ekuacioni i regresionit linear; vijë e fortë – regresion parabolik, pika në grafik – vlera eksperimentale.

Tabela 2. – Gjetja e parametrave të llojit të varësisë y(t)=a 0 +a 1 ∙x+a 2 ∙x 2 Dendësia e avullit të ujit në vijën e ngopjes ρ= a 0 +a 1 ∙t+a 2 ∙t 2 i–ρav) 2 0,0669 0,0582 0,0523 0,0241 0,0034 0,0071 0,0829 0,03245 0,6194
(Δρ) 2 0,0001 0,0000 0,0000 0,0002 0,0000 0,0002 0,0002 0,0002 0,0010 0,0085 0,0002 0,0885 42,5
∆ρ i=ρ( t i)calc–ρ i 0,01194 –0,00446 –0,00377 –0,01524 –0,00235 0,01270 0,011489 –0,01348 D 1 2 pushim = D 2 2 pushim = D 1 2 y= F=
ρ( t i) llogaritur. 0,0631 0,0642 0,0773 0,1394- 0,2493 0,4070 0,6126 0,8660 2,4788
t ii 81,84 145,33 219,21 633,24 1453,2 3053,4 5977,00 11032,45 22595,77
t i 4
t i 3
t iρ i 2,05 3,16 4,22 9,89 19,12 34,70 59,77 98,50 231,41
t i 2
ρ, ohm 0,0512 0,0687 0,0811 0,1546 0,2516 0,3943 0,5977 0,8795 2,4786 0,3098
t i,°C 0,36129 –0,0141 1.6613E-04
1 2 3 4 5 6 7 8 shuma mesatare a 0 = a 1 = a 2 =

Shtojca 1

Tabela e shpërndarjes së Fisher për q = 0,05

f 2 -
f 1
161,40 199,50 215,70 224,60 230,20 234,00 238,90 243,90 249,00 254,30
18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50
10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53
7,71 6,94 6,59 6,39 6,76 6,16 6,04 5,91 5,77 5,63
6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36
5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67
5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23
5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93
5,12 4,26 3,86 3,63 3,48 3,37 3,24 3,07 2,90 2,71
4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54
4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,61 2,40
4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50 2,30
4,67 3,80 3,41 3,18 3,02 2,92 2,77 2,60 2,42 2,21
4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35 2,13
4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,29 2,07
4,49 3,63 3,24 3,01 2,82 2,74 2,59 2,42 2,24 2,01
4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,19 1,96
4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,15 1,92
4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,11 1,88
4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,28 2,08 1,84
4,32 3,47 3,07 2,84 2,68 2,57 2,42 2,25 2,05 1,81
4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,23 2,03 1,78
4,28 3,42 3,03 2,80 2,64 2,53 2,38 2,20 2,00 1,76
4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,18 1,98 1,73
4,24 3,38 2,99 2,76 2,60 2,49 2,34 2,16 1,96 1,71
4,22 3,37 2,98 2,74 2,59 2,47 2,32 2,15 1,95 1,69
4,21 3,35 2,96 2,73 2,57 2,46 2,30 2,13 1,93 1,67
4,20 3,34 2,95 2,71 2,56 2,44 2,29 2,12 1,91 1,65
4,18 3,33 2,93 2,70 2,54 2,43 2,28 2,10 1,90 1,64
4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,09 1,89 1,62
4,08 3,23 2,84 2,61 2,45 2,34 2,18 2,00 1,79 1,52
4,00 3,15 2,76 2,52 2,37 2,25 2,10 1,92 1,70 1,39
3,92 3,07 2,68 2,45 2,29 2,17 2,02 1,88 1,61 1,25

Analiza e regresionit dhe korrelacionit janë metoda kërkimore statistikore. Këto janë mënyrat më të zakonshme për të treguar varësinë e një parametri nga një ose më shumë variabla të pavarur.

Më poshtë, duke përdorur shembuj konkretë praktikë, do të shqyrtojmë këto dy analiza shumë të njohura midis ekonomistëve. Ne gjithashtu do të japim një shembull të marrjes së rezultateve kur i kombinojmë ato.

Analiza e regresionit në Excel

Tregon ndikimin e disa vlerave (të pavarura, të pavarura) në variablin e varur. Për shembull, si varet numri i popullsisë ekonomikisht aktive nga numri i ndërmarrjeve, pagat dhe parametrat e tjerë. Ose: si ndikojnë në nivelin e PBB-së investimet e huaja, çmimet e energjisë etj.

Rezultati i analizës ju lejon të nënvizoni përparësitë. Dhe bazuar në faktorët kryesorë, parashikoni, planifikoni zhvillimin e fushave prioritare dhe merrni vendime menaxheriale.

Regresioni ndodh:

  • lineare (y = a + bx);
  • parabolike (y = a + bx + cx 2);
  • eksponencial (y = a * exp(bx));
  • fuqia (y = a*x^b);
  • hiperbolike (y = b/x + a);
  • logaritmike (y = b * 1n(x) + a);
  • eksponencial (y = a * b^x).

Le të shohim një shembull të ndërtimit të një modeli regresioni në Excel dhe interpretimit të rezultateve. Le të marrim llojin linear të regresionit.

Detyrë. Në 6 ndërmarrje u analizua paga mesatare mujore dhe numri i punonjësve të larguar nga puna. Është e nevojshme të përcaktohet varësia e numrit të punonjësve që largohen nga paga mesatare.

Modeli i regresionit linear duket si ky:

Y = a 0 + a 1 x 1 +…+a k x k.

Ku a janë koeficientët e regresionit, x janë variabla ndikues, k është numri i faktorëve.

Në shembullin tonë, Y është treguesi i largimit nga punonjësit. Faktori ndikues është paga (x).

Excel ka funksione të integruara që mund t'ju ndihmojnë të llogaritni parametrat e një modeli të regresionit linear. Por shtesa "Paketa e analizës" do ta bëjë këtë më shpejt.

Le të aktivizojmë një mjet të fuqishëm analitik:

Pasi të aktivizohet, shtesa do të jetë e disponueshme në skedën e të dhënave.

Tani le të bëjmë vetë analizën e regresionit.



Para së gjithash, ne i kushtojmë vëmendje katrorit R dhe koeficientëve.

R-katror është koeficienti i përcaktimit. Në shembullin tonë - 0,755, ose 75,5%. Kjo do të thotë se parametrat e llogaritur të modelit shpjegojnë 75.5% të marrëdhënies ndërmjet parametrave të studiuar. Sa më i lartë të jetë koeficienti i përcaktimit, aq më i mirë është modeli. Mirë - mbi 0.8. E keqe - më pak se 0.5 (një analizë e tillë vështirë se mund të konsiderohet e arsyeshme). Në shembullin tonë - "jo keq".

Koeficienti 64.1428 tregon se çfarë do të jetë Y nëse të gjitha variablat në modelin në shqyrtim janë të barabartë me 0. Kjo do të thotë, vlera e parametrit të analizuar ndikohet edhe nga faktorë të tjerë që nuk janë përshkruar në model.

Koeficienti -0,16285 tregon peshën e variablit X në Y. Kjo do të thotë se paga mesatare mujore brenda këtij modeli ndikon në numrin e të larguarve me peshën -0,16285 (kjo është një shkallë e vogël ndikimi). Shenja "-" tregon një ndikim negativ: sa më e lartë të jetë paga, aq më pak njerëz e lënë. E cila është e drejtë.



Analiza e korrelacionit në Excel

Analiza e korrelacionit ndihmon në përcaktimin nëse ka një lidhje midis treguesve në një ose dy mostra. Për shembull, midis kohës së funksionimit të një makinerie dhe kostos së riparimeve, çmimit të pajisjeve dhe kohëzgjatjes së funksionimit, gjatësisë dhe peshës së fëmijëve, etj.

Nëse ka një lidhje, atëherë rritja e njërit parametër a çon në një rritje (korrelacion pozitiv) ose një ulje (negative) të tjetrit. Analiza e korrelacionit e ndihmon analistin të përcaktojë nëse vlera e një treguesi mund të përdoret për të parashikuar vlerën e mundshme të një tjetri.

Koeficienti i korrelacionit shënohet me r. Ndryshon nga +1 në -1. Klasifikimi i korrelacioneve për fusha të ndryshme do të jetë i ndryshëm. Kur koeficienti është 0, nuk ka lidhje lineare midis mostrave.

Le të shohim se si të gjejmë koeficientin e korrelacionit duke përdorur Excel.

Për të gjetur koeficientët e çiftuar, përdoret funksioni CORREL.

Objektivi: Përcaktoni nëse ka një lidhje midis kohës së funksionimit të një torno dhe kostos së mirëmbajtjes së saj.

Vendosni kursorin në çdo qelizë dhe shtypni butonin fx.

  1. Në kategorinë "Statistikore", zgjidhni funksionin CORREL.
  2. Argumenti "Array 1" - diapazoni i parë i vlerave - koha e funksionimit të makinës: A2:A14.
  3. Argumenti "Array 2" - diapazoni i dytë i vlerave - kostoja e riparimit: B2:B14. Klikoni OK.

Për të përcaktuar llojin e lidhjes, duhet të shikoni numrin absolut të koeficientit (çdo fushë e veprimtarisë ka shkallën e vet).

Për analiza e korrelacionit disa parametra (më shumë se 2), është më i përshtatshëm të përdoret "Analiza e të dhënave" (shtesa "Paketa e Analizës"). Ju duhet të zgjidhni korrelacionin nga lista dhe të caktoni grupin. Të gjitha.

Koeficientët rezultues do të shfaqen në matricën e korrelacionit. Si kjo:

Analiza e korrelacionit dhe e regresionit

Në praktikë, këto dy teknika shpesh përdoren së bashku.

Shembull:


Tani të dhënat e analizës së regresionit janë bërë të dukshme.

Le të shqyrtojmë një model regresioni linear të çiftuar të marrëdhënies midis dy ndryshoreve, për të cilat funksioni i regresionit φ(x) lineare. Le të shënojmë me y x mesatare e kushtëzuar e karakteristikës Y V popullsia në një vlerë fikse x e ndryshueshme X. Atëherë ekuacioni i regresionit do të duket si ky:

y x = sëpatë + b, Ku akoeficienti i regresionit(tregues i pjerrësisë së vijës së regresionit linear) . Koeficienti i regresionit tregon se sa njësi ndryshon mesatarisht ndryshorja Y kur ndryshoni një ndryshore X për një njësi. Duke përdorur metodën e katrorëve më të vegjël, fitohen formula që mund të përdoren për të llogaritur parametrat e regresionit linear:

Tabela 1. Formulat për llogaritjen e parametrave të regresionit linear

Anëtar i lirë b

Koeficienti i regresionit a

Koeficienti i përcaktimit

Testimi i hipotezës për rëndësinë e ekuacionit të regresionit

N 0 :

N 1 :

, ,, Shtojca 7 (për regresionin linear p = 1)

Drejtimi i marrëdhënies ndërmjet variablave përcaktohet në bazë të shenjës së koeficientit të regresionit. Nëse shenja e koeficientit të regresionit është pozitive, marrëdhënia ndërmjet ndryshores së varur dhe variablit të pavarur do të jetë pozitive. Nëse shenja e koeficientit të regresionit është negative, lidhja ndërmjet ndryshores së varur dhe variablit të pavarur është negative (inversi).

Për të analizuar cilësinë e përgjithshme të ekuacionit të regresionit, përdoret koeficienti i përcaktimit R 2 , i quajtur edhe katrori i koeficientit të korrelacionit të shumëfishtë. Koeficienti i përcaktimit (një masë sigurie) është gjithmonë brenda intervalit. Nëse vlera R 2 afër unitetit, kjo do të thotë se modeli i ndërtuar shpjegon pothuajse të gjithë ndryshueshmërinë në variablat përkatëse. Në të kundërt, kuptimi R 2 afër zeros do të thotë cilësi e dobët e modelit të ndërtuar.

Koeficienti i përcaktimit R 2 tregon se me çfarë përqindje funksioni i regresionit të gjetur përshkruan marrëdhënien midis vlerave origjinale Y Dhe X. Në Fig. Figura 3 tregon variacionin e shpjeguar nga modeli i regresionit dhe variacionin total. Prandaj, vlera tregon se sa për qind e ndryshimit të parametrit Y për shkak të faktorëve që nuk përfshihen në modelin e regresionit.

Me një vlerë të lartë të koeficientit të përcaktimit prej 75%), mund të bëhet një parashikim për një vlerë specifike brenda intervalit të të dhënave origjinale. Kur parashikohen vlera jashtë gamës së të dhënave fillestare, vlefshmëria e modelit që rezulton nuk mund të garantohet. Kjo shpjegohet me faktin se mund të shfaqet ndikimi i faktorëve të rinj që modeli nuk i merr parasysh.

Rëndësia e ekuacionit të regresionit vlerësohet duke përdorur kriterin Fisher (shih Tabelën 1). Me kusht që hipoteza zero të jetë e vërtetë, kriteri ka një shpërndarje Fisher me numrin e shkallëve të lirisë , (për regresionin linear të çiftuar p = 1). Nëse hipoteza zero hidhet poshtë, atëherë ekuacioni i regresionit konsiderohet statistikisht i rëndësishëm. Nëse hipoteza zero nuk hidhet poshtë, atëherë ekuacioni i regresionit konsiderohet statistikisht i parëndësishëm ose jo i besueshëm.

Shembulli 1. Në makineri analizohet struktura e kostove të produktit dhe pjesa e komponentëve të blerë. Është vërejtur se kostoja e komponentëve varet nga koha e dorëzimit të tyre. Distanca e përshkuar u zgjodh si faktori më i rëndësishëm që ndikon në kohën e dorëzimit. Kryeni analizën e regresionit të të dhënave të furnizimit:

Largësia, milje

Koha, min

Për të kryer analizën e regresionit:

    ndërtoni një grafik të të dhënave fillestare, përcaktoni afërsisht natyrën e varësisë;

    zgjidhni llojin e funksionit të regresionit dhe përcaktoni koeficientët numerikë të modelit duke përdorur metodën e katrorëve më të vegjël dhe drejtimin e marrëdhënies;

    të vlerësojë fuqinë e varësisë së regresionit duke përdorur koeficientin e përcaktimit;

    të vlerësojë rëndësinë e ekuacionit të regresionit;

    bëni një parashikim (ose një përfundim për pamundësinë e parashikimit) duke përdorur modelin e miratuar për një distancë prej 2 miljesh.

2. Llogaritni shumat e nevojshme për llogaritjen e koeficientëve të ekuacionit të regresionit linear dhe të koeficientit të përcaktimitR 2 :

; ;;.

Varësia e kërkuar e regresionit ka formën: . Ne përcaktojmë drejtimin e marrëdhënies midis variablave: shenja e koeficientit të regresionit është pozitive, prandaj, marrëdhënia është gjithashtu pozitive, gjë që konfirmon supozimin grafik.

3. Le të llogarisim koeficientin e përcaktimit: ose 92%. Kështu, modeli linear shpjegon 92% të ndryshimit në kohën e dorëzimit, që do të thotë se faktori (distanca) është zgjedhur saktë. 8% e variacionit kohor nuk shpjegohet, gjë që është për shkak të faktorëve të tjerë që ndikojnë në kohën e dorëzimit, por që nuk përfshihen në modelin e regresionit linear.

4. Le të kontrollojmë rëndësinë e ekuacionit të regresionit:

Sepse– ekuacioni i regresionit (modeli linear) është statistikisht i rëndësishëm.

5. Le të zgjidhim problemin e parashikimit. Që nga koeficienti i përcaktimitR 2 ka një vlerë mjaft të lartë dhe distanca prej 2 miljesh për të cilën do të bëhet parashikimi është brenda intervalit të të dhënave hyrëse, atëherë parashikimi mund të bëhet:

Analiza e regresionit mund të kryhet me lehtësi duke përdorur aftësitë Excel. Mënyra e funksionimit "Regresioni" përdoret për të llogaritur parametrat e ekuacionit të regresionit linear dhe për të kontrolluar përshtatshmërinë e tij për procesin në studim. Në kutinë e dialogut, plotësoni parametrat e mëposhtëm:

Shembulli 2. Plotësoni detyrën e shembullit 1 duke përdorur modalitetin "Regresion".Excel.

PËRFUNDIMI I REZULTATEVE

Statistikat e regresionit

Shumësi R

R-katror

R-katrore e normalizuar

Gabim standard

Vëzhgimet

Shanset

Gabim standard

t-statistika

P-Vlera

Kryqëzimi Y

Variabli X 1

Le të shohim rezultatet e analizës së regresionit të paraqitur në tabelë.

MadhësiaR-katror , i quajtur edhe masa e sigurisë, karakterizon cilësinë e vijës së regresionit që rezulton. Kjo cilësi shprehet me shkallën e korrespondencës ndërmjet të dhënave burimore dhe modelit të regresionit (të dhënat e llogaritura). Në shembullin tonë, masa e sigurisë është 0.91829, e cila tregon një përshtatje shumë të mirë të linjës së regresionit me të dhënat origjinale dhe përkon me koeficientin e përcaktimitR 2 , llogaritur me formulë.

Shumësi R - koeficienti i korrelacionit të shumëfishtë R - shpreh shkallën e varësisë së variablave të pavarur (X) dhe ndryshores së varur (Y) dhe është i barabartë me rrënjën katrore të koeficientit të përcaktimit. Në analizën e thjeshtë të regresionit linearkoeficienti i shumëfishtë Re barabartë me koeficientin linear të korrelacionit (r = 0,958).

Koeficientët e modelit linear:Y -kryqëzimi printon vlerën e termit dummyb, Avariabli X1 – koeficienti i regresionit a. Atëherë ekuacioni i regresionit linear është:

y = 2,6597x+ 5,9135 (që përputhet mirë me rezultatet e llogaritjes në shembullin 1).

Më pas, le të kontrollojmë rëndësinë e koeficientëve të regresionit:aDheb. Krahasimi i vlerave të kolonës në çifte Shanset Dhe Gabim standard Në tabelë shohim se vlerat absolute të koeficientëve janë më të mëdha se gabimet standarde të tyre. Për më tepër, këta koeficientë janë të rëndësishëm, siç mund të gjykohet nga vlerat e treguesit të vlerës P, të cilat janë më pak se niveli i rëndësisë së specifikuar α = 0.05.

Vëzhgimi

Parashikoi Y

Të mbetura

Bilancet standarde

Tabela tregon rezultatet e daljesmbetjet. Duke përdorur këtë pjesë të raportit, ne mund të shohim devijimet e secilës pikë nga vija e ndërtuar e regresionit. Vlera më e madhe absolutembetjenë këtë rast - 1,89256, më e vogla - 0,05399. Për të interpretuar më mirë këto të dhëna, vizatoni të dhënat origjinale dhe vijën e regresionit të ndërtuar. Siç shihet nga konstruksioni, linja e regresionit është "përshtatur" mirë me vlerat e të dhënave fillestare dhe devijimet janë të rastësishme.