Excel бағдарламасындағы корреляциялық және регрессиялық талдау: орындау нұсқаулары. Мұнай кен орындарын игеру нәтижесінде қабат және қабат сұйықтары қасиеттерінің өзгеруінің статистикалық тәуелділігін зерттеу Параболалық және көпмүшелік регрессия
Келесі деректер қол жетімді әртүрлі елдеразық-түлік тауарларының бөлшек сауда бағаларының индексі бойынша (х) және өнеркәсіп өндірісінің индексі бойынша (у).
Бөлшек азық-түлік бағасының индексі (x) | Өнеркәсіптік өндіріс индексі (y) | |
---|---|---|
1 | 100 | 70 |
2 | 105 | 79 |
3 | 108 | 85 |
4 | 113 | 84 |
5 | 118 | 85 |
6 | 118 | 85 |
7 | 110 | 96 |
8 | 115 | 99 |
9 | 119 | 100 |
10 | 118 | 98 |
11 | 120 | 99 |
12 | 124 | 102 |
13 | 129 | 105 |
14 | 132 | 112 |
Міндетті:
1. у-ның х-ке тәуелділігін сипаттау үшін келесі функциялардың параметрлерін есептеңіз:
А) сызықтық;
В) тыныштандырғыш;
В) тең қабырғалы гипербола.
3. Регрессия және корреляция параметрлерінің статистикалық маңыздылығын бағалау.
4. Азық-түлік тауарларының бөлшек сауда бағасының индексінің болжамдық мәні х=138 болатын өнеркәсіптік өндіріс индексінің у мәніне болжам жасаңыз.
Шешімі:
1. Сызықтық регрессия параметрлерін есептеу
Жүйені шешу қалыпты теңдеулер a және b қатысты:
1-кестеде көрсетілгендей есептелген мәліметтер кестесін құрастырайық.
1-кесте Сызықтық регрессияны бағалауға арналған болжалды деректер
Жоқ. | X | сағ | xy | x 2 | ж 2 | ||
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 7000 | 10000 | 4900 | 74,26340 | 0,060906 |
2 | 105 | 79 | 8295 | 11025 | 6241 | 79,92527 | 0,011712 |
3 | 108 | 85 | 9180 | 11664 | 7225 | 83,32238 | 0,019737 |
4 | 113 | 84 | 9492 | 12769 | 7056 | 88,98425 | 0,059336 |
5 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
6 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
7 | 110 | 96 | 10560 | 12100 | 9216 | 85,58713 | 0,108467 |
8 | 115 | 99 | 11385 | 13225 | 9801 | 91,24900 | 0,078293 |
9 | 119 | 100 | 11900 | 14161 | 10000 | 95,77849 | 0,042215 |
10 | 118 | 98 | 11564 | 13924 | 9604 | 94,64611 | 0,034223 |
11 | 120 | 99 | 11880 | 14400 | 9801 | 96,91086 | 0,021102 |
12 | 124 | 102 | 12648 | 15376 | 10404 | 101,4404 | 0,005487 |
13 | 129 | 105 | 13545 | 16641 | 11025 | 107,1022 | 0,020021 |
14 | 132 | 112 | 14784 | 17424 | 12544 | 110,4993 | 0,013399 |
Барлығы: | 1629 | 1299 | 152293 | 190557 | 122267 | 1299,001 | 0,701866 |
Орташа мән: | 116,3571 | 92,78571 | 10878,07 | 13611,21 | 8733,357 | X | X |
8,4988 | 11,1431 | X | X | X | X | X | |
72,23 | 124,17 | X | X | X | X | X |
Орташа мән мына формула бойынша анықталады:
Стандартты ауытқуды формула бойынша есептейміз:
және нәтижені 1-кестеге енгізіңіз.
Алынған мәнді квадраттау арқылы біз дисперсияны аламыз:
Теңдеудің параметрлерін мына формулалар арқылы да анықтауға болады:
Сонымен регрессия теңдеуі:
Демек, бөлшек саудадағы азық-түлік бағасының индексі 1-ге өскен кезде өнеркәсіптік өндіріс индексі орта есеппен 1,13-ке өседі.
Сызықтық жұп корреляция коэффициентін есептейік:
Байланыс тікелей және өте жақын.
Детерминация коэффициентін анықтайық:
Нәтижедегі вариация 74,59% х факторының өзгеруімен түсіндіріледі.
Регрессия теңдеуіне x нақты мәндерін қойып, теориялық (есептелген) мәндерді анықтаймыз.
сондықтан теңдеудің параметрлері дұрыс анықталады.
Орташа жуықтау қатесін есептейік - есептелген мәндердің нақты мәндерден орташа ауытқуы:
Орташа алғанда, есептелген мәндер нақты мәндерден 5,01% ауытқиды.
Біз F-тестінің көмегімен регрессия теңдеуінің сапасын бағалаймыз.
F-тест регрессия теңдеуінің статистикалық мәнсіздігі туралы H 0 гипотезасын және өзара жақындық көрсеткішін тексеруден тұрады. Ол үшін нақты F фактісі мен Фишер F-критериясының сыни (кестелік) F кестелік мәндері арасында салыстыру жүргізіледі.
F фактісі мына формуламен анықталады:
мұндағы n – халық бірліктерінің саны;
m – x айнымалылары үшін параметрлер саны.
Регрессия теңдеуінің алынған бағалары оны болжау үшін пайдалануға мүмкіндік береді.
Бөлшек азық-түлік бағасының индексінің болжамдық мәні х = 138 болса, онда өнеркәсіптік өндіріс индексінің болжамдық мәні:
2. Қуат регрессиясының келесі түрі бар:
Параметрлерді анықтау үшін қуат функциясының логарифмі орындалады:
Логарифмдік функцияның параметрлерін анықтау үшін ең кіші квадраттар әдісімен қалыпты теңдеулер жүйесі құрылады:
2-кестеде көрсетілгендей есептелген мәліметтер кестесін құрастырайық.
2-кесте Қуат регрессиясын бағалауға арналған есептелген деректер
Жоқ. | X | сағ | lg x | lg ж | lg x*lg y | (лог x) 2 | (лог y) 2 |
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 2,000000 | 1,845098 | 3,690196 | 4,000000 | 3,404387 |
2 | 105 | 79 | 2,021189 | 1,897627 | 3,835464 | 4,085206 | 3,600989 |
3 | 108 | 85 | 2,033424 | 1,929419 | 3,923326 | 4,134812 | 3,722657 |
4 | 113 | 84 | 2,053078 | 1,924279 | 3,950696 | 4,215131 | 3,702851 |
5 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
6 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
7 | 110 | 96 | 2,041393 | 1,982271 | 4,046594 | 4,167284 | 3,929399 |
8 | 115 | 99 | 2,060698 | 1,995635 | 4,112401 | 4,246476 | 3,982560 |
9 | 119 | 100 | 2,075547 | 2,000000 | 4,151094 | 4,307895 | 4,000000 |
10 | 118 | 98 | 2,071882 | 1,991226 | 4,125585 | 4,292695 | 3,964981 |
11 | 120 | 99 | 2,079181 | 1,995635 | 4,149287 | 4,322995 | 3,982560 |
12 | 124 | 102 | 2,093422 | 2,008600 | 4,204847 | 4,382414 | 4,034475 |
13 | 129 | 105 | 2,110590 | 2,021189 | 4,265901 | 4,454589 | 4,085206 |
14 | 132 | 112 | 2,120574 | 2,049218 | 4,345518 | 4,496834 | 4,199295 |
Барлығы | 1629 | 1299 | 28,90474 | 27,49904 | 56,79597 | 59,69172 | 54,05467 |
Орташа мән | 116,3571 | 92,78571 | 2,064624 | 1,964217 | 4,056855 | 4,263694 | 3,861048 |
8,4988 | 11,1431 | 0,031945 | 0,053853 | X | X | X | |
72,23 | 124,17 | 0,001021 | 0,0029 | X | X | X |
2-кестенің жалғасы Қуат регрессиясын бағалау үшін есептелген деректер
Жоқ. | X | сағ | ||||
---|---|---|---|---|---|---|
1 | 100 | 70 | 74,16448 | 17,34292 | 0,059493 | 519,1886 |
2 | 105 | 79 | 79,62057 | 0,385112 | 0,007855 | 190,0458 |
3 | 108 | 85 | 82,95180 | 4,195133 | 0,024096 | 60,61728 |
4 | 113 | 84 | 88,59768 | 21,13866 | 0,054734 | 77,1887 |
5 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
6 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
7 | 110 | 96 | 85,19619 | 116,7223 | 0,11254 | 10,33166 |
8 | 115 | 99 | 90,88834 | 65,79901 | 0,081936 | 38,6174 |
9 | 119 | 100 | 95,52408 | 20,03384 | 0,044759 | 52,04598 |
10 | 118 | 98 | 94,35840 | 13,26127 | 0,037159 | 27,18882 |
11 | 120 | 99 | 96,69423 | 5,316563 | 0,023291 | 38,6174 |
12 | 124 | 102 | 101,4191 | 0,337467 | 0,005695 | 84,90314 |
13 | 129 | 105 | 107,4232 | 5,872099 | 0,023078 | 149,1889 |
14 | 132 | 112 | 111,0772 | 0,85163 | 0,00824 | 369,1889 |
Барлығы | 1629 | 1299 | 1296,632 | 446,4152 | 0,703074 | 1738,357 |
Орташа мән | 116,3571 | 92,78571 | X | X | X | X |
8,4988 | 11,1431 | X | X | X | X | |
72,23 | 124,17 | X | X | X | X |
Қалыпты теңдеулер жүйесін шешу арқылы логарифмдік функцияның параметрлерін анықтаймыз.
Сызықтық теңдеуді аламыз:
Потенциализацияны орындағаннан кейін біз мыналарды аламыз:
Осы теңдеуге х-тің нақты мәндерін қойып, нәтиженің теориялық мәндерін аламыз. Олардың негізінде біз көрсеткіштерді есептейміз: қосылудың тығыздығы - корреляциялық көрсеткіш және орташа жуықтау қателігі.
Байланыс өте жақын.
Орташа алғанда, есептелген мәндер нақты мәндерден 5,02% ауытқиды.
Осылайша, H 0 – бағаланатын сипаттамалардың кездейсоқ сипаты туралы гипотеза жоққа шығарылады және олардың статистикалық маңыздылығы мен сенімділігі танылады.
Регрессия теңдеуінің алынған бағалары оны болжау үшін пайдалануға мүмкіндік береді. Бөлшек азық-түлік бағасының индексінің болжамдық мәні х = 138 болса, онда өнеркәсіптік өндіріс индексінің болжамдық мәні:
Бұл теңдеудің параметрлерін анықтау үшін қалыпты теңдеулер жүйесі қолданылады:
Айнымалыларға өзгеріс енгізейік
және аламыз келесі жүйеқалыпты теңдеулер:
Қалыпты теңдеулер жүйесін шешу арқылы гиперболаның параметрлерін анықтаймыз.
3-кестеде көрсетілгендей есептелген мәліметтер кестесін құрайық.
Кесте 3 Гиперболалық тәуелділікті бағалауға арналған есептелген деректер
Жоқ. | X | сағ | z | yz | ||
---|---|---|---|---|---|---|
1 | 100 | 70 | 0,010000000 | 0,700000 | 0,0001000 | 4900 |
2 | 105 | 79 | 0,009523810 | 0,752381 | 0,0000907 | 6241 |
3 | 108 | 85 | 0,009259259 | 0,787037 | 0,0000857 | 7225 |
4 | 113 | 84 | 0,008849558 | 0,743363 | 0,0000783 | 7056 |
5 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
6 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
7 | 110 | 96 | 0,009090909 | 0,872727 | 0,0000826 | 9216 |
8 | 115 | 99 | 0,008695652 | 0,860870 | 0,0000756 | 9801 |
9 | 119 | 100 | 0,008403361 | 0,840336 | 0,0000706 | 10000 |
10 | 118 | 98 | 0,008474576 | 0,830508 | 0,0000718 | 9604 |
11 | 120 | 99 | 0,008333333 | 0,825000 | 0,0000694 | 9801 |
12 | 124 | 102 | 0,008064516 | 0,822581 | 0,0000650 | 10404 |
13 | 129 | 105 | 0,007751938 | 0,813953 | 0,0000601 | 11025 |
14 | 132 | 112 | 0,007575758 | 0,848485 | 0,0000574 | 12544 |
Барлығы: | 1629 | 1299 | 0,120971823 | 11,13792 | 0,0010510 | 122267 |
Орташа мән: | 116,3571 | 92,78571 | 0,008640844 | 0,795566 | 0,0000751 | 8733,357 |
8,4988 | 11,1431 | 0,000640820 | X | X | X | |
72,23 | 124,17 | 0,000000411 | X | X | X |
3-кестенің жалғасы Гиперболалық тәуелділікті бағалауға арналған есептелген деректер
Бір факторлы регрессияның тағы бір түрі мына түрдегі дәрежелі көпмүшеліктер арқылы жуықтау болып табылады:
Екінші дәрежелі дәрежелі полиномдармен шектеліп, ең қарапайым тәуелділікті алғымыз келетіні табиғи нәрсе, яғни. параболалық тәуелділік:
(5.5.2)
Коэффициенттерге қатысты жартылай туындыларды есептейік б 0 , б 1 Және б 2 :
(5.5.3)
Туындыларды нөлге теңеп, қалыпты теңдеулер жүйесін аламыз:
(5.5.4)
Мәндердің нақты жағдайы үшін қалыпты теңдеулер жүйесін (5.5.2) шешу x мен *
,
ж мен *
;
Біз алып жатырмыз
оңтайлы мәндер б 0
,
б 1
Және б 2
.
Тәуелділік (5.5.2) және одан да көп (5.5.1) бойынша жуықтау үшін коэффициенттерді есептеудің қарапайым формулалары алынбаған және, әдетте, матрицалық түрдегі стандартты процедуралар арқылы есептеледі:
(5.5.5)
5.5.1-суретте параболалық тәуелділік арқылы жуықтаудың типтік мысалы келтірілген:
9 (5;9)
(1;1)
1
1 2 3 4 5 x
5.5.1-сурет. Эксперимент нүктелерінің координаталары және жуықтап алынған
олардың параболалық тәуелділігі
5.1-мысал.Сызықтық регрессия теңдеуі арқылы 5.1.1-кестеде келтірілген эксперимент нәтижелерін жуықтап алыңыз.
.
5.1.1-кесте
5.1.1-суретте берілген график бойынша 5.1.1-кестеде көрсетілген координаталар бойынша тәжірибе нүктелерін тұрғызайық.
сағ
9
4
1 2 3 4 5 x
5.1.1-суретке сәйкес, біз алдын ала бағалау үшін түзу сызық жүргіземіз, біз эксперимент нүктелерінің орналасуында анық көрсетілген сызықтық еместік бар деген қорытындыға келеміз, бірақ бұл өте маңызды емес, сондықтан оның мағынасы бар. оларды сызықтық тәуелділікпен жуықтау. Дұрыс математикалық қорытындыны алу үшін әдісті пайдаланып түзу салу қажет екенін ескеріңіз ең кіші квадраттар.
Регрессиялық талдауды орындамас бұрын есептеп алған жөн
айнымалылар арасындағы сызықтық корреляция коэффициенті XЖәне сағ:
Корреляциялық қатынастың маңыздылығы мына формуламен есептелетін сызықтық корреляция коэффициентінің критикалық мәнімен анықталады:
Студенттік тесттің сыни мәні т Критұсынылған маңыздылық деңгейі бойынша статистикалық кестелерге сәйкес табылды α=0,05және үшін n-2 еркіндік дәрежелері. Есептелген мән болса r xyсыни мәннен кем емес r Крит, содан кейін айнымалылар арасындағы корреляция x Және ж маңызды болып саналады. Есептеулерді жасайық:
Осыған байланысты
айнымалылар арасындағы корреляция деген қорытындыға келеміз XЖәне сағмаңызды және ол сызықты болуы мүмкін.
Регрессия теңдеуінің коэффициенттерін есептейік:
Осылайша, сызықтық регрессия теңдеуін алдық:
Регрессия теңдеуін пайдаланып 5.1.2-суретте түзу жүргіземіз.
у (5;9,8)
9
4
(0;-0.2) 1 2 3 4 5 x
5.1.2-сурет. Эксперимент нүктелерінің координаталары және жуықтап алынған
олардың сызықтық тәуелділігі
Регрессия теңдеуін пайдалана отырып, функцияның мәндерін 5.1.1-кестенің тәжірибелік нүктелері мен 5.1.2-кестеде берілген функцияның эксперименттік және есептелген мәндерінің арасындағы айырмашылық негізінде есептейміз.
5.1.2-кесте
Орташа квадрат қатесін және оның орташа мәнге қатынасын есептейік:
Стандартты қатенің орташа мәнге қатынасы бойынша қанағаттанарлықсыз нәтиже алынды, өйткені ұсынылған мәннен 0,05 асып кетті.
Регрессия теңдеуінің коэффициенттерінің мәнділік деңгейін Стьюденттің t-тесті арқылы бағалайық:
үшін статистикалық кестеден 3 дәрежелі еркіндік, мәнділік деңгейі бар жолдарды жазайық - және Студент критерийінің мәні – т 5.1.3 кестеге.
5.1.3-кесте
Регрессиялық теңдеу коэффициенттерінің мәнділік деңгейі:
Коэффициент үшін маңыздылық деңгейіне сәйкес екенін ескеріңіз қанағаттанарлық нәтиже алынды, және коэффициент үшін қанағаттанарлықсыз.
Алынған регрессия теңдеуінің сапасын дисперсияны талдау негізінде есептелген көрсеткіштер арқылы бағалайық:
Емтихан:
Тексеру нәтижесі оң, бұл орындалған есептеулердің дұрыстығын көрсетеді.
Фишер критерийін есептейік:
екі еркіндік дәрежесімен:
Статистикалық кестелерді пайдалана отырып, маңыздылық деңгейінің екі ұсынылған градациясы үшін Фишер критерийінің критикалық мәндерін табамыз:
Фишер сынағының есептелген мәні 0,01 маңыздылық деңгейі үшін критикалық мәннен асатындықтан, Фишер сынағы бойынша маңыздылық деңгейі 0,01-ден төмен деп есептейміз, ол қанағаттанарлық деп саналады.
Көптік детерминация коэффициентін есептейік:
екі еркіндік дәрежесі үшін
Ұсынылған мәнділік деңгейі 0,05 және табылған екі еркіндік дәрежесі үшін статистикалық кестені пайдалана отырып, еселік детерминация коэффициентінің критикалық мәнін табамыз:
Көптік детерминация коэффициентінің есептелген мәні маңыздылық деңгейі үшін критикалық мәннен асатындықтан
, содан кейін еселік детерминация коэффициенті бойынша маңыздылық деңгейі
және ұсынылған көрсеткіш бойынша алынған нәтиже қанағаттанарлық деп есептеледі.
Осылайша, стандартты қатенің орташа мәнге қатынасы және Студенттік тест бойынша маңыздылық деңгейі бойынша алынған есептелген параметрлер қанағаттанарлықсыз, сондықтан жуықтау үшін басқа жуықтау тәуелділігін таңдаған жөн.
5.2-мысал.Кездейсоқ сандардың тәжірибелік таралуын математикалық тәуелділік арқылы жуықтау
5.1.1-кестеде келтірілген кездейсоқ сандарды эксперименттік бөлу сызықтық тәуелділікпен жуықтаған кезде, қанағаттанарлық нәтижеге әкелмеді, соның ішінде. Еркін мүшесі бар регрессия теңдеуінің коэффициенті шамалы болғандықтан, жуықтау сапасын жақсарту үшін біз оны еркін мүшесіз сызықтық тәуелділікті пайдаланып орындауға тырысамыз:
Регрессия теңдеуінің коэффициентінің мәнін есептейік:
Осылайша, регрессия теңдеуін алдық:
Алынған регрессия теңдеуін пайдалана отырып, біз функцияның мәндерін және функцияның эксперименттік және есептелген мәндерінің айырмашылығын есептейміз, біз оны 5.2.1 кесте түрінде береміз.
5.2.1-кесте
x мен | ||||
Регрессия теңдеуі бойынша
5.2.1-суретте түзу сызық жүргіземіз.
у (5;9.73 )
(0;0) 1 2 3 4 5 x
5.2.1-сурет. Эксперимент нүктелерінің координаталары және жуықтап алынған
олардың сызықтық тәуелділігі
Жақындаудың сапасын бағалау үшін біз 5.1 мысалында келтірілген есептеулерге ұқсас сапа көрсеткіштерінің есептеулерін жүргіземіз.
(ескі қалады);
4 еркіндік дәрежесімен;
Үшін
Жақындау нәтижелері бойынша регрессия теңдеуінің коэффициентінің мәнділік деңгейі бойынша қанағаттанарлық нәтиже алынғанын атап өтеміз; Стандартты қатенің орташа мәнге қатынасы жақсарды, бірақ әлі де ұсынылған 0,05 мәнінен жоғары, сондықтан күрделірек математикалық қатынаспен жуықтауды қайталау ұсынылады.
5.3-мысал. 5.1 және 5.2 мысалдарының жуықтау сапасын жақсарту үшін тәуелділік бойынша сызықты емес жуықтау жүргіземіз.
. Ол үшін алдымен аралық есептеулер жасап, олардың нәтижелерін 5.3.1 кестеге орналастырамыз.
Құндылықтар
5.3.1-кесте
X 2 | ||||||
(lnX) 2 | ||||||
lnX lnY |
Қосымша есептейік:
Тәуелділікті жуықтап алайық
. (5.3.7), (5.3.8) формулалары арқылы коэффициенттерді есептейміз б 0
Және б 1
:
(5.3.11) формулалар арқылы коэффициенттерді есептейміз А 0 Және А 1 :
Стандартты қатені есептеу үшін 5.3.2 кестеде келтірілген аралық есептеулер жүргізілді.
5.3.2-кесте
Ы мен |
ж мен | ||
Сомасы: 7,5968
Жақындаудың стандартты қатесі алдыңғы екі мысалға қарағанда әлдеқайда үлкен болып шықты, сондықтан жуықтау нәтижелерін жарамсыз деп санаймыз.
5.4-мысал.Басқа сызықтық емес тәуелділікпен жуықтап көрейік
. 5.3.1-кестеге сәйкес (5.3.9), (5.3.10) формулаларды пайдалана отырып, коэффициенттерді есептейміз. б 0
Және б 1
:
Бізде аралық тәуелділік пайда болды:
(5.3.13) формулалар арқылы коэффициенттерді есептейміз C 0 Және C 1 :
Біз соңғы тәуелділікті алдық:
Стандартты қатені есептеу үшін аралық есептеулерді жүргізіп, 5.4.1 кестеге орналастырамыз.
5.4.1-кесте
Ы мен |
ж мен | ||
Сома: 21,83152
Стандартты қатені есептейік:
Жақындаудың стандартты қатесі алдыңғы мысалға қарағанда әлдеқайда үлкен болып шықты, сондықтан жуықтау нәтижелерін жарамсыз деп санаймыз.
5.5-мысал.Кездейсоқ сандардың тәжірибелік таралуын математикалық тәуелділік арқылы жуықтау ж = б · lnx
Бастапқы деректер алдыңғы мысалдардағыдай 5.4.1-кестеде және 5.4.1-суретте көрсетілген.
5.4.1-кесте
5.4.1-сурет пен 5.4.1-кестенің талдауына сүйене отырып, аргументтің кіші мәндерімен (кестенің басында) функция үлкен мәндерге қарағанда (соңында) көбірек өзгеретінін атап өтеміз. кесте), сондықтан аргументтің масштабын өзгертіп, одан регрессия теңдеуіне логарифмдік функцияны енгізіп, келесі математикалық тәуелділікпен жуықтап алған жөн сияқты:
. (5.4.3) формуласы арқылы коэффициентті есептейміз б:
Жақындаудың сапасын бағалау үшін 5.4.2-кестеде келтірілген аралық есептеулерді жүргіземіз, одан қатенің шамасын және стандартты қатенің орташа мәнге қатынасын есептейміз.
5.4.2-кесте
Стандартты қатенің орташа мәнге қатынасы ұсынылған 0,05 мәнінен асатындықтан, нәтиже қанағаттанарлықсыз деп есептеледі. Атап айтқанда, ең үлкен ауытқу мәнмен берілетінін ескереміз x=1,өйткені осы мәнмен lnx=0. Сондықтан біз тәуелділікті жуықтап аламыз ж = б 0 +б 1 lnx
Көмекші есептеулерді 5.4.3 кесте түрінде береміз.
5.4.3-кесте
(5.4.6) және (5.4.7) формулалары арқылы коэффициенттерді есептейміз б 0 және б 1 :
9 (5;9.12)
4
1 (1;0.93)
1 2 3 4 5 x
Жақындаудың сапасын бағалау үшін біз көмекші есептеулер жүргізіп, табылған коэффициенттердің маңыздылық деңгейін және стандартты қатенің орташа мәнге қатынасын анықтаймыз.
Маңыздылық деңгейі ұсынылған 0,05 мәнінен сәл жоғары (
).
Негізгі көрсеткіш бойынша – стандартты қатенің орташа мәнге қатынасы – ұсынылған 0,05 деңгейінен екі есе дерлік асуы алынғанына байланысты біз нәтижелерді қолайлы деп санаймыз. Студенттік тесттің есептелген мәнін ескеріңіз т б 0
=2,922
сыни тұрғыдан ерекшеленеді
салыстырмалы түрде аз мөлшерде.
5.6-мысал. 5.1-мысалдағы эксперименттік мәліметтерді гиперболалық тәуелділік арқылы жуықтап алайық
. Коэффициенттерді есептеу үшін б 0 және б 1
5.6.1-кестеде келтірілген алдын ала есептеулерді жүргізейік.
5.6.1-кесте
X мен |
x мен =1/X мен |
x мен 2 |
x мен ж мен | ||
(5.4.8) және (5.4.9) формулаларын пайдаланып 5.6.1-кестенің нәтижелері бойынша коэффициенттерді есептейміз. б 0 және б 1 :
Осылайша гиперболалық регрессия теңдеуі алынады
.
Жақындау сапасын бағалау үшін көмекші есептеулердің нәтижелері 5.6.2-кестеде келтірілген.
5.6.2-кесте
X мен | ||||
5.6.2-кестенің нәтижелері бойынша стандартты қатені және стандартты қатенің орташа мәнге қатынасын есептейміз:
Стандартты қатенің орташа мәнге қатынасы ұсынылған 0,05 мәннен асатындықтан, жуықтау нәтижелері жарамсыз деген қорытындыға келеміз.
5.7-мысал.
Техникалық қызмет көрсету уақытына байланысты жебелі крандарды пайдаланудан түсетін кірістің нақты мәндерін есептеу үшін параболалық тәуелділікті алу қажет.
Осы тәуелділіктің коэффициенттерін есептейік б 0 , б 1 , б 11 формула бойынша матрицалық түрде:
Statistica 6.0 қолданбалы пакетінің көп реттік регрессия процедурасы арқылы мұнара крандарына профилактикалық қызмет көрсету үшін тиімді көрсеткішті оңтайлы мәндермен байланыстыратын сызықты емес регрессия теңдеулері алынды. Әрі қарай 5.7.1-кестеге сәйкес тиімді тиімділік көрсеткіші бойынша регрессиялық талдау нәтижелерін ұсынамыз.
5.7.1-кесте
5.7.2-кестеде тиімді тиімділік көрсеткіші бойынша сызықтық емес регрессия нәтижелері және 5.7.3-кестеде қалдық талдау нәтижелері көрсетілген.
5.7.2-кесте
5.7.3-кесте
Күріш. 3.7.36. Қалдықтарды талдау.
Осылайша, біз айнымалы үшін көп регрессия теңдеуін алдық
:
Стандартты қателік қатынасы:
14780/1017890=0,0145 < 0,05.
Стандартты қатенің орташа мәнге қатынасы ұсынылған 0,05 мәнінен аспайтындықтан, жуықтау нәтижелерін қолайлы деп санауға болады. 5.7.2-кестеге сәйкес кемшілік ретінде барлық есептелген коэффициенттер ұсынылған маңыздылық деңгейінен 0,05 асатынын атап өткен жөн.
түріндегі регрессия теңдеуін құруды қарастырайық.
Параболалық регрессия коэффициенттерін табу үшін қалыпты теңдеулер жүйесін құрастыру қалыпты сызықтық регрессия теңдеулерін құрастыру сияқты жүзеге асырылады.
Түрлендірулерден кейін біз аламыз:
.
Қалыпты теңдеулер жүйесін шешу арқылы регрессия теңдеуінің коэффициенттері алынады.
,
Қайда , А.
Екінші дәрежелі теңдеу, егер сызықтық регрессия дисперсиясымен салыстырғанда дисперсияның төмендеуі маңызды (кездейсоқ емес) болса, эксперименттік деректерді бірінші дәрежелі теңдеуден айтарлықтай жақсырақ сипаттайды. және арасындағы айырмашылықтың маңыздылығы Фишер критерийі бойынша бағаланады:
мұндағы сан еркіндік дәрежелеріне және таңдалған маңыздылық деңгейіне сәйкес анықтамалық статистикалық кестелерден (1-қосымша) алынады.
Есептеу жұмыстарын орындау тәртібі:
1. Танысыңыз теориялық материал, нұсқауларда немесе қосымша әдебиеттерде көрсетілген.
2. Коэффициенттерді есептеңіз сызықтық теңдеурегрессия. Ол үшін сомаларды есептеу керек. Сомаларды бірден ыңғайлы есептеңіз , олар параболалық теңдеудің коэффициенттерін есептеу үшін пайдалы.
3. Теңдеу арқылы шығыс параметрінің есептелген мәндерін есептеңіз.
4. Толық және қалдық дисперсияны, сонымен қатар Фишер критерийін есептеңіз.
Қайда – элементтері қалыпты теңдеулер жүйесінің коэффициенттері болып табылатын матрица;
– элементтері белгісіз коэффициенттер болатын вектор;
– теңдеулер жүйесінің оң жақтарының матрицасы.
7. Теңдеу арқылы шығыс параметрінің есептелген мәндерін есептеңіз .
8. Қалдық дисперсияны, сондай-ақ Фишер критерийін есептеңіз.
9. Қорытынды жасаңыз.
10. Регрессия теңдеулерінің графиктерін және бастапқы мәліметтерді құру.
11. Есеп айырысу жұмыстарын аяқтау.
Есептеу мысалы.
Су буының тығыздығының температураға тәуелділігі туралы тәжірибелік мәліметтерді пайдалана отырып, және түріндегі регрессия теңдеулерін алыңыз. Статистикалық талдау жүргізіп, ең жақсы эмпирикалық қатынас туралы қорытынды жасаңыз.
0,0512 | 0,0687 | 0,081 | 0,1546 | 0,2516 | 0,3943 | 0,5977 | 0,8795 |
Эксперименттік мәліметтерді өңдеу жұмыс бойынша ұсыныстарға сәйкес жүргізілді. Сызықтық теңдеудің параметрлерін анықтауға арналған есептеулер 1-кестеде келтірілген.
1-кесте – Пішіннің сызықтық тәуелділігінің параметрлерін табу | ||||||||
Қанықтыру сызығындағы су буының тығыздығы | ||||||||
№ | т и,°C | , ом | т и 2 | есептеу. | ||||
0,0512 | 2,05 | -0,0403 | -0,0915 | 0,0084 | 0,0669 | |||
0,0687 | 3,16 | 0,0248 | -0,0439 | 0,0019 | 0,0582 | |||
0,0811 | 4,22 | 0,0899 | 0,0089 | 0,0001 | 0,0523 | |||
0,1546 | 9,9 | 0,2202 | 0,06565 | 0,0043 | 0,0241 | |||
0,2516 | 19,12 | 0,3505 | 0,09894 | 0,0098 | 0,0034 | |||
0,3943 | 34,70 | 0,4808 | 0,08654 | 0,0075 | 0,0071 | |||
0,5977 | 59,77 | 0,6111 | 0,01344 | 0,0002 | 0,0829 | |||
0,8795 | 98,50 | 0,7414 | -0,13807 | 0,0191 | 0,3245 | |||
сома | 2,4786 | 231,41 | 0,0512 | 0,6194 | ||||
орташа | 72,25 | 0,3098 | 5822,5 | 28,93 | ||||
б 0 = | -0,4747 | D 1 ст 2 = | 0,0085 | |||||
б 1 = | 0,0109 | Dy 2 = | 0,0885 | |||||
Ф= | 10,368 | |||||||
Ф T =3,87 Ф>Ф T моделі адекватты |
.
Параболалық регрессияның параметрлерін анықтау үшін алдымен нормал теңдеулер жүйесінің коэффициенттік матрицасының элементтері мен оң жақтарының матрицасы анықталды. Содан кейін коэффициенттер MathCad ортасында есептелді:
Есептеу деректері 2-кестеде келтірілген.
2-кестедегі белгілер:
.
қорытындылар
Параболалық теңдеу будың тығыздығының температураға тәуелділігі туралы тәжірибелік деректерді айтарлықтай жақсырақ сипаттайды, өйткені Фишер критерийінің есептелген мәні 4.39 кестелік мәннен айтарлықтай асып түседі. Сондықтан көпмүшелік теңдеуге квадрат мүшені қосу мағынасы бар.
Алынған нәтижелер графикалық түрде берілген (3-сурет).
3-сурет – Есептеу нәтижелерінің графикалық интерпретациясы.
нүктелі сызық сызықтық регрессия теңдеуі; тұтас сызық – параболалық регрессия, графиктегі нүктелер – тәжірибелік мәндер.
Кесте 2. – Тәуелділік түрінің параметрлерін табу ж(т)=а 0 +а 1 ∙x+a 2 ∙x 2 | Қанықтыру сызығындағы су буының тығыздығы ρ= а 0 +а 1 ∙t+a 2 ∙т 2 | (ρ мен–ρав) 2 | 0,0669 | 0,0582 | 0,0523 | 0,0241 | 0,0034 | 0,0071 | 0,0829 | 0,03245 | 0,6194 | |||||
(Δρ) 2 | 0,0001 | 0,0000 | 0,0000 | 0,0002 | 0,0000 | 0,0002 | 0,0002 | 0,0002 | 0,0010 | 0,0085 | 0,0002 | 0,0885 | 42,5 | |||
∆ρ мен=ρ( т и)calc–ρ мен | 0,01194 | –0,00446 | –0,00377 | –0,01524 | –0,00235 | 0,01270 | 0,011489 | –0,01348 | D 1 2 демалыс = | D 2 2 демалыс = | D 1 2 ж= | F= | ||||
ρ( т и) есептеу. | 0,0631 | 0,0642 | 0,0773 | 0,1394- | 0,2493 | 0,4070 | 0,6126 | 0,8660 | 2,4788 | |||||||
т и 2ρ мен | 81,84 | 145,33 | 219,21 | 633,24 | 1453,2 | 3053,4 | 5977,00 | 11032,45 | 22595,77 | |||||||
т и 4 | ||||||||||||||||
т и 3 | ||||||||||||||||
т иρ мен | 2,05 | 3,16 | 4,22 | 9,89 | 19,12 | 34,70 | 59,77 | 98,50 | 231,41 | |||||||
т и 2 | ||||||||||||||||
ρ, ом | 0,0512 | 0,0687 | 0,0811 | 0,1546 | 0,2516 | 0,3943 | 0,5977 | 0,8795 | 2,4786 | 0,3098 | ||||||
т и,°C | 0,36129 | –0,0141 | 1.6613E-04 | |||||||||||||
№ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | сома | орташа | a 0 = | a 1 = | a 2 = |
1-қосымша
Фишер тарату кестесі q = 0,05
f 2 | - | |||||||||
f 1 | ||||||||||
161,40 | 199,50 | 215,70 | 224,60 | 230,20 | 234,00 | 238,90 | 243,90 | 249,00 | 254,30 | |
18,51 | 19,00 | 19,16 | 19,25 | 19,30 | 19,33 | 19,37 | 19,41 | 19,45 | 19,50 | |
10,13 | 9,55 | 9,28 | 9,12 | 9,01 | 8,94 | 8,84 | 8,74 | 8,64 | 8,53 | |
7,71 | 6,94 | 6,59 | 6,39 | 6,76 | 6,16 | 6,04 | 5,91 | 5,77 | 5,63 | |
6,61 | 5,79 | 5,41 | 5,19 | 5,05 | 4,95 | 4,82 | 4,68 | 4,53 | 4,36 | |
5,99 | 5,14 | 4,76 | 4,53 | 4,39 | 4,28 | 4,15 | 4,00 | 3,84 | 3,67 | |
5,59 | 4,74 | 4,35 | 4,12 | 3,97 | 3,87 | 3,73 | 3,57 | 3,41 | 3,23 | |
5,32 | 4,46 | 4,07 | 3,84 | 3,69 | 3,58 | 3,44 | 3,28 | 3,12 | 2,93 | |
5,12 | 4,26 | 3,86 | 3,63 | 3,48 | 3,37 | 3,24 | 3,07 | 2,90 | 2,71 | |
4,96 | 4,10 | 3,71 | 3,48 | 3,33 | 3,22 | 3,07 | 2,91 | 2,74 | 2,54 | |
4,84 | 3,98 | 3,59 | 3,36 | 3,20 | 3,09 | 2,95 | 2,79 | 2,61 | 2,40 | |
4,75 | 3,88 | 3,49 | 3,26 | 3,11 | 3,00 | 2,85 | 2,69 | 2,50 | 2,30 | |
4,67 | 3,80 | 3,41 | 3,18 | 3,02 | 2,92 | 2,77 | 2,60 | 2,42 | 2,21 | |
4,60 | 3,74 | 3,34 | 3,11 | 2,96 | 2,85 | 2,70 | 2,53 | 2,35 | 2,13 | |
4,54 | 3,68 | 3,29 | 3,06 | 2,90 | 2,79 | 2,64 | 2,48 | 2,29 | 2,07 | |
4,49 | 3,63 | 3,24 | 3,01 | 2,82 | 2,74 | 2,59 | 2,42 | 2,24 | 2,01 | |
4,45 | 3,59 | 3,20 | 2,96 | 2,81 | 2,70 | 2,55 | 2,38 | 2,19 | 1,96 | |
4,41 | 3,55 | 3,16 | 2,93 | 2,77 | 2,66 | 2,51 | 2,34 | 2,15 | 1,92 | |
4,38 | 3,52 | 3,13 | 2,90 | 2,74 | 2,63 | 2,48 | 2,31 | 2,11 | 1,88 | |
4,35 | 3,49 | 3,10 | 2,87 | 2,71 | 2,60 | 2,45 | 2,28 | 2,08 | 1,84 | |
4,32 | 3,47 | 3,07 | 2,84 | 2,68 | 2,57 | 2,42 | 2,25 | 2,05 | 1,81 | |
4,30 | 3,44 | 3,05 | 2,82 | 2,66 | 2,55 | 2,40 | 2,23 | 2,03 | 1,78 | |
4,28 | 3,42 | 3,03 | 2,80 | 2,64 | 2,53 | 2,38 | 2,20 | 2,00 | 1,76 | |
4,26 | 3,40 | 3,01 | 2,78 | 2,62 | 2,51 | 2,36 | 2,18 | 1,98 | 1,73 | |
4,24 | 3,38 | 2,99 | 2,76 | 2,60 | 2,49 | 2,34 | 2,16 | 1,96 | 1,71 | |
4,22 | 3,37 | 2,98 | 2,74 | 2,59 | 2,47 | 2,32 | 2,15 | 1,95 | 1,69 | |
4,21 | 3,35 | 2,96 | 2,73 | 2,57 | 2,46 | 2,30 | 2,13 | 1,93 | 1,67 | |
4,20 | 3,34 | 2,95 | 2,71 | 2,56 | 2,44 | 2,29 | 2,12 | 1,91 | 1,65 | |
4,18 | 3,33 | 2,93 | 2,70 | 2,54 | 2,43 | 2,28 | 2,10 | 1,90 | 1,64 | |
4,17 | 3,32 | 2,92 | 2,69 | 2,53 | 2,42 | 2,27 | 2,09 | 1,89 | 1,62 | |
4,08 | 3,23 | 2,84 | 2,61 | 2,45 | 2,34 | 2,18 | 2,00 | 1,79 | 1,52 | |
4,00 | 3,15 | 2,76 | 2,52 | 2,37 | 2,25 | 2,10 | 1,92 | 1,70 | 1,39 | |
3,92 | 3,07 | 2,68 | 2,45 | 2,29 | 2,17 | 2,02 | 1,88 | 1,61 | 1,25 |
Регрессиялық және корреляциялық талдау статистикалық зерттеу әдістері болып табылады. Бұл параметрдің бір немесе бірнеше тәуелсіз айнымалыларға тәуелділігін көрсетудің ең кең таралған тәсілдері.
Төменде нақты практикалық мысалдарды пайдалана отырып, экономистер арасында өте танымал осы екі талдауды қарастырамыз. Оларды біріктіру кезінде нәтиже алудың мысалын да келтіреміз.
Excel бағдарламасындағы регрессиялық талдау
Кейбір мәндердің (тәуелсіз, тәуелсіз) тәуелді айнымалыға әсерін көрсетеді. Мысалы, экономикалық белсенді халық саны кәсіпорын санына, жалақыға және басқа да көрсеткіштерге қалай тәуелді. Немесе: ЖІӨ деңгейіне шетелдік инвестициялар, энергия бағасы және т.б. қалай әсер етеді.
Талдау нәтижесі басымдықтарды бөліп көрсетуге мүмкіндік береді. Ал негізгі факторларға сүйене отырып, басым бағыттардың дамуын болжау, жоспарлау, басқару шешімдерін қабылдау.
Регрессия жүреді:
- сызықтық (y = a + bx);
- параболалық (y = a + bx + cx 2);
- экспоненциалды (y = a * exp(bx));
- қуат (y = a*x^b);
- гиперболалық (y = b/x + a);
- логарифмдік (y = b * 1n(x) + a);
- экспоненциалды (y = a * b^x).
Excel бағдарламасында регрессия үлгісін құру және нәтижелерді түсіндіру мысалын қарастырайық. Регрессияның сызықтық түрін алайық.
Тапсырма. 6 кәсіпорында орташа айлық еңбекақы және жұмыстан кеткен қызметкерлердің саны талданды. Жұмыстан шығатын қызметкерлер санының орташа жалақыға тәуелділігін анықтау қажет.
Сызықтық регрессия моделі келесідей көрінеді:
Y = a 0 + a 1 x 1 +…+a k x k.
Мұндағы a регрессия коэффициенттері, х – әсер етуші айнымалылар, k – факторлар саны.
Біздің мысалда Y - қызметкерлердің жұмыстан шығу көрсеткіші. Әсер етуші фактор – жалақы (х).
Excel бағдарламасында сызықтық регрессия үлгісінің параметрлерін есептеуге көмектесетін кірістірілген функциялар бар. Бірақ «Талдау пакеті» қондырмасы мұны жылдамырақ жасайды.
Біз қуатты аналитикалық құралды іске қосамыз:
Қосылғаннан кейін қондырма Деректер қойындысында қолжетімді болады.
Енді регрессиялық талдаудың өзін жасайық.
Ең алдымен, біз R-квадрат пен коэффициенттерге назар аударамыз.
R-квадрат – детерминация коэффициенті. Біздің мысалда – 0,755 немесе 75,5%. Бұл модельдің есептелген параметрлері зерттелетін параметрлер арасындағы байланыстың 75,5% түсіндіреді дегенді білдіреді. Детерминация коэффициенті неғұрлым жоғары болса, модель соғұрлым жақсы болады. Жақсы - 0,8 жоғары. Нашар – 0,5-тен аз (мұндай талдауды негізді деп санауға болмайды). Біздің мысалда – «жаман емес».
64.1428 коэффициенті қарастырылатын модельдегі барлық айнымалылар 0-ге тең болса, Y қандай болатынын көрсетеді. Яғни, талданатын параметрдің мәніне модельде сипатталмаған басқа факторлар да әсер етеді.
-0,16285 коэффициенті X айнымалысының Y бойынша салмағын көрсетеді. Яғни, осы үлгідегі орташа айлық жалақы -0,16285 салмағы бар жұмыстан бас тартушылардың санына әсер етеді (бұл аз әсер ету дәрежесі). «-» белгісі теріс әсерді көрсетеді: жалақы неғұрлым жоғары болса, соғұрлым аз адам жұмыстан кетеді. Қайсысы әділ.
Excel бағдарламасындағы корреляциялық талдау
Корреляциялық талдау бір немесе екі үлгідегі көрсеткіштер арасында байланыс бар-жоғын анықтауға көмектеседі. Мысалы, машинаның жұмыс істеу уақыты мен жөндеу құнының арасында, жабдықтың бағасы мен жұмыс ұзақтығы, балалардың бойы мен салмағы және т.б.
Егер байланыс бар болса, онда бір параметрдің жоғарылауы екіншісінің өсуіне (оң корреляцияға) немесе төмендеуіне (теріс) әкеледі. Корреляциялық талдау талдаушыға бір көрсеткіштің мәнін басқаның мүмкін мәнін болжау үшін пайдалануға болатынын анықтауға көмектеседі.
Корреляция коэффициенті r арқылы белгіленеді. +1 мен -1 аралығында өзгереді. Әр түрлі салалар үшін корреляцияның жіктелуі әртүрлі болады. Коэффицент 0 болғанда, үлгілер арасында сызықтық байланыс болмайды.
Excel бағдарламасының көмегімен корреляция коэффициентін қалай табуға болатынын қарастырайық.
Жұпталған коэффициенттерді табу үшін CORREL функциясы қолданылады.
Мақсаты: Токарлық станоктың жұмыс уақыты мен оған қызмет көрсету құнының арасында тәуелділік бар-жоғын анықтау.
Курсорды кез келген ұяшыққа қойып, fx түймесін басыңыз.
- «Статистикалық» санатында CORREL функциясын таңдаңыз.
- «1-массив» аргументі – мәндердің бірінші диапазоны – машинаның жұмыс уақыты: A2:A14.
- «2-массив» аргументі – мәндердің екінші диапазоны – жөндеу құны: B2:B14. OK түймесін басыңыз.
Байланыс түрін анықтау үшін коэффициенттің абсолютті санына қарау керек (әрбір қызмет саласының өз масштабы бар).
Үшін корреляциялық талдаубірнеше параметрлерді (2-ден көп), «Деректерді талдауды» («Талдау пакеті» қосымшасы) пайдалану ыңғайлырақ. Тізімнен корреляцияны таңдап, массивті белгілеу керек. Барлық.
Алынған коэффициенттер корреляциялық матрицада көрсетіледі. Бұл сияқты:
Корреляциялық және регрессиялық талдау
Іс жүзінде бұл екі әдіс жиі бірге қолданылады.
Мысалы:
Енді регрессиялық талдау деректері көрінді.
Екі айнымалы арасындағы байланыстың жұпталған сызықтық регрессия моделін қарастырайық, ол үшін регрессия функциясы φ(x)сызықтық. арқылы белгілейік ж xсипаттаманың шартты орташа мәні ЫВ халықбелгіленген құн бойынша xайнымалы X. Сонда регрессия теңдеуі келесідей болады:
ж x = балта + б, Қайда а–регрессия коэффициенті(сызықтық регрессия сызығының көлбеуінің көрсеткіші) . Регрессия коэффициенті айнымалының орташа қанша бірлікке өзгеретінін көрсетеді Ыайнымалыны өзгерткенде Xбір бірлік үшін. Ең кіші квадраттар әдісін қолдана отырып, сызықтық регрессия параметрлерін есептеу үшін қолдануға болатын формулалар алынады:
Кесте 1. Сызықтық регрессия параметрлерін есептеу формулалары
Тегін мүше б |
Регрессия коэффициенті а |
Анықтау коэффициенті |
Регрессия теңдеуінің маңыздылығы туралы гипотезаны тексеру |
||
Н 0 : |
Н 1 : | |
, ,, 7-қосымша (сызықтық регрессия үшін p = 1) |
Айнымалылар арасындағы байланыстың бағыты регрессия коэффициентінің белгісі негізінде анықталады. Егер регрессия коэффициентінің таңбасы оң болса, тәуелді айнымалы мен тәуелсіз айнымалы арасындағы байланыс оң болады. Егер регрессия коэффициентінің таңбасы теріс болса, тәуелді айнымалы мен тәуелсіз айнымалы арасындағы байланыс теріс (кері) болады.
Регрессия теңдеуінің жалпы сапасын талдау үшін детерминация коэффициенті қолданылады Р 2 , сонымен қатар еселік корреляция коэффициентінің квадраты деп аталады. Детерминация коэффициенті (сенімділік өлшемі) әрқашан интервал ішінде болады. Мән болса Р 2 бірлікке жақын, бұл құрастырылған модель сәйкес айнымалылардағы барлық дерлік өзгергіштікті түсіндіретінін білдіреді. Керісінше, мағынасы Р 2 нөлге жақын, құрастырылған үлгінің сапасыздығын білдіреді.
Анықтау коэффициенті Р 2 табылған регрессия функциясы бастапқы мәндер арасындағы қатынасты қанша пайызға сипаттайтынын көрсетеді ЫЖәне X. Суретте. 3-суретте регрессия үлгісімен түсіндірілетін вариация және жалпы вариация көрсетілген. Сәйкесінше, мән параметрдің вариациясының қанша пайызын көрсетеді Ырегрессиялық модельге кірмейтін факторларға байланысты.
Детерминация коэффициентінің жоғары мәні 75% болғанда, бастапқы деректер диапазонында белгілі бір мәнге болжам жасауға болады. Бастапқы деректер ауқымынан тыс мәндерді болжау кезінде алынған модельдің жарамдылығына кепілдік берілмейді. Бұл модель ескермейтін жаңа факторлардың әсері пайда болуы мүмкін екендігімен түсіндіріледі.
Регрессия теңдеуінің маңыздылығы Фишер критерийі арқылы бағаланады (1-кестені қараңыз). Нөлдік гипотеза ақиқат болған жағдайда, критерийде еркіндік дәрежелерінің саны бар Фишер үлестірімі болады. , (жұпталған сызықтық регрессия үшін p = 1). Егер нөлдік гипотеза жоққа шығарылса, онда регрессия теңдеуі статистикалық маңызды болып саналады. Егер нөлдік гипотеза жоққа шығарылмаса, онда регрессия теңдеуі статистикалық маңызды емес немесе сенімсіз болып саналады.
1-мысал.Машина цехында өнімнің өзіндік құнының құрылымы мен сатып алынатын бөлшектердің үлесі талданады. Құрамдас бөліктердің құны олардың жеткізілу уақытына байланысты екені атап өтілді. Жеткізу уақытына әсер ететін ең маңызды фактор ретінде жүріп өткен қашықтық таңдалды. Жеткізу деректерінің регрессиялық талдауын жүргізу:
Қашықтық, миль | ||||||||||
Уақыт, мин |
Регрессиялық талдауды орындау үшін:
бастапқы мәліметтердің графигін тұрғызу, шамамен тәуелділік сипатын анықтау;
регрессия функциясының түрін таңдау және ең кіші квадраттар әдісі мен байланыс бағытын қолданып модельдің сандық коэффициенттерін анықтау;
детерминация коэффициенті арқылы регрессияға тәуелділік күшін бағалау;
регрессия теңдеуінің маңыздылығын бағалау;
қабылданған үлгі бойынша 2 миль қашықтыққа болжам жасау (немесе болжау мүмкін еместігі туралы қорытынды).
2. Сызықтық регрессия теңдеуінің коэффициенттерін және детерминация коэффициентін есептеуге қажетті шамаларды есептеңіз.Р 2 :
; ;;.
Қажетті регрессия тәуелділігі келесі формада болады: . Айнымалылар арасындағы байланыстың бағытын анықтаймыз: регрессия коэффициентінің таңбасы оң, сондықтан байланыс та оң, бұл графикалық болжамды растайды.
3. Детерминация коэффициентін есептейік: немесе 92%. Осылайша, сызықтық модель жеткізу уақытының вариациясының 92% түсіндіреді, бұл фактор (қашықтық) дұрыс таңдалғанын білдіреді. Уақыттың вариациясының 8% түсіндірілмейді, бұл жеткізу уақытына әсер ететін басқа факторларға байланысты, бірақ сызықтық регрессия үлгісіне кірмейді.
4. Регрессия теңдеуінің мәнділігін тексерейік:
Өйткені– регрессия теңдеуі (сызықты модель) статистикалық маңызды.
5. Болжау мәселесін шешейік. Детерминация коэффициентінен бастапР 2 жеткілікті жоғары мәнге ие және болжау жасалатын 2 миль қашықтығы кіріс деректерінің ауқымында болса, болжамды жасауға болады:
Мүмкіндіктерді пайдалана отырып, регрессиялық талдауды ыңғайлы түрде жүргізуге болады Excel. «Регрессия» жұмыс режимі сызықтық регрессия теңдеуінің параметрлерін есептеу және оның зерттелетін процеске сәйкестігін тексеру үшін қолданылады. Диалогтық терезеде келесі параметрлерді толтырыңыз:
2-мысал. 1-мысалдағы тапсырманы «Регрессия» режимі арқылы орындаңызExcel.
НӘТИЖЕЛЕРДІ ҚОРЫТЫНДЫ | |||||
Регрессия статистикасы |
|||||
Көпше R | |||||
R-шаршы | |||||
Нормаланған R-квадрат | |||||
Стандартты қате | |||||
Бақылаулар | |||||
Мүмкіндіктер |
Стандартты қате |
t-статистикалық |
P-мәні |
||
Y-қиылысы | |||||
Айнымалы X 1 |
Кестеде берілген регрессиялық талдау нәтижелерін қарастырайық.
МагнитудасыR-шаршы , сондай-ақ сенімділік өлшемі деп аталады, нәтижесінде регрессия сызығының сапасын сипаттайды. Бұл сапа бастапқы деректер мен регрессиялық модель (есептелген деректер) арасындағы сәйкестік дәрежесімен көрінеді. Біздің мысалда сенімділік өлшемі 0,91829 болып табылады, бұл регрессия сызығының бастапқы деректерге өте жақсы сәйкестігін көрсетеді және детерминация коэффициентімен сәйкес келеді.Р 2 , формула бойынша есептелген.
Көпше R - еселік корреляция коэффициенті R - тәуелсіз айнымалылардың (X) және тәуелді айнымалының (Y) тәуелділік дәрежесін білдіреді және детерминация коэффициентінің квадрат түбіріне тең. Қарапайым сызықтық регрессиялық талдаудабірнеше R коэффициентісызықтық корреляция коэффициентіне тең (r = 0,958).
Сызықтық модель коэффициенттері:Ы - қиылысу жалған терминнің мәнін басып шығарадыб, Аайнымалы X1 – регрессия коэффициенті a. Сонда сызықтық регрессия теңдеуі:
y = 2,6597x+ 5,9135 (бұл 1-мысалдағы есептеу нәтижелерімен жақсы келіседі).
Содан кейін регрессия коэффициенттерінің маңыздылығын тексерейік:аЖәнеб. Баған мәндерін жұппен салыстыруМүмкіндіктер ЖәнеСтандартты қате Кестеде коэффициенттердің абсолютті мәндері олардың стандартты қателерінен үлкен екенін көреміз. Сонымен қатар, бұл коэффициенттер маңызды болып табылады, оны P-мәні көрсеткішінің мәндері бойынша бағалауға болады, олар көрсетілген маңыздылық деңгейінен α = 0,05 төмен.
Бақылау |
Болжалды Ю |
Қалдықтар |
Стандартты баланстар | |
Кесте шығыс нәтижелерін көрсетедіқалдықтары. Есептің осы бөлігін пайдалана отырып, біз әрбір нүктенің құрастырылған регрессия сызығынан ауытқуын көре аламыз. Ең үлкен абсолютті мәнқалдықбұл жағдайда – 1,89256, ең кішісі – 0,05399. Бұл деректерді жақсырақ түсіндіру үшін бастапқы деректер мен құрастырылған регрессия сызығын сызыңыз. Құрылыстан көрініп тұрғандай, регрессия сызығы бастапқы деректердің мәндеріне жақсы «қондырылған» және ауытқулар кездейсоқ.