تحليل الارتباط والانحدار في Excel: تعليمات للتنفيذ. دراسة الاعتماد الإحصائي للتغيرات في خصائص المكمن والسوائل المكمنية نتيجة تطور الحقول النفطية الانحدار المكافئ ومتعدد الحدود
البيانات التالية متاحة دول مختلفةعلى مؤشر أسعار التجزئة للأغذية (x) وعلى مؤشر الإنتاج الصناعي (y).
الرقم القياسي لأسعار المواد الغذائية بالتجزئة (x) | مؤشر الإنتاج الصناعي (ذ) | |
---|---|---|
1 | 100 | 70 |
2 | 105 | 79 |
3 | 108 | 85 |
4 | 113 | 84 |
5 | 118 | 85 |
6 | 118 | 85 |
7 | 110 | 96 |
8 | 115 | 99 |
9 | 119 | 100 |
10 | 118 | 98 |
11 | 120 | 99 |
12 | 124 | 102 |
13 | 129 | 105 |
14 | 132 | 112 |
مطلوب:
1. لتوصيف اعتماد y على x، احسب معلمات الوظائف التالية:
أ) خطي.
ب) رزين.
ب) القطع الزائد متساوي الأضلاع.
3. تقييم الأهمية الإحصائية لمعلمات الانحدار والارتباط.
4. قم بعمل توقع لقيمة مؤشر الإنتاج الصناعي y مع القيمة المتوقعة لمؤشر أسعار المواد الغذائية بالتجزئة x=138.
حل:
1. لحساب معلمات الانحدار الخطي
حل النظام المعادلات العاديةبخصوص أ و ب:
دعونا نبني جدولاً للبيانات المحسوبة، كما هو موضح في الجدول 1.
الجدول 1: البيانات المقدرة لتقدير الانحدار الخطي
لا. | X | في | xy | × 2 | ذ 2 | ||
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 7000 | 10000 | 4900 | 74,26340 | 0,060906 |
2 | 105 | 79 | 8295 | 11025 | 6241 | 79,92527 | 0,011712 |
3 | 108 | 85 | 9180 | 11664 | 7225 | 83,32238 | 0,019737 |
4 | 113 | 84 | 9492 | 12769 | 7056 | 88,98425 | 0,059336 |
5 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
6 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
7 | 110 | 96 | 10560 | 12100 | 9216 | 85,58713 | 0,108467 |
8 | 115 | 99 | 11385 | 13225 | 9801 | 91,24900 | 0,078293 |
9 | 119 | 100 | 11900 | 14161 | 10000 | 95,77849 | 0,042215 |
10 | 118 | 98 | 11564 | 13924 | 9604 | 94,64611 | 0,034223 |
11 | 120 | 99 | 11880 | 14400 | 9801 | 96,91086 | 0,021102 |
12 | 124 | 102 | 12648 | 15376 | 10404 | 101,4404 | 0,005487 |
13 | 129 | 105 | 13545 | 16641 | 11025 | 107,1022 | 0,020021 |
14 | 132 | 112 | 14784 | 17424 | 12544 | 110,4993 | 0,013399 |
المجموع: | 1629 | 1299 | 152293 | 190557 | 122267 | 1299,001 | 0,701866 |
متوسط القيمة: | 116,3571 | 92,78571 | 10878,07 | 13611,21 | 8733,357 | X | X |
8,4988 | 11,1431 | X | X | X | X | X | |
72,23 | 124,17 | X | X | X | X | X |
يتم تحديد القيمة المتوسطة بواسطة الصيغة:
نحسب الانحراف المعياري باستخدام الصيغة:
وأدخل النتيجة في الجدول 1.
وبتربيع القيمة الناتجة نحصل على التباين:
يمكن أيضًا تحديد معلمات المعادلة باستخدام الصيغ:
وبالتالي فإن معادلة الانحدار هي:
ولذلك، مع زيادة مؤشر أسعار المواد الغذائية بالتجزئة بمقدار 1، يرتفع مؤشر الإنتاج الصناعي في المتوسط بمقدار 1.13.
لنحسب معامل ارتباط الزوج الخطي:
الاتصال مباشر وقريب جدًا.
لنحدد معامل التحديد:
التباين في النتيجة هو 74.59% موضحًا بالتباين في العامل x.
باستبدال القيم الفعلية لـ x في معادلة الانحدار، نحدد القيم النظرية (المحسوبة).
ولذلك، يتم تحديد معلمات المعادلة بشكل صحيح.
لنحسب متوسط خطأ التقريب - متوسط انحراف القيم المحسوبة عن القيم الفعلية:
في المتوسط، تنحرف القيم المحسوبة عن القيم الفعلية بنسبة 5.01%.
سنقوم بتقييم جودة معادلة الانحدار باستخدام اختبار F.
يتكون اختبار F من اختبار الفرضية H 0 حول الدلالة الإحصائية لمعادلة الانحدار ومؤشر تقارب العلاقة. للقيام بذلك، يتم إجراء مقارنة بين حقيقة F الفعلية وقيم جدول F الحرجة (الجدولية) لمعيار فيشر F.
يتم تحديد الحقيقة F بواسطة الصيغة:
حيث n هو عدد الوحدات السكانية؛
m هو عدد المعلمات للمتغيرات x.
تسمح التقديرات التي تم الحصول عليها لمعادلة الانحدار باستخدامها للتنبؤ.
إذا كانت القيمة المتوقعة لمؤشر أسعار المواد الغذائية بالتجزئة هي x = 138، فإن القيمة المتوقعة لمؤشر الإنتاج الصناعي ستكون:
2. انحدار القوة له الشكل:
لتحديد المعلمات، يتم تنفيذ لوغاريتم وظيفة الطاقة:
لتحديد معلمات الدالة اللوغاريتمية، يتم إنشاء نظام من المعادلات العادية باستخدام طريقة المربعات الصغرى:
دعونا نبني جدولاً للبيانات المحسوبة، كما هو موضح في الجدول 2.
الجدول 2: البيانات المحسوبة لتقدير انحدار القوة
لا. | X | في | إل جي اكس | إل جي ذ | إل جي س*إل جي ذ | (سجل ×) 2 | (سجل ص) 2 |
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 2,000000 | 1,845098 | 3,690196 | 4,000000 | 3,404387 |
2 | 105 | 79 | 2,021189 | 1,897627 | 3,835464 | 4,085206 | 3,600989 |
3 | 108 | 85 | 2,033424 | 1,929419 | 3,923326 | 4,134812 | 3,722657 |
4 | 113 | 84 | 2,053078 | 1,924279 | 3,950696 | 4,215131 | 3,702851 |
5 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
6 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
7 | 110 | 96 | 2,041393 | 1,982271 | 4,046594 | 4,167284 | 3,929399 |
8 | 115 | 99 | 2,060698 | 1,995635 | 4,112401 | 4,246476 | 3,982560 |
9 | 119 | 100 | 2,075547 | 2,000000 | 4,151094 | 4,307895 | 4,000000 |
10 | 118 | 98 | 2,071882 | 1,991226 | 4,125585 | 4,292695 | 3,964981 |
11 | 120 | 99 | 2,079181 | 1,995635 | 4,149287 | 4,322995 | 3,982560 |
12 | 124 | 102 | 2,093422 | 2,008600 | 4,204847 | 4,382414 | 4,034475 |
13 | 129 | 105 | 2,110590 | 2,021189 | 4,265901 | 4,454589 | 4,085206 |
14 | 132 | 112 | 2,120574 | 2,049218 | 4,345518 | 4,496834 | 4,199295 |
المجموع | 1629 | 1299 | 28,90474 | 27,49904 | 56,79597 | 59,69172 | 54,05467 |
متوسط القيمة | 116,3571 | 92,78571 | 2,064624 | 1,964217 | 4,056855 | 4,263694 | 3,861048 |
8,4988 | 11,1431 | 0,031945 | 0,053853 | X | X | X | |
72,23 | 124,17 | 0,001021 | 0,0029 | X | X | X |
استمرار الجدول 2 البيانات المحسوبة لتقدير انحدار القوة
لا. | X | في | ||||
---|---|---|---|---|---|---|
1 | 100 | 70 | 74,16448 | 17,34292 | 0,059493 | 519,1886 |
2 | 105 | 79 | 79,62057 | 0,385112 | 0,007855 | 190,0458 |
3 | 108 | 85 | 82,95180 | 4,195133 | 0,024096 | 60,61728 |
4 | 113 | 84 | 88,59768 | 21,13866 | 0,054734 | 77,1887 |
5 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
6 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
7 | 110 | 96 | 85,19619 | 116,7223 | 0,11254 | 10,33166 |
8 | 115 | 99 | 90,88834 | 65,79901 | 0,081936 | 38,6174 |
9 | 119 | 100 | 95,52408 | 20,03384 | 0,044759 | 52,04598 |
10 | 118 | 98 | 94,35840 | 13,26127 | 0,037159 | 27,18882 |
11 | 120 | 99 | 96,69423 | 5,316563 | 0,023291 | 38,6174 |
12 | 124 | 102 | 101,4191 | 0,337467 | 0,005695 | 84,90314 |
13 | 129 | 105 | 107,4232 | 5,872099 | 0,023078 | 149,1889 |
14 | 132 | 112 | 111,0772 | 0,85163 | 0,00824 | 369,1889 |
المجموع | 1629 | 1299 | 1296,632 | 446,4152 | 0,703074 | 1738,357 |
متوسط القيمة | 116,3571 | 92,78571 | X | X | X | X |
8,4988 | 11,1431 | X | X | X | X | |
72,23 | 124,17 | X | X | X | X |
من خلال حل نظام المعادلات العادية، نحدد معلمات الدالة اللوغاريتمية.
نحصل على معادلة خطية:
بعد إجراء التقوية نحصل على:
باستبدال القيم الفعلية لـ x في هذه المعادلة، نحصل على القيم النظرية للنتيجة. وعلى أساسها سنقوم بحساب المؤشرات: ضيق الارتباط – مؤشر الارتباط ومتوسط خطأ التقريب.
الاتصال قريب جدا.
في المتوسط، تنحرف القيم المحسوبة عن القيم الفعلية بنسبة 5.02%.
وبالتالي، H 0 - يتم رفض الفرضية المتعلقة بالطبيعة العشوائية للخصائص التي تم تقييمها ويتم التعرف على أهميتها الإحصائية وثباتها.
تسمح التقديرات التي تم الحصول عليها لمعادلة الانحدار باستخدامها للتنبؤ. إذا كانت القيمة المتوقعة لمؤشر أسعار المواد الغذائية بالتجزئة هي x = 138، فإن القيمة المتوقعة لمؤشر الإنتاج الصناعي ستكون:
لتحديد معلمات هذه المعادلة، يتم استخدام نظام المعادلات العادية:
دعونا نجعل تغيير المتغيرات
ونحصل النظام التاليالمعادلات العادية:
من خلال حل نظام المعادلات العادية، نحدد معلمات القطع الزائد.
لنقم بإنشاء جدول للبيانات المحسوبة، كما هو موضح في الجدول 3.
الجدول 3: البيانات المحسوبة لتقييم الاعتماد الزائدي
لا. | X | في | ض | yz | ||
---|---|---|---|---|---|---|
1 | 100 | 70 | 0,010000000 | 0,700000 | 0,0001000 | 4900 |
2 | 105 | 79 | 0,009523810 | 0,752381 | 0,0000907 | 6241 |
3 | 108 | 85 | 0,009259259 | 0,787037 | 0,0000857 | 7225 |
4 | 113 | 84 | 0,008849558 | 0,743363 | 0,0000783 | 7056 |
5 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
6 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
7 | 110 | 96 | 0,009090909 | 0,872727 | 0,0000826 | 9216 |
8 | 115 | 99 | 0,008695652 | 0,860870 | 0,0000756 | 9801 |
9 | 119 | 100 | 0,008403361 | 0,840336 | 0,0000706 | 10000 |
10 | 118 | 98 | 0,008474576 | 0,830508 | 0,0000718 | 9604 |
11 | 120 | 99 | 0,008333333 | 0,825000 | 0,0000694 | 9801 |
12 | 124 | 102 | 0,008064516 | 0,822581 | 0,0000650 | 10404 |
13 | 129 | 105 | 0,007751938 | 0,813953 | 0,0000601 | 11025 |
14 | 132 | 112 | 0,007575758 | 0,848485 | 0,0000574 | 12544 |
المجموع: | 1629 | 1299 | 0,120971823 | 11,13792 | 0,0010510 | 122267 |
متوسط القيمة: | 116,3571 | 92,78571 | 0,008640844 | 0,795566 | 0,0000751 | 8733,357 |
8,4988 | 11,1431 | 0,000640820 | X | X | X | |
72,23 | 124,17 | 0,000000411 | X | X | X |
استمرار الجدول 3 البيانات المحسوبة لتقييم الاعتماد الزائدي
نوع آخر من الانحدار ذو العامل الواحد هو التقريب بواسطة كثيرات حدود القوة بالشكل:
من الطبيعي أن نرغب في الحصول على أبسط تبعية ممكنة، ونقتصر على كثيرات الحدود من الدرجة الثانية، أي. الاعتماد المكافئ:
(5.5.2)
دعونا نحسب المشتقات الجزئية فيما يتعلق بالمعاملات ب 0 , ب 1 و ب 2 :
(5.5.3)
وبمساواة المشتقات بالصفر نحصل على نظام عادي من المعادلات:
(5.5.4)
حل نظام المعادلات العادية (5.5.2) لحالة محددة من القيم س أنا *
,
ذ أنا *
;
نحن نحصل
القيم المثلى ب 0
,
ب 1
و ب 2
.
بالنسبة للتقريب حسب الاعتماد (5.5.2) وحتى أكثر من ذلك (5.5.1)، لم يتم الحصول على صيغ بسيطة لحساب المعاملات، وكقاعدة عامة، يتم حسابها باستخدام الإجراءات القياسية في شكل مصفوفة:
(5.5.5)
يوضح الشكل 5.5.1 مثالًا نموذجيًا للتقريب من خلال الاعتماد على القطع المكافئ:
9 (5;9)
(1;1)
1
1 2 3 4 5 س
الشكل 5.5.1. إحداثيات النقاط التجريبية وتقريبية
اعتمادهم المكافئ
مثال 5.1.قم بتقريب النتائج التجريبية الواردة في الجدول 5.1.1 بمعادلة الانحدار الخطي
.
الجدول 5.1.1
لنقم ببناء نقاط تجريبية وفقاً للإحداثيات المبينة في الجدول 5.1.1 على الرسم البياني الموضح في الشكل 5.1.1.
في
9
4
1 2 3 4 5 س
وفقًا للشكل 5.1.1، الذي سنرسم عليه خطًا مستقيمًا للتقييم الأولي، سنستنتج أن هناك عدم خطية معبر عنها بوضوح في موقع النقاط التجريبية، ولكنها ليست مهمة جدًا وبالتالي فهي منطقية لتقريبهم مع الاعتماد الخطي. لاحظ أنه للحصول على نتيجة رياضية صحيحة، من الضروري بناء خط مستقيم باستخدام هذه الطريقة المربعات الصغرى.
قبل إجراء تحليل الانحدار، فمن المستحسن إجراء حساب
معامل الارتباط الخطي بين المتغيرات Xو في:
يتم تحديد أهمية علاقة الارتباط من خلال القيمة الحرجة لمعامل الارتباط الخطي، المحسوبة باستخدام الصيغة:
القيمة الحاسمة لاختبار الطالب ر كريتوجدت وفقا للجداول الإحصائية لمستوى الأهمية الموصى به α = 0.05ولل ن-2 درجات الحرية. إذا كانت القيمة المحسوبة ص xyلا تقل عن القيمة الحرجة ص كريتثم العلاقة بين المتغيرات س و ذ تعتبر ضرورية. دعونا نفعل الحسابات:
يرجع ذلك إلى حقيقة أن
نستنتج أن العلاقة بين المتغيرات Xو فيمهم ويمكن أن يكون خطيًا.
لنحسب معاملات معادلة الانحدار:
وهكذا حصلنا على معادلة الانحدار الخطي:
باستخدام معادلة الانحدار، نرسم خطًا مستقيمًا في الشكل 5.1.2.
ص (5;9.8)
9
4
(0;-0.2) 1 2 3 4 5 س
الشكل 5.1.2. إحداثيات النقاط التجريبية وتقريبية
اعتمادهم الخطي
وباستخدام معادلة الانحدار نقوم بحساب قيم الدالة بناء على النقاط التجريبية في الجدول 5.1.1 والفرق بين القيم التجريبية والقيم المحسوبة للدالة والذي نعرضه في الجدول 5.1.2.
الجدول 5.1.2
لنحسب متوسط مربع الخطأ ونسبته إلى القيمة المتوسطة:
ومن حيث نسبة الخطأ المعياري إلى القيمة المتوسطة، فقد تم الحصول على نتيجة غير مرضية، حيث تم تجاوز القيمة الموصى بها وهي 0.05.
دعونا نقيم مستوى أهمية معاملات معادلة الانحدار باستخدام اختبار الطالب:
من الجدول الإحصائي ل 3 درجات من الحرية، دعنا نكتب السطور بمستوى الأهمية - وقيمة معيار الطالب – رإلى الجدول 5.1.3.
الجدول 5.1.3
مستوى أهمية معاملات معادلة الانحدار:
لاحظ أنه وفقا لمستوى الأهمية للمعامل وتم الحصول على نتيجة مرضية بالنسبة للمعامل غير مرض.
دعونا نقيم جودة معادلة الانحدار الناتجة باستخدام المؤشرات المحسوبة على أساس تحليل التباين:
فحص:
نتيجة الفحص إيجابية مما يدل على صحة الحسابات التي تم إجراؤها.
دعونا نحسب معيار فيشر:
مع درجتين من الحرية:
وباستخدام الجداول الإحصائية نجد القيم الحرجة لمعيار فيشر لتدرجين موصى بهما لمستوى الدلالة:
وبما أن القيمة المحسوبة لاختبار فيشر تتجاوز القيمة الحرجة لمستوى الدلالة 0.01، فسوف نفترض أن مستوى الدلالة حسب اختبار فيشر أقل من 0.01، وهو ما سيعتبر مرضيا.
دعونا نحسب معامل التحديد المتعدد:
لدرجتين من الحرية
باستخدام الجدول الإحصائي لمستوى الدلالة الموصى به وهو 0.05 ودرجتي الحرية الموجودتين، نجد القيمة الحرجة لمعامل التحديد المتعدد:
حيث أن القيمة المحسوبة لمعامل التحديد المتعدد تتجاوز القيمة الحرجة لمستوى الأهمية
ثم مستوى الدلالة حسب معامل التحديد المتعدد
وستعتبر النتيجة التي تم الحصول عليها للمؤشر المقدم مرضية.
وبالتالي، فإن المعلمات المحسوبة التي تم الحصول عليها من حيث نسبة الخطأ المعياري إلى القيمة المتوسطة ومستوى الأهمية وفقًا لاختبار الطالب غير مرضية، لذلك ينصح باختيار اعتماد تقريبي آخر للتقريب.
مثال 5.2.تقريب التوزيع التجريبي للأرقام العشوائية عن طريق الاعتماد الرياضي
لم يؤد التوزيع التجريبي للأرقام العشوائية الواردة في الجدول 5.1.1، عند تقريبها بالاعتماد الخطي، إلى نتيجة مرضية، بما في ذلك. نظرًا لعدم أهمية معامل معادلة الانحدار بمصطلح حر، لذلك لتحسين جودة التقريب، سنحاول تنفيذه باستخدام اعتماد خطي بدون مصطلح حر:
لنحسب قيمة معامل معادلة الانحدار:
وهكذا حصلنا على معادلة الانحدار:
وباستخدام معادلة الانحدار الناتجة نحسب قيم الدالة والفرق بين القيم التجريبية والمحسوبة للدالة والتي نعرضها في شكل جدول 5.2.1.
الجدول 5.2.1
س أنا | ||||
وفقا لمعادلة الانحدار
في الشكل 5.2.1 سنرسم خطًا مستقيمًا.
ذ (5;9.73 )
(0;0) 1 2 3 4 5 س
الشكل 5.2.1. إحداثيات النقاط التجريبية وتقريبية
اعتمادهم الخطي
لتقييم جودة التقريب، سنقوم بإجراء حسابات مؤشرات الجودة المشابهة للحسابات الواردة في المثال 5.1.
(لا يزال قديما)؛
مع 4 درجات من الحرية.
ل
وبناء على نتائج التقريب نلاحظ أنه من حيث مستوى دلالة معامل معادلة الانحدار فقد تم الحصول على نتيجة مرضية؛ لقد تحسنت نسبة الخطأ المعياري إلى المتوسط، ولكنها لا تزال أعلى من القيمة الموصى بها وهي 0.05، لذا يوصى بتكرار التقريب بعلاقة رياضية أكثر تعقيدًا.
مثال 5.3.لتحسين جودة التقريب للمثالين 5.1 و5.2، سنقوم بإجراء تقريب غير خطي بالتبعية
. للقيام بذلك، سنقوم أولاً بإجراء حسابات وسيطة ونضع نتائجها في الجدول 5.3.1.
قيم
الجدول 5.3.1
X 2 | ||||||
(lnX) 2 | ||||||
lnX lnY |
دعونا نحسب بالإضافة إلى ذلك:
دعونا تقريب التبعية
. باستخدام الصيغ (5.3.7)، (5.3.8) نحسب المعاملات ب 0
و ب 1
:
باستخدام الصيغ (5.3.11) نحسب المعاملات أ 0 و أ 1 :
لحساب الخطأ المعياري، تم إجراء الحسابات الوسيطة، المبينة في الجدول 5.3.2.
الجدول 5.3.2
ي أنا |
ذ أنا | ||
المبلغ: 7.5968
وتبين أن الخطأ المعياري للتقريب أكبر بكثير مما كان عليه في المثالين السابقين، لذلك نعتبر نتائج التقريب غير قابلة للاستخدام.
مثال 5.4.دعونا نحاول التقريب مع اعتماد غير خطي آخر
. باستخدام الصيغتين (5.3.9) و (5.3.10) حسب الجدول 5.3.1 نقوم بحساب المعاملات ب 0
و ب 1
:
حصلنا على اعتماد وسيط:
باستخدام الصيغ (5.3.13) نحسب المعاملات ج 0 و ج 1 :
لقد حصلنا على التبعية النهائية:
لحساب الخطأ المعياري، سنقوم بإجراء حسابات وسيطة ونضعها في الجدول 5.4.1.
الجدول 5.4.1
ي أنا |
ذ أنا | ||
المبلغ: 21.83152
دعونا نحسب الخطأ القياسي:
وتبين أن الخطأ المعياري للتقريب أكبر بكثير مما كان عليه في المثال السابق، لذلك نعتبر نتائج التقريب غير قابلة للاستخدام.
مثال 5.5.تقريب التوزيع التجريبي للأرقام العشوائية عن طريق الاعتماد الرياضي ذ = ب · lnx
البيانات الأولية، كما في الأمثلة السابقة، مبينة في الجدول 5.4.1 والشكل 5.4.1.
الجدول 5.4.1
بناءً على تحليل الشكل 5.4.1 والجدول 5.4.1، نلاحظ أنه مع القيم الأصغر للوسيط (في بداية الجدول) تتغير الدالة أكثر من القيم الأكبر (في نهاية الجدول). الجدول)، لذلك يبدو من المستحسن تغيير حجم الوسيطة وإدخال دالة لوغاريتمية في معادلة الانحدار منه وتقريبها مع الاعتماد الرياضي التالي:
. باستخدام الصيغة (5.4.3) نحسب المعامل ب:
ولتقييم جودة التقريب، سنقوم بإجراء الحسابات الوسيطة الموضحة في الجدول 5.4.2، والتي سنحسب منها حجم الخطأ ونسبة الخطأ المعياري إلى القيمة المتوسطة.
الجدول 5.4.2
وبما أن نسبة الخطأ المعياري إلى القيمة المتوسطة تتجاوز القيمة الموصى بها وهي 0.05، فسيتم اعتبار النتيجة غير مرضية. على وجه الخصوص، نلاحظ أن الانحراف الأكبر هو القيمة س = 1،منذ مع هذه القيمة lnx=0. ولذلك، فإننا سوف تقريب التبعية ذ = ب 0 +ب 1 lnx
نقدم الحسابات المساعدة في شكل جدول 5.4.3.
الجدول 5.4.3
باستخدام الصيغ (5.4.6) و (5.4.7) نحسب المعاملات ب 0 و ب 1 :
9 (5;9.12)
4
1 (1;0.93)
1 2 3 4 5 س
لتقييم جودة التقريب، سنقوم بإجراء حسابات مساعدة وتحديد مستوى أهمية المعاملات الموجودة ونسبة الخطأ المعياري إلى القيمة المتوسطة.
مستوى الأهمية أعلى قليلاً من القيمة الموصى بها وهي 0.05 (
).
نظرًا لحقيقة أنه وفقًا للمؤشر الرئيسي - نسبة الخطأ القياسي إلى القيمة المتوسطة - فقد تم الحصول على زيادة مضاعفة تقريبًا عن المستوى الموصى به وهو 0.05، وسنعتبر النتائج مقبولة. لاحظ أن القيمة المحسوبة لاختبار الطالب ر ب 0
=2,922
يختلف عن الحرجة
بكمية صغيرة نسبيا.
مثال 5.6.دعونا نقرب البيانات التجريبية للمثال 5.1 من خلال الاعتماد الزائدي
. من أجل حساب المعاملات ب 0 و ب 1
دعونا نجري الحسابات الأولية الواردة في الجدول 5.6.1.
الجدول 5.6.1
X أنا |
س أنا =1/س أنا |
س أنا 2 |
س أنا ذ أنا | ||
استنادا إلى نتائج الجدول 5.6.1 باستخدام الصيغتين (5.4.8) و (5.4.9)، نقوم بحساب المعاملات ب 0 و ب 1 :
وبالتالي، يتم الحصول على معادلة الانحدار الزائدي
.
وترد في الجدول 5.6.2 نتائج الحسابات المساعدة لتقييم جودة التقريب.
الجدول 5.6.2
X أنا | ||||
بناءً على نتائج الجدول 5.6.2 نحسب الخطأ المعياري ونسبة الخطأ المعياري إلى القيمة المتوسطة:
وبما أن نسبة الخطأ المعياري إلى القيمة المتوسطة تتجاوز القيمة الموصى بها وهي 0.05، فإننا نستنتج أن نتائج التقريب غير مناسبة.
مثال 5.7.
لحساب قيم محددة للدخل من تشغيل الرافعات الجيبية اعتمادًا على وقت أعمال الصيانة، من الضروري الحصول على اعتماد مكافئ.
دعونا نحسب معاملات هذا الاعتماد ب 0 , ب 1 , ب 11 في شكل مصفوفة وفقا للصيغة:
تم الحصول على معادلات الانحدار غير الخطية التي تربط المؤشر الفعال بالقيم المثلى لإجراء الصيانة الوقائية للرافعات البرجية باستخدام إجراء الانحدار المتعدد لحزمة تطبيق Statistica 6.0. وبعد ذلك نقدم نتائج تحليل الانحدار لمؤشر الأداء الفعال حسب الجدول 5.7.1.
الجدول 5.7.1
ويبين الجدول 5.7.2 نتائج الانحدار غير الخطي لمؤشر الأداء الفعال والجدول 5.7.3 يوضح نتائج تحليل المخلفات.
الجدول 5.7.2
الجدول 5.7.3
أرز. 3.7.36. تحليل البقايا.
وبذلك حصلنا على معادلة الانحدار المتعدد للمتغير
:
نسبة الخطأ المعياري للمعنى:
14780/1017890=0,0145 < 0,05.
وبما أن نسبة الخطأ المعياري إلى القيمة المتوسطة لا تتجاوز القيمة الموصى بها وهي 0.05، فيمكن اعتبار نتائج التقريب مقبولة. وكعيب وفقًا للجدول 5.7.2، تجدر الإشارة إلى أن جميع المعاملات المحسوبة تتجاوز مستوى الأهمية الموصى به وهو 0.05.
دعونا نفكر في بناء معادلة الانحدار من النموذج.
يتم تجميع نظام من المعادلات العادية لإيجاد معاملات الانحدار المكافئ بشكل مشابه لتجميع معادلات الانحدار الخطي العادية.
بعد التحويلات نحصل على:
.
ومن خلال حل نظام المعادلات العادية، يتم الحصول على معاملات معادلة الانحدار.
,
أين ، أ .
تصف معادلة الدرجة الثانية البيانات التجريبية بشكل أفضل بكثير من معادلة الدرجة الأولى إذا كان انخفاض التباين مقارنة بتباين الانحدار الخطي معنويًا (غير عشوائي). أهمية الفرق بين ويتم تقييمها بواسطة معيار فيشر:
حيث يتم أخذ الرقم من الجداول الإحصائية المرجعية (الملحق 1) حسب درجات الحرية ومستوى الدلالة المحدد.
الإجراء لتنفيذ العمل الحسابي:
1. تعرف على نفسك المادة النظرية، المنصوص عليها في المبادئ التوجيهية أو في الأدبيات الإضافية.
2. حساب الاحتمالات معادلة خط مستقيمتراجع. للقيام بذلك، تحتاج إلى حساب المبالغ. حساب المبالغ بشكل مريح على الفور ، وهي مفيدة لحساب معاملات المعادلة المكافئة.
3. احسب القيم المحسوبة لمعلمة الإخراج باستخدام المعادلة.
4. حساب التباين الكلي والمتبقي، وكذلك معيار فيشر.
أين - المصفوفة، وعناصرها هي معاملات نظام المعادلات العادية؛
- متجه عناصره معاملات غير معروفة؛
– مصفوفة الأطراف اليمنى لنظام المعادلات.
7. احسب القيم المحسوبة لمعلمة الإخراج باستخدام المعادلة .
8. حساب التباين المتبقي وكذلك معيار فيشر.
9. استخلاص النتائج.
10. إنشاء رسوم بيانية لمعادلات الانحدار والبيانات الأولية.
11. استكمال أعمال التسوية.
مثال للحساب.
باستخدام البيانات التجريبية حول اعتماد كثافة بخار الماء على درجة الحرارة، احصل على معادلات الانحدار من الشكل و. إجراء التحليل الإحصائي والتوصل إلى استنتاج حول أفضل علاقة تجريبية.
0,0512 | 0,0687 | 0,081 | 0,1546 | 0,2516 | 0,3943 | 0,5977 | 0,8795 |
تمت معالجة البيانات التجريبية وفقًا لتوصيات العمل. وترد في الجدول 1 الحسابات لتحديد معلمات المعادلة الخطية.
الجدول 1 - العثور على معلمات الاعتماد الخطي للنموذج | ||||||||
كثافة بخار الماء عند خط التشبع | ||||||||
№ | ر طدرجة مئوية | أوم | ر ط 2 | احسب. | ||||
0,0512 | 2,05 | -0,0403 | -0,0915 | 0,0084 | 0,0669 | |||
0,0687 | 3,16 | 0,0248 | -0,0439 | 0,0019 | 0,0582 | |||
0,0811 | 4,22 | 0,0899 | 0,0089 | 0,0001 | 0,0523 | |||
0,1546 | 9,9 | 0,2202 | 0,06565 | 0,0043 | 0,0241 | |||
0,2516 | 19,12 | 0,3505 | 0,09894 | 0,0098 | 0,0034 | |||
0,3943 | 34,70 | 0,4808 | 0,08654 | 0,0075 | 0,0071 | |||
0,5977 | 59,77 | 0,6111 | 0,01344 | 0,0002 | 0,0829 | |||
0,8795 | 98,50 | 0,7414 | -0,13807 | 0,0191 | 0,3245 | |||
مجموع | 2,4786 | 231,41 | 0,0512 | 0,6194 | ||||
متوسط | 72,25 | 0,3098 | 5822,5 | 28,93 | ||||
ب 0 = | -0,4747 | د 1 أوست 2 = | 0,0085 | |||||
ب 1 = | 0,0109 | دي 2 = | 0,0885 | |||||
F= | 10,368 | |||||||
Fتي = 3.87 F>Fنموذج T مناسب |
.
لتحديد معلمات الانحدار المكافئ، تم أولاً تحديد عناصر مصفوفة المعاملات ومصفوفة الأطراف اليمنى لنظام المعادلات العادية. ثم تم حساب المعاملات في بيئة MathCad:
وترد بيانات الحساب في الجدول 2.
التسميات في الجدول 2:
.
الاستنتاجات
تصف المعادلة المكافئة بشكل أفضل البيانات التجريبية المتعلقة باعتماد كثافة البخار على درجة الحرارة، حيث أن القيمة المحسوبة لمعيار فيشر تتجاوز بشكل كبير القيمة الجدولية البالغة 4.39. لذلك، فإن تضمين حد تربيعي في معادلة متعددة الحدود أمر منطقي.
يتم عرض النتائج التي تم الحصول عليها في شكل رسوم بيانية (الشكل 3).
الشكل 3 - التفسير الرسومي لنتائج الحساب.
الخط المنقط هو معادلة الانحدار الخطي؛ الخط الصلب – الانحدار المكافئ، النقاط على الرسم البياني – القيم التجريبية.
الجدول 2. - العثور على معلمات نوع الاعتماد ذ(ر)=أ 0 +أ 1 ∙س+أ 2 ∙س 2 | كثافة بخار الماء على خط التشبع ρ= أ 0 +أ 1 ∙ر + أ 2 ∙ر 2 | (ρ أنا– ρ) 2 | 0,0669 | 0,0582 | 0,0523 | 0,0241 | 0,0034 | 0,0071 | 0,0829 | 0,03245 | 0,6194 | |||||
(د) 2 | 0,0001 | 0,0000 | 0,0000 | 0,0002 | 0,0000 | 0,0002 | 0,0002 | 0,0002 | 0,0010 | 0,0085 | 0,0002 | 0,0885 | 42,5 | |||
∆ρ أنا=ρ( ر ط) احسب – ρ أنا | 0,01194 | –0,00446 | –0,00377 | –0,01524 | –0,00235 | 0,01270 | 0,011489 | –0,01348 | د 1 2 راحة = | د 2 2 راحة = | د 1 2 ذ= | و= | ||||
ρ( ر ط) احسب. | 0,0631 | 0,0642 | 0,0773 | 0,1394- | 0,2493 | 0,4070 | 0,6126 | 0,8660 | 2,4788 | |||||||
ر ط 2ρ أنا | 81,84 | 145,33 | 219,21 | 633,24 | 1453,2 | 3053,4 | 5977,00 | 11032,45 | 22595,77 | |||||||
ر ط 4 | ||||||||||||||||
ر ط 3 | ||||||||||||||||
ر طρ أنا | 2,05 | 3,16 | 4,22 | 9,89 | 19,12 | 34,70 | 59,77 | 98,50 | 231,41 | |||||||
ر ط 2 | ||||||||||||||||
ρ، أوم | 0,0512 | 0,0687 | 0,0811 | 0,1546 | 0,2516 | 0,3943 | 0,5977 | 0,8795 | 2,4786 | 0,3098 | ||||||
ر طدرجة مئوية | 0,36129 | –0,0141 | 1.6613E-04 | |||||||||||||
№ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | مجموع | متوسط | أ 0 = | أ 1 = | أ 2 = |
المرفق 1
جدول توزيع فيشر ل س = 0,05
و 2 | - | |||||||||
و 1 | ||||||||||
161,40 | 199,50 | 215,70 | 224,60 | 230,20 | 234,00 | 238,90 | 243,90 | 249,00 | 254,30 | |
18,51 | 19,00 | 19,16 | 19,25 | 19,30 | 19,33 | 19,37 | 19,41 | 19,45 | 19,50 | |
10,13 | 9,55 | 9,28 | 9,12 | 9,01 | 8,94 | 8,84 | 8,74 | 8,64 | 8,53 | |
7,71 | 6,94 | 6,59 | 6,39 | 6,76 | 6,16 | 6,04 | 5,91 | 5,77 | 5,63 | |
6,61 | 5,79 | 5,41 | 5,19 | 5,05 | 4,95 | 4,82 | 4,68 | 4,53 | 4,36 | |
5,99 | 5,14 | 4,76 | 4,53 | 4,39 | 4,28 | 4,15 | 4,00 | 3,84 | 3,67 | |
5,59 | 4,74 | 4,35 | 4,12 | 3,97 | 3,87 | 3,73 | 3,57 | 3,41 | 3,23 | |
5,32 | 4,46 | 4,07 | 3,84 | 3,69 | 3,58 | 3,44 | 3,28 | 3,12 | 2,93 | |
5,12 | 4,26 | 3,86 | 3,63 | 3,48 | 3,37 | 3,24 | 3,07 | 2,90 | 2,71 | |
4,96 | 4,10 | 3,71 | 3,48 | 3,33 | 3,22 | 3,07 | 2,91 | 2,74 | 2,54 | |
4,84 | 3,98 | 3,59 | 3,36 | 3,20 | 3,09 | 2,95 | 2,79 | 2,61 | 2,40 | |
4,75 | 3,88 | 3,49 | 3,26 | 3,11 | 3,00 | 2,85 | 2,69 | 2,50 | 2,30 | |
4,67 | 3,80 | 3,41 | 3,18 | 3,02 | 2,92 | 2,77 | 2,60 | 2,42 | 2,21 | |
4,60 | 3,74 | 3,34 | 3,11 | 2,96 | 2,85 | 2,70 | 2,53 | 2,35 | 2,13 | |
4,54 | 3,68 | 3,29 | 3,06 | 2,90 | 2,79 | 2,64 | 2,48 | 2,29 | 2,07 | |
4,49 | 3,63 | 3,24 | 3,01 | 2,82 | 2,74 | 2,59 | 2,42 | 2,24 | 2,01 | |
4,45 | 3,59 | 3,20 | 2,96 | 2,81 | 2,70 | 2,55 | 2,38 | 2,19 | 1,96 | |
4,41 | 3,55 | 3,16 | 2,93 | 2,77 | 2,66 | 2,51 | 2,34 | 2,15 | 1,92 | |
4,38 | 3,52 | 3,13 | 2,90 | 2,74 | 2,63 | 2,48 | 2,31 | 2,11 | 1,88 | |
4,35 | 3,49 | 3,10 | 2,87 | 2,71 | 2,60 | 2,45 | 2,28 | 2,08 | 1,84 | |
4,32 | 3,47 | 3,07 | 2,84 | 2,68 | 2,57 | 2,42 | 2,25 | 2,05 | 1,81 | |
4,30 | 3,44 | 3,05 | 2,82 | 2,66 | 2,55 | 2,40 | 2,23 | 2,03 | 1,78 | |
4,28 | 3,42 | 3,03 | 2,80 | 2,64 | 2,53 | 2,38 | 2,20 | 2,00 | 1,76 | |
4,26 | 3,40 | 3,01 | 2,78 | 2,62 | 2,51 | 2,36 | 2,18 | 1,98 | 1,73 | |
4,24 | 3,38 | 2,99 | 2,76 | 2,60 | 2,49 | 2,34 | 2,16 | 1,96 | 1,71 | |
4,22 | 3,37 | 2,98 | 2,74 | 2,59 | 2,47 | 2,32 | 2,15 | 1,95 | 1,69 | |
4,21 | 3,35 | 2,96 | 2,73 | 2,57 | 2,46 | 2,30 | 2,13 | 1,93 | 1,67 | |
4,20 | 3,34 | 2,95 | 2,71 | 2,56 | 2,44 | 2,29 | 2,12 | 1,91 | 1,65 | |
4,18 | 3,33 | 2,93 | 2,70 | 2,54 | 2,43 | 2,28 | 2,10 | 1,90 | 1,64 | |
4,17 | 3,32 | 2,92 | 2,69 | 2,53 | 2,42 | 2,27 | 2,09 | 1,89 | 1,62 | |
4,08 | 3,23 | 2,84 | 2,61 | 2,45 | 2,34 | 2,18 | 2,00 | 1,79 | 1,52 | |
4,00 | 3,15 | 2,76 | 2,52 | 2,37 | 2,25 | 2,10 | 1,92 | 1,70 | 1,39 | |
3,92 | 3,07 | 2,68 | 2,45 | 2,29 | 2,17 | 2,02 | 1,88 | 1,61 | 1,25 |
تحليل الانحدار والارتباط هي طرق البحث الإحصائية. هذه هي الطرق الأكثر شيوعًا لإظهار اعتماد المعلمة على واحد أو أكثر من المتغيرات المستقلة.
أدناه، باستخدام أمثلة عملية محددة، سننظر في هذين التحليلين اللذين يحظىان بشعبية كبيرة بين الاقتصاديين. وسنقدم أيضًا مثالاً للحصول على النتائج عند الجمع بينهما.
تحليل الانحدار في Excel
يبين تأثير بعض القيم (مستقل، مستقل) على المتغير التابع. على سبيل المثال، كيف يعتمد عدد السكان النشطين اقتصاديًا على عدد المؤسسات والأجور وغيرها من المعالم. أو: كيف تؤثر الاستثمارات الأجنبية وأسعار الطاقة وغيرها على مستوى الناتج المحلي الإجمالي.
تتيح لك نتيجة التحليل تسليط الضوء على الأولويات. واستنادا إلى العوامل الرئيسية، التنبؤ والتخطيط لتطوير المجالات ذات الأولوية واتخاذ القرارات الإدارية.
يحدث الانحدار:
- خطي (ص = أ + ب س)؛
- مكافئ (y = a + bx + cx 2);
- الأسي (y = a * exp(bx));
- الطاقة (ص = أ*س^ب)؛
- الزائدي (ص = ب/س + أ)؛
- لوغاريتمي (ص = ب * 1ن(س) + أ)؛
- الأسي (ص = أ * ب ^ س).
دعونا نلقي نظرة على مثال لبناء نموذج الانحدار في برنامج Excel وتفسير النتائج. لنأخذ النوع الخطي من الانحدار.
مهمة. وفي 6 مؤسسات، تم تحليل متوسط الراتب الشهري وعدد الموظفين المغادرين. من الضروري تحديد مدى اعتماد عدد الموظفين المغادرين على متوسط الراتب.
يبدو نموذج الانحدار الخطي كما يلي:
ص = أ 0 + أ 1 × 1 +…+أ ك × ك.
حيث a هي معاملات الانحدار، x هي المتغيرات المؤثرة، k هو عدد العوامل.
في مثالنا، Y هو مؤشر ترك الموظفين. العامل المؤثر هو الأجور (x).
يحتوي برنامج Excel على وظائف مضمنة يمكنها مساعدتك في حساب معلمات نموذج الانحدار الخطي. لكن الوظيفة الإضافية "حزمة التحليل" ستفعل ذلك بشكل أسرع.
نقوم بتفعيل أداة تحليلية قوية:
بمجرد تفعيلها، ستكون الوظيفة الإضافية متاحة في علامة التبويب "البيانات".
الآن دعونا نقوم بتحليل الانحدار نفسه.
بادئ ذي بدء، ننتبه إلى R-squared والمعاملات.
R-squared هو معامل التحديد. في مثالنا – 0.755، أو 75.5%. وهذا يعني أن المعلمات المحسوبة للنموذج تفسر 75.5% من العلاقة بين المعلمات المدروسة. كلما ارتفع معامل التحديد، كلما كان النموذج أفضل. جيد - فوق 0.8. سيئ – أقل من 0.5 (لا يمكن اعتبار مثل هذا التحليل معقولاً). في مثالنا – "ليس سيئا".
يوضح المعامل 64.1428 ما ستكون عليه Y إذا كانت جميع المتغيرات في النموذج قيد النظر تساوي 0. أي أن قيمة المعلمة التي تم تحليلها تتأثر أيضًا بعوامل أخرى غير موصوفة في النموذج.
يُظهر المعامل -0.16285 وزن المتغير X على Y. أي أن متوسط الراتب الشهري ضمن هذا النموذج يؤثر على عدد المغادرين بوزن -0.16285 (وهذه درجة تأثير صغيرة). تشير العلامة "-" إلى تأثير سلبي: كلما ارتفع الراتب، قل عدد الأشخاص الذين يستقيلون. وهو عادل.
تحليل الارتباط في Excel
يساعد تحليل الارتباط في تحديد ما إذا كانت هناك علاقة بين المؤشرات في عينة واحدة أو عينتين. على سبيل المثال، بين وقت تشغيل الآلة وتكلفة الإصلاحات، وسعر المعدات ومدة التشغيل، وطول ووزن الأطفال، وما إلى ذلك.
إذا كان هناك اتصال، فهل تؤدي الزيادة في أحد المعلمات إلى زيادة (ارتباط إيجابي) أو نقصان (سلبي) في الآخر. يساعد تحليل الارتباط المحلل على تحديد ما إذا كان من الممكن استخدام قيمة أحد المؤشرات للتنبؤ بالقيمة المحتملة لمؤشر آخر.
تتم الإشارة إلى معامل الارتباط بواسطة r. يختلف من +1 إلى -1. سيكون تصنيف الارتباطات في المجالات المختلفة مختلفًا. عندما يكون المعامل 0، لا توجد علاقة خطية بين العينات.
دعونا نلقي نظرة على كيفية العثور على معامل الارتباط باستخدام Excel.
للعثور على المعاملات المقترنة، يتم استخدام الدالة CORREL.
الهدف: تحديد ما إذا كانت هناك علاقة بين زمن تشغيل المخرطة وتكلفة صيانتها.
ضع المؤشر في أي خلية واضغط على زر fx.
- في فئة "الإحصائيات"، حدد الدالة CORREL.
- الوسيطة "الصفيف 1" - النطاق الأول من القيم - وقت تشغيل الآلة: A2:A14.
- الوسيطة "المصفوفة 2" - النطاق الثاني من القيم - تكلفة الإصلاح: B2:B14. انقر فوق موافق.
لتحديد نوع الاتصال، تحتاج إلى إلقاء نظرة على العدد المطلق للمعامل (كل مجال من مجالات النشاط له مقياسه الخاص).
ل تحليل الارتباطعدة معلمات (أكثر من 2)، فمن الملائم أكثر استخدام "تحليل البيانات" (الوظيفة الإضافية "حزمة التحليل"). تحتاج إلى تحديد الارتباط من القائمة وتعيين المصفوفة. الجميع.
سيتم عرض المعاملات الناتجة في مصفوفة الارتباط. مثله:
تحليل الارتباط والانحدار
ومن الناحية العملية، غالبًا ما يتم استخدام هاتين التقنيتين معًا.
مثال:
الآن أصبحت بيانات تحليل الانحدار مرئية.
دعونا نفكر في نموذج الانحدار الخطي المقترن للعلاقة بين متغيرين، حيث تكون دالة الانحدار φ(خ)خطي. دعونا نشير بواسطة ذ سالمتوسط المشروط للخاصية يالخامس سكانبقيمة ثابتة سعامل X. ثم ستبدو معادلة الانحدار كما يلي:
ذ س = فأس + ب، أين أ–معامل الانحدار(مؤشر ميل خط الانحدار الخطي) . يوضح معامل الانحدار عدد الوحدات التي يتغير فيها المتغير في المتوسط يعند تغيير متغير Xلوحدة واحدة. باستخدام طريقة المربعات الصغرى، يتم الحصول على الصيغ التي يمكن استخدامها لحساب معلمات الانحدار الخطي:
الجدول 1. صيغ لحساب معلمات الانحدار الخطي
عضو مجاني ب |
معامل الانحدار أ |
معامل التحديد |
اختبار الفرضية حول أهمية معادلة الانحدار |
||
ن 0 : |
ن 1 : | |
،،، الملحق 7 (للانحدار الخطي ع = 1) |
ويتم تحديد اتجاه العلاقة بين المتغيرات بناء على إشارة معامل الانحدار. وإذا كانت إشارة معامل الانحدار موجبة فإن العلاقة بين المتغير التابع والمتغير المستقل تكون موجبة. وإذا كانت إشارة معامل الانحدار سالبة، فإن العلاقة بين المتغير التابع والمتغير المستقل تكون سالبة (معكوسة).
ولتحليل الجودة الشاملة لمعادلة الانحدار، يتم استخدام معامل التحديد ر 2 ويسمى أيضًا مربع معامل الارتباط المتعدد. ويكون معامل التحديد (مقياس اليقين) دائمًا ضمن الفترة. إذا كانت القيمة ر 2 قريب من الوحدة، وهذا يعني أن النموذج المبني يفسر تقريبًا كل التباين في المتغيرات المقابلة. وعلى العكس من ذلك المعنى ر 2 ما يقرب من الصفر يعني سوء نوعية النموذج الذي تم إنشاؤه.
معامل التحديد ر 2 يُظهر النسبة المئوية التي تصف بها دالة الانحدار الموجودة العلاقة بين القيم الأصلية يو X. في التين. ويبين الشكل 3 التباين الذي أوضحه نموذج الانحدار والتباين الإجمالي. وفقًا لذلك، توضح القيمة عدد النسبة المئوية لتغير المعلمة يبسبب عوامل غير مدرجة في نموذج الانحدار.
مع ارتفاع قيمة معامل التحديد بنسبة 75٪، يمكن إجراء توقع لقيمة محددة ضمن نطاق البيانات الأولية. عند التنبؤ بقيم خارج نطاق البيانات الأولية، لا يمكن ضمان صحة النموذج الناتج. ويفسر ذلك حقيقة أنه قد يظهر تأثير عوامل جديدة لا يأخذها النموذج في الاعتبار.
يتم تقييم أهمية معادلة الانحدار باستخدام معيار فيشر (انظر الجدول 1). وبشرط صحة الفرضية الصفرية، فإن المعيار له توزيع فيشر مع عدد درجات الحرية , (للانحدار الخطي المقترن ع = 1). إذا تم رفض الفرضية الصفرية، تعتبر معادلة الانحدار ذات دلالة إحصائية. إذا لم يتم رفض الفرضية الصفرية، فإن معادلة الانحدار تعتبر غير ذات دلالة إحصائية أو غير موثوقة.
مثال 1.في ورشة الآلات، يتم تحليل هيكل تكاليف المنتج وحصة المكونات المشتراة. لوحظ أن تكلفة المكونات تعتمد على وقت تسليمها. تم اختيار المسافة المقطوعة باعتبارها العامل الأكثر أهمية الذي يؤثر على وقت التسليم. إجراء تحليل الانحدار لبيانات العرض:
المسافة، أميال | ||||||||||
الوقت، دقيقة |
لإجراء تحليل الانحدار:
إنشاء رسم بياني للبيانات الأولية، وتحديد طبيعة الاعتماد تقريبًا؛
اختيار نوع دالة الانحدار وتحديد المعاملات العددية للنموذج باستخدام طريقة المربعات الصغرى واتجاه العلاقة؛
تقييم قوة الاعتماد على الانحدار باستخدام معامل التحديد؛
تقييم أهمية معادلة الانحدار.
قم بالتنبؤ (أو الاستنتاج حول استحالة التنبؤ) باستخدام النموذج المعتمد لمسافة ميلين.
2. حساب المقادير اللازمة لحساب معاملات معادلة الانحدار الخطي ومعامل التحديدر 2 :
; ;;.
اعتماد الانحدار المطلوب له الشكل: . ونحدد اتجاه العلاقة بين المتغيرات: إشارة معامل الانحدار موجبة، وبالتالي فإن العلاقة موجبة أيضاً، مما يؤكد الافتراض البياني.
3. دعونا نحسب معامل التحديد: أو 92%. وبذلك فإن النموذج الخطي يفسر 92% من التباين في زمن التسليم، مما يعني أنه تم اختيار عامل (المسافة) بشكل صحيح. لم يتم شرح 8% من تباين الوقت، وهو ما يرجع إلى عوامل أخرى تؤثر على وقت التسليم ولكنها غير مدرجة في نموذج الانحدار الخطي.
4. دعونا نتحقق من أهمية معادلة الانحدار:
لأن– معادلة الانحدار (النموذج الخطي) ذات دلالة إحصائية.
5. دعونا نحل مشكلة التنبؤ. منذ معامل التحديدر 2 له قيمة عالية بما فيه الكفاية وتكون مسافة 2 ميل التي سيتم التنبؤ بها ضمن نطاق البيانات المدخلة، فيمكن إجراء التنبؤ:
يمكن إجراء تحليل الانحدار بسهولة باستخدام الإمكانات اكسل. يتم استخدام وضع التشغيل "الانحدار" لحساب معلمات معادلة الانحدار الخطي والتحقق من مدى ملاءمتها للعملية قيد الدراسة. في مربع الحوار، املأ المعلمات التالية:
مثال 2. أكمل مهمة المثال 1 باستخدام وضع "الانحدار".اكسل.
استنتاج النتائج | |||||
إحصائيات الانحدار |
|||||
الجمع ر | |||||
R-مربع | |||||
تطبيع مربع R | |||||
خطأ تقليدي | |||||
الملاحظات | |||||
احتمال |
خطأ تقليدي |
t-إحصائية |
قيمة P |
||
تقاطع Y | |||||
المتغير × 1 |
دعونا نلقي نظرة على نتائج تحليل الانحدار المعروضة في الجدول.
ضخامةR-مربع ، ويسمى أيضًا مقياس اليقين، وهو ما يميز جودة خط الانحدار الناتج. يتم التعبير عن هذه الجودة من خلال درجة المراسلات بين البيانات المصدر ونموذج الانحدار (البيانات المحسوبة). في مثالنا، مقياس اليقين هو 0.91829، وهو ما يشير إلى توافق جيد جدًا لخط الانحدار مع البيانات الأصلية ويتزامن مع معامل التحديدر 2 ، تحسب بواسطة الصيغة.
الجمع ر - معامل الارتباط المتعدد R - يعبر عن درجة اعتماد المتغيرين المستقلين (X) والمتغير التابع (Y) ويساوي الجذر التربيعي لمعامل التحديد. في تحليل الانحدار الخطي البسيطمعامل R المتعدديساوي معامل الارتباط الخطي (ص = 0,958).
معاملات النموذج الخطي:ي -تداخل يطبع قيمة المصطلح الوهميب، أالمتغير X1 - معامل الانحدار أ. ثم معادلة الانحدار الخطي هي:
ص = 2.6597س+ 5.9135 (وهو ما يتوافق جيدًا مع نتائج الحساب في المثال 1).
بعد ذلك، دعونا نتحقق من أهمية معاملات الانحدار:أوب. مقارنة قيم الأعمدة في أزواجاحتمال وخطأ تقليدي في الجدول نلاحظ أن القيم المطلقة للمعاملات أكبر من أخطائها المعيارية. وبالإضافة إلى ذلك فإن هذه المعاملات تعتبر ذات دلالة إحصائية، حيث يمكن الحكم عليها من خلال قيم مؤشر القيمة P، وهي أقل من مستوى الدلالة المحدد α = 0.05.
ملاحظة |
توقع ي |
بقايا الطعام |
الموازين القياسية | |
ويبين الجدول نتائج الإخراجبقايا الطعام. باستخدام هذا الجزء من التقرير، يمكننا رؤية انحرافات كل نقطة عن خط الانحدار الذي تم إنشاؤه. أكبر قيمة مطلقةبقيةفي هذه الحالة - 1.89256، الأصغر - 0.05399. لتفسير هذه البيانات بشكل أفضل، قم برسم البيانات الأصلية وخط الانحدار الذي تم إنشاؤه. كما يتبين من البناء، فإن خط الانحدار "ملائم" جيدًا لقيم البيانات الأولية، وتكون الانحرافات عشوائية.