الملخصات صياغات قصة

مهام المشروع حول موضوع تبعيات الارتباط. تبعيات الارتباط

الهدف من العمل:الحصول على فكرة عن الارتباط بين الكميات؛ إتقان طريقة حساب معامل الارتباط باستخدام دالة KOPPEL.
البرامج المستخدمة:معالج جداول البيانات مايكروسوفت أوفيس إكسل.

التمرين 1

مطلوب إجراء حسابات الارتباط بين أداء الطالب ونفقات أعمال المدرسة، الموضحة في المادة 38 من الكتاب المدرسي.
1. املأ جدول البيانات بالبيانات التالية:

2. إنشاء مخطط مبعثر لاعتماد الكميات.

3. قم بتنفيذ الوظيفة الإحصائية KOPEL، مع تحديد نطاقات القيم في مربع الحوار: B2:B21 وC2:C21.
4. اكتب قيمة معامل الارتباط.

المهمة 2

إجراء حسابات ارتباطية لأداء الطلاب فيما يتعلق بتوفير الكتب المدرسية وتوفير أجهزة الكمبيوتر، المبينة في الجدول التالي.

مهمة للإكمال المستقل حول موضوع "تبعيات الارتباط"

قم بإعداد جدول قياسات مقترنة لقيم بعض الكميات التي يوجد بينها ارتباط افتراضي. تحليل هذا الاعتماد لوجود علاقة خطية.

      تتضمن أمثلة الكميات ذات الصلة ذات الصلة ما يلي:
      مستوى التعليم (الذي يتم قياسه، على سبيل المثال، بعدد سنوات الدراسة الإجمالية) ومستوى الدخل الشهري؛
      مستوى التعليم ومستوى المنصب (بالنسبة للأخير، قم بالتوصل إلى مقياس تقليدي)؛
      عدد أجهزة الكمبيوتر في المدرسة لكل طالب ومتوسط ​​درجات الاختبار لمستوى الكفاءة في تقنيات معالجة المعلومات القياسية؛
      عدد الساعات التي يقضيها طلاب المدارس الثانوية في الواجبات المنزلية ومتوسط ​​الدرجات؛
      كمية الأسمدة المطبقة على التربة وإنتاجية محصول معين.

في هذه الحالة، يمكنك الذهاب بطريقتين. الأول، وهو الأكثر جدية ومفيدًا من الناحية العملية: أنت لا تتوصل إلى علاقة افتراضية فحسب، بل تجد أيضًا بيانات فعلية عنها في الأدبيات. الطريقة الثانية هي الأسهل: تعامل معها كلعبة لفهم ماهية الارتباط وتطوير المهارات الفنية لتحليلها، والتوصل إلى البيانات المقابلة، ومحاولة القيام بذلك بالطريقة الأكثر منطقية.

يعد اختبار الدولة الموحدة في علوم الكمبيوتر اختبارًا اختياريًا يخضع له المتقدمون لتخصصات تكنولوجيا المعلومات. تحدث خبير امتحان الدولة الموحدة، متخصص في العمل التربوي والمنهجي، ومطور برامج الإعداد لامتحان علوم الكمبيوتر، عن كيفية الاستعداد الأمثل لهذا الامتحان. ليودميلا جونتار.

ما هو الوضع الحالي لعلوم الكمبيوتر في المدارس الثانوية؟ ما مدى معرفة أطفال المدارس بعلوم الكمبيوتر؟
في المدارس العادية، يتم تخصيص ساعة إلى ساعتين أسبوعيًا لعلوم الكمبيوتر. في الوقت نفسه، يتضمن المنهج الكثير من المواد، ويدرس تلاميذ المدارس مواضيع مختلفة. من حيث المبدأ، يمكننا القول أن الأطفال يعرفون علوم الكمبيوتر جيدًا. معظم الطلاب الحاصلين على درجات جيدة وممتازة يأتون إلى دوراتي. لكن يمكنني تحليل مستوى المعرفة بموضوعات علوم الكمبيوتر الفردية الضرورية اجتياز امتحان الدولة الموحدة، وهنا كل شيء ليس على ما يرام. الاستعداد خصيصا لامتحان الدولة الموحدة دروس المدرسةإنه صعب بما فيه الكفاية. تعد علوم الكمبيوتر موضوعًا اختياريًا، ومن أجل الحصول على درجة عالية هنا، فأنت بحاجة إلى معرفة إضافية، وبالتالي، فصول إضافية لدراسة موضوعات معينة بمزيد من التعمق. يمكن ان تكون دراسة ذاتية، مادة اختيارية في المدرسة، فصول مع مدرس أو دورات - الاختيار متروك للطلاب وأولياء أمورهم.

في العام الماضي، تم استبعاد جميع مهام الاختبار التي تتطلب اختيار الإجابة الصحيحة من الجزء الأول من امتحان الدولة الموحدة في علوم الكمبيوتر. الآن يجب على المشاركين في الامتحان إدخال الإجابة بأنفسهم. ما مدى صعوبة هذا الامتحان؟
هذا ابتكار جيد جدًا. أصبح الامتحان أكثر صعوبة بالنسبة للطلاب الضعفاء، حيث سمح لهم اختيار الإجابات بالعثور على الإجابة الصحيحة باستخدام طريقة الاختيار. بالنسبة لبقية الأطفال، لم يكن الامتحان صعبا.

من خلال تجربتك، ما هي مجالات علوم الكمبيوتر الأكثر صعوبة بالنسبة لأطفال المدارس وتسبب لهم أكبر قدر من الصعوبة؟ ما هي المواضيع الأسهل؟
يمكن تصنيف العديد من مهام الاستخدام ضمن موضوع واحد كبير. لذلك من الأفضل أن نقول إن هناك مهام يرتكب فيها تلاميذ المدارس أكبر عدد من الأخطاء. سأذكر أرقامهم: هذه هي المهام رقم 5 ورقم 9 ورقم 10 ورقم 11 ورقم 12 ورقم 16 ورقم 18 ورقم 23. الأسئلة الخمسة الأولى عبارة عن أسئلة أساسية حول موضوعات مثل "الترميز غير المتساوي والموحد"، و"تشفير النص، والصوت، والصور النقطية"، و"الخوارزميات العودية"، و"المعالجة على الإنترنت". الأسباب الأكثر شيوعًا لمشاكل هذه المهام هي الأخطاء الحسابية أو الإتقان الميكانيكي للموضوع. وعندما يتغير السؤال يضيع الطالب مع أن حل المشكلة لا يتغير.

المهام رقم 16 ورقم 18 ورقم 23 بالكاد يتم أخذها في الاعتبار أو لا يتم أخذها في الاعتبار على الإطلاق في الدورة المدرسية. رقم 16 ورقم 18 عبارة عن مهام ذات مستوى متقدم للأطفال الذين يهدفون إلى الحصول على درجة عالية. المهمة رقم 16 تتعلق بموضوع "أنظمة حساب التفاضل والتكامل"، والأخطاء هنا حسابية بشكل أساسي. في المهمة رقم 18 بشأن تحويل التعبيرات المنطقية، غالبا ما يرتكب الخريجون أخطاء في تقنية التنفيذ. لكن المهمة رقم 23 هي الأصعب من الناحية الفنية في الجزء الأول من امتحان الدولة الموحدة، ولا يكملها إلا تلاميذ المدارس الأكثر استعدادًا.

بالإضافة إلى ذلك، لا ينبغي أن يدرس الأطفال الذين لديهم مشاكل في الرياضيات علوم الكمبيوتر. إذا كانت لديك صعوبات في الرياضيات، فسيكون الأمر صعبًا في علوم الكمبيوتر. وهذان الموضوعان مرتبطان ارتباطا وثيقا.

إذا تحدثنا عن أكثر مواضيع بسيطة، ثم هذه هي "أنظمة الأرقام الثنائية"، و"جداول الحقيقة للحسابات المنطقية"، و"قواعد البيانات وأنظمة الملفات"، و"جداول البيانات"، و"المتغيرات، ومشغلات التعيين"، و"الخوارزميات الحسابية". تنعكس جميعها في المهام من رقم 1 إلى رقم 6، والتي يتم تنفيذها من قبل جميع الطلاب تقريبًا، بما في ذلك الطلاب الضعفاء.

ما هي المهام في امتحان الدولة الموحدة في علوم الكمبيوتر التي تستحق أكبر عدد من النقاط؟ ما هي أفضل طريقة للاستعداد لهم؟
كلما زاد رقم المهمة، زادت النتيجة - هذه هي الطريقة التي يعمل بها اختبار الدولة الموحدة. المهمة الأخيرة - رقم 27 - حصلت على تصنيف أعلى من البقية، أي 4 نقاط من أصل 35 أولية. بالنسبة للمهمتين رقم 26 ورقم 24 يمكنك الحصول على 3 نقاط، للمهمة رقم 25 - 2 نقطة، لا 23 - 1 نقطة. تبلغ المهام الأربع للجزء الثاني (رقم 24-27) 34 نقطة من أصل 100 نقطة اختبار، أي أكثر من ثلث الدرجة القصوى للامتحان.

للتحضير جيدًا لهذه المهام، عليك إكمالها عدد كبير منالتمارين والعمل على الأخطاء في كل مرة. من المهم أيضًا طلب المساعدة من أحد المعلمين هنا، حيث أن إتقان كل هذا بمفردك يستغرق وقتًا أطول بكثير.

هل هناك "معادلة للنجاح" ستساعدك على الاستعداد لامتحان الدولة الموحدة في علوم الكمبيوتر بأفضل طريقة ممكنة؟
القاعدة الأولى هي العمل: أنت بحاجة إلى العمل والعمل والعمل مرة أخرى. السر الثاني هو العمل على الأخطاء، ويجب أن يتم ذلك دون فشل. وثالثًا، عند إكمال المهمة، اقرأ السؤال بعناية من البداية إلى النهاية لتجنب الأخطاء غير المقصودة. إنه لأمر مخز أن يجيب تلاميذ المدارس على السؤال الخطأ المطروح في المشكلة.
ما هي المصادر التي تنصح باستخدامها؟ دراسة ذاتيةللامتحان؟
1. "موقع FIPI الإلكتروني"؛
2. "موقع ك. بولياكوف"؛
3. المجموعات مهام الاختبارامتحان الدولة الموحدة وتمارين التدريب FIPI.

ما هي العثرات في مهام الجزء الثاني؟ ما الذي يجب عليك الانتباه إليه عند التحضير للمهام ذات التعقيد المتزايد؟
المهمة رقم 24هنا يجب أن تكون قادرًا على تنفيذ وفهم خوارزمية مكتوبة بلغة برمجة. إذا فهمت، فهذا يعني أنك ستكمل المهام الموضحة في المشكلة، وإذا لم تفعل، فلن تفعل ذلك. تطرح هذه المهمة سؤالين أو ثلاثة، ويحتوي أولها على سر فهم الخوارزمية وإيجاد تلك الأخطاء التي يقترح العثور عليها وكتابتها وتصحيحها. أجب عن السؤال الأول أولاً، فهذا سيساعدك على فهم الخوارزمية والعثور على الأخطاء.

المهمة رقم 25من أجل إكمال هذه المهمة، من الضروري أولاً تحليل خوارزميات المشكلة المقترحة في FIPI "مبرمج امتحانات الدولة الموحدة في علوم الكمبيوتر". تتطلب المهمة منك إنشاء خوارزمية لحل مشكلة في إحدى لغات البرمجة، على وجه الخصوص، لتتمكن من العمل مع الأرقام، لتتمكن من تحديد أرقام بالشروط المطلوبة من مجموعة أرقام، للعمل في أي نظام أرقام ، ومعرفة علامات القسمة. إذا درس الرجال "الخوارزميات" في المدرسة، فمن الأسهل عليهم إكمال هذه المهمة. تلاميذ المدارس الذين يأتون إلى فصولي وليسوا على دراية بهذا الموضوع، أولا وقبل كل شيء، يبدأون في دراسة الخوارزميات باستمرار من "المبرمج".

المهمة رقم 26من المهم في هذه المهمة العثور على إجابة السؤال المقترح وصياغة إجابة كاملة وإثبات صحة الإجابة المختارة.

المهمة رقم 27المهمة إبداعية - والوحيدة التي يجب على الخريج أن يكتب فيها برنامجًا بشكل مستقل. عادة ما يتم تنفيذها بنجاح من قبل تلاميذ المدارس الذين يكتبون البرامج منذ عدة سنوات ويعرفون الرياضيات جيدًا. تستحق المهمة نقطتين أو 4 نقاط. في الفصل، أعمل مع الرجال بالتفصيل على الفروق الدقيقة في هذه المهمة حتى يحصلوا على أكبر عدد من النقاط في الامتحان.

بقي شهر واحد قبل امتحان الدولة الموحدة في علوم الكمبيوتر. كيف تنصح الخريجين بتخصيص وقتهم؟
في الوقت المتبقي، تحتاج إلى التدريب الجاد لتعزيز المهارات المكتسبة. من الضروري حل أكبر عدد ممكن من المشكلات والعمل بشكل منفصل على تلك المهام التي تسبب أكبر الصعوبات في إكمالها. إذا كنت تستعد لامتحان الدولة الموحدة بمفردك، فمن المهم جدًا الآن استشارة المعلم، لأن كل مهمة لها طابعها الخاص الذي تحتاج إلى معرفته.

"لقد تأثر جالتون بشدة بنظرية داروين للتطور، وخاصة بفكرة أن الأفراد الذين ينتمون إلى نفس النوع البيولوجي يختلفون عن بعضهم البعض. تخضع الخصائص الفردية التي تعزز البقاء على قيد الحياة إلى "الانتقاء الطبيعي" وتنتقل إلى النسل. يعتقد جالتون أن الذكاء هو سمة تختلف بين الأفراد، وهي مهمة للبقاء على قيد الحياة، ويتم توريثها بنفس الطريقة التي يتم بها توريث الخصائص الجسدية مثل لون العين أو الطول. قام بجمع حقائق تؤكد وراثة الذكاء، ونشر كتابين حول هذه المسألة: العباقرة الوراثيون (1869) والعلماء الإنجليز: الطبيعة والتنشئة (1874). وقد شاع هذا العمل الأخير مصطلحي "الطبيعة" و"التنشئة" المعروفين على نطاق واسع اليوم. لاحظ هابتون في عمله وجود اتجاه إحصائي مفاده أن العبقرية والقدرة في مجالات معينة (على سبيل المثال، الكفاءة في الكيمياء أو القانون) يمكن إرجاعها عبر عدة أجيال داخل الأسرة. ومع ذلك، فقد قلل من تأثير البيئة وخلص إلى أن العبقرية تنشأ نتيجة لانتقال المعلومات الوراثية. لقد جادل بوجهة نظره، على وجه الخصوص، بحقيقة وجود ذكاء لدى السكان التوزيع الطبيعي. وهناك سمات وراثية أخرى (مثل الطول) لها أيضًا توزيع طبيعي، ولذلك اعتبر جالتون هذه الحقيقة الإحصائية كمؤشر على تأثير الوراثة.

فقط في عام 1888 تمكن العالم من إظهار التكرار العالي لحدوث سمات مثل العبقرية في العائلات: لقد صاغ أفكاره في عمل بعنوان "الارتباط وقياسه". أولاً، اكتشف جالتون أنه يمكن تنظيم البيانات في صفوف وأعمدة بطريقة خاصة، وتوصل إلى النموذج الأولي لـ "مخطط التشتت" الحالي. ثانيًا، لاحظ جالتون أنه عندما يكون "الارتباط" غير مكتمل، يبدأ النمط في الظهور. الآباء والأمهات الذين لديهم طول أعلى من المتوسط ​​لديهم أطفال طوال القامة، ولكن في كثير من الأحيان لم يكونوا بطول الأم والأب. الآباء والأمهات الذين يقل طولهم عن المتوسط ​​كان لديهم أطفال قصيرو القامة، ولكن ليس إلى هذا الحد. وهذا يعني أن طول الأطفال يميل إلى التقزم، أو التراجع، نحو المتوسط ​​الحسابي في عدد السكان.

تعد ظاهرة "الانحدار إلى الوسط"، التي تشكل تهديدًا للصحة الداخلية للبحث، أحد أبرز اكتشافات جالتون.

كانت ملاحظة جالتون الثالثة هي أن الرسم البياني للمتوسط ​​الحسابي لكل عمود في الجدول المبعثر ينتج خطًا مستقيمًا إلى حد ما. في الأساس، هو نوع من "خط الانحدار". وهكذا اكتشف جالتون الخصائص الرئيسية لتحليل الارتباط.

بعد القراءة عن عمل جالتون، واصل كارل بيرسون أبحاثه في هذا المجال وطور صيغة لحساب معامل الارتباط. لقد أطلق على المعامل اسم "r"، والذي يرمز إلى "الانحدار"، تكريمًا لاكتشاف جالتون للانحدار إلى المتوسط. وعلى خطى جالتون، اعتقد بيرسون أن تحليل الارتباط يؤكد فكرة توريث العديد من الخصائص الموجودة في العائلات الفردية. (نقلا عن جودوين د.، بحث في علم النفس. بيتر، 2004، ص 312-313).

تعتبر المتغيرات مترابطة إذا كان هناك أي علاقة بينهما. وهذا يعني ضمنيًا مصطلح "الارتباط" - الاتصال المتبادل والعلاقة. وفي حالة الارتباط المباشر أو الإيجابي، تكون العلاقة بحيث ترتبط القيم العالية لمتغير واحد بقيم عالية لمتغير آخر، والقيم المنخفضة للأول مع القيم المنخفضة للثاني. الارتباط السلبي يعني وجود علاقة عكسية. ترتبط القيم العالية لمتغير واحد بقيم منخفضة لمتغير آخر، والعكس صحيح.

تعد العلاقة بين الوقت المخصص للدراسة والدرجات مثالاً على الارتباط الإيجابي. ومن الأمثلة على الارتباط السلبي العلاقة بين الوقت الضائع والمعدل التراكمي. يمكن أن يكون الوقت الضائع من الناحية التشغيليةيتم تعريفه على أنه عدد الساعات التي يتم قضاؤها أسبوعيًا في أنشطة محددة، مثل لعب ألعاب الفيديو أو مشاهدة المسلسلات التلفزيونية.

تظهر قوة الارتباط من خلال قيمة خاصة للإحصاء الوصفي - "معامل الارتباط". معامل الارتباط هو -1.00 للارتباط السلبي المباشر، 0.00 لعدم وجود ارتباط، و+1.00 للارتباط الإيجابي الكامل. معامل الارتباط الأكثر شيوعًا هو معامل بيرسون. يتم حساب Pearson r للبيانات التي تم الحصول عليها باستخدام مقياس الفاصل أو النسبة. بالنسبة لمقاييس القياس الأخرى، يتم أخذ أنواع أخرى من الارتباط في الاعتبار. على سبيل المثال، بالنسبة للبيانات الترتيبية (أي المرتبة)، يتم حساب ρ(rho) لسبيرمان (المعروف أيضًا باسم r s).

تماما مثل المتوسط ​​الحسابي والانحراف المعياري، فإن معامل الارتباط هو إحصائية وصفية. ويحدد التحليل النهائي ما إذا كان ارتباط معين أكبر (أو أقل) بكثير من الصفر. وبالتالي، بالنسبة لدراسات الارتباط، تقول الفرضية الصفرية (H 0) أن القيمة الفعلية لـ r = 0 (أي لا توجد علاقة)، ​​والفرضية البديلة (H 1) تقول أن r ≠ 0. لرفض فرضية العدم هو أن نقرر أن هناك علاقة معنوية بين متغيرين.

مؤامرة مبعثر

يمكن اكتشاف قوة الارتباط من خلال النظر إلى المخطط المبعثر. وهو تمثيل رسومي للعلاقة التي يشير إليها الارتباط. في حالة وجود ارتباط موجب أو سلبي تمامًا، تشكل النقاط خطًا مستقيمًا، وينتج الارتباط الصفري مخطط تبعثر من النوع (أ) يتم توزيع نقاطه بشكل عشوائي. بالمقارنة مع الارتباط المعتدل (د وه)، تقع نقاط القوة أقرب إلى بعضها البعض (ب و ج). بشكل عام، مع ضعف الارتباط، تتحرك النقاط الموجودة على المخطط المبعثر بعيدًا عن القطر الذي يربط النقاط عند الارتباط الكامل. الغبطة تساوي +1.00 أو -1.00.

أ) ص = 0 ب) ص = -0.9 ج) ص = +0.9

د) ص = - 0.56 د) ص = +0.61

تم تقريب المخططات المبعثرة التي تمت مناقشتها أعلاه (باستثناء أ) بخطوط مستقيمة، أي أنها تعكس التبعيات الخطية. ومع ذلك، ليست كل العلاقات خطية، وحساب معامل بيرسون r لحالة غير خطية لن يساعد في الكشف عن طبيعة هذه العلاقة. يوضح الشكل التالي مثالًا افتراضيًا للعلاقة بين الاستثارة وأداء المهمة، موضحًا قانون يركس-دودسون: يتم تنفيذ المهام المعقدة بشكل جيد عند مستويات معتدلة من الاستثارة، ولكن بشكل سيئ عند المستويات المنخفضة جدًا والعالية جدًا. يوضح مخطط التشتت أن النقاط تقع على طول منحنى معين، لكن إذا حاولنا تطبيق الارتباط الخطي فسنحصل على r قريبة من الصفر.

عند إجراء بحث ارتباطي، من المهم مراعاة الأشخاص الذين تقع درجاتهم ضمن نطاق واسع. يؤدي تحديد نطاق أحد المتغيرين أو كليهما إلى تقليل الارتباط. لنفترض أننا ندرس العلاقة بين المعدل التراكمي والأداء الأكاديمي في إحدى الجامعات (يتم تقييمه من خلال متوسط ​​الدرجات التي يحصل عليها الطلاب الجدد في نهاية العام). في التين. أ) يوضح الشكل الذي قد يبدو عليه المخطط المبعثر في دراسة شملت 25 طالبًا. معامل الارتباط هو +0.87. ولكن إذا كنت تدرس هذه العلاقة رباط باستخدام مثال الطلاب الذين حصلوا على متوسط ​​درجات في المدرسة من 4.5 وما فوق، ر o سيتغير الارتباط وينخفض ​​إلى +0.27.

أ) ص = 0.87 ب) ص = 0.27

معامل التحديد – ز 2

من المهم أن تضع في اعتبارك أن الأمر سهل للغاية خطأفهم معنى قيمة بيرسون r معينة. إذا كانت +0.70، فإن العلاقة قوية نسبيًا بالفعل، ولكن لا أعتقد أن +0.70 يرتبط بطريقة ما بـ 70%،وفي هذه الحالة تكون العلاقة ثابتة بنسبة 70%. هذا ليس صحيحا. ولتفسير قيمة الارتباط، ينبغي استخدام معامل التحديد (ص 2). تم العثور عليه عن طريق تربيع r، وبالتالي فإن قيمته ليست سلبية أبدًا. يتم تعريف هذا المعامل رسميًا على أنه درجة التباين في متغير ارتباط واحد بسبب التباين في متغير آخر. دعونا نشرح ذلك بمثال محدد.

يتم إجراء دراسة يتم فيها قياس مستويات الاكتئاب العاطفي ومستويات 100 مشارك المعدل التراكمي. وقمنا باختبار العلاقة بين المتغيرين ووجدنا ارتباطا سلبيا: كلما ارتفع مستوى الاكتئاب انخفض متوسط ​​الدرجات، والعكس كلما انخفض الاكتئاب ارتفع المتوسط. خذ بعين الاعتبار قيمتي الارتباط التي يمكن الحصول عليها من هذه الدراسة - -1.00 و -0.50. سيكون معامل التحديد يساوي 1.00 و 0.25 على التوالي. لفهم معنى هذه القيم، ضع في اعتبارك أولاً أن متوسط ​​درجات 100 شخص تمت دراستهم من المرجح أن يتراوح من 3.0 إلى 5.0. كباحثين، نريد معرفة ذلك سبب هذا التباين– لماذا يحصل شخص ما على 3.2 نقطة وآخر على 4.4 نقطة، وما إلى ذلك. بمعنى آخر، نريد أن نعرف ما الذي يسبب الفروق الفردية في المعدل التراكمي؟ في الحقيقة، قد يكون هذا بسبب عدة عوامل: عادات الدراسة، ومستوى الذكاء العام، والثبات الانفعالي، والميل لاختيار مواضيع سهلة للدراسة، وما إلى ذلك. كما تظهر نتائج اختبار الاكتئاب، تدرس دراستنا الافتراضية أحد هذه العوامل- الاستقرار العاطفي، ز 2 يوضح مقدار التباين في متوسط ​​الدرجات الذي يمكن أن يعزىمباشرة مع الاكتئاب.في الحالة الأولى، حيث r = -1.00 و r 2 = 1.00، يمكننا أن نستنتج أن 100% من التباين في متوسط ​​الدرجات يرجع إلى التباين في درجات الاكتئاب. ولذلك، يمكننا القول أن 100% من الاختلافات بين متوسط ​​الدرجات (3.2 و4.4، الخ) سببها الاكتئاب. في دراسة حقيقية، بالطبع، لا يمكن الحصول على مثل هذه النتيجة. في الحالة الثانية، حيث r = -0.5 و r 2 = 0.25، فإن ربع التباين (25٪) فقط في متوسط ​​الدرجات سيكون بسبب الاكتئاب. أما نسبة الـ 75% المتبقية فترجع إلى عوامل أخرى مشابهة لتلك المذكورة أعلاه. باختصار، يعتبر معامل التحديد مقياسًا أفضل لقوة العلاقة من معامل بيرسون r.

تحليل الانحدار: وضع الافتراضات

الميزة الأكثر أهمية لدراسات الارتباط هي الاحتمالية إذا كان هناك ارتباط قوي وضع افتراضات حول السلوك المستقبلي. إن الارتباط بين متغيرين يجعل من الممكن، بناء على قيم أحدهما، التنبؤ بقيم الآخر. من السهل إظهار ذلك باستخدام مثال ذو درجات متوسطة. إذا علمنا أن الوقت المخصص للدراسة والمعدل التراكمي مرتبطان، وأن شخصًا ما يدرس 45 ساعة في الأسبوع، فيمكننا التنبؤ بدقة بمعدل تراكمي مرتفع نسبيًا لذلك الطالب. وبالمثل، فإن المعدل التراكمي المرتفع سيتنبأ بالوقت الذي تقضيه في الدراسة. يسمى وضع الافتراضات على أساس دراسات الارتباط تحليل الانحدار.

في التين. يُظهر مخططًا مبعثرًا لـ: أ) الوقت المخصص للدراسة والمعدل التراكمي و ب) الوقت الضائع والمعدل التراكمي. يعرض كل رسم بياني أيضًا خط الانحدار، والذي يستخدم لوضع الافتراضات. يُطلق على خط الانحدار أيضًا اسم "الخط الأمثل": فهو يمثل أفضل طريقة ممكنة لتلخيص نقاط المخطط المبعثر. وهذا يعني أن القيم المطلقة للمسافات العمودية بين كل نقطة على الرسم البياني وخط الانحدار ضئيلة.

يتم حساب خط الانحدار باستخدام الصيغة Y = أ + ب X، حيث a هي النقطة التي يتقاطع عندها الخط المستقيم مع المحور Y (أي القطعة المقطوعة على المحور Y)، أ ب– هذه هي زاوية ميل الخط المستقيم، أو انحداره النسبي. X هي كمية معروفة، وY هي الكمية التي نحاول التنبؤ بها. وبمعرفة 1) قوة الارتباط و2) الانحراف المعياري للمتغيرات المرتبطة، يمكننا حساب الكمية ب، معرفة 1) القيمة بو 2) يمكن العثور على متوسط ​​قيم المتغيرات المرتبطة أ.

يستخدم تحليل الانحدار معادلة الانحدار للتنبؤ بقيمة Y (مثل المعدل التراكمي) بناءً على قيمة X (مثل الوقت المخصص للدراسة). يُطلق على Y أحيانًا اسم Y معاييرالمتغير، و X - فاعل-ممزقعامل. ومع ذلك، لوضع افتراضات دقيقة، يجب أن يكون الارتباط أعلى بكثير من الصفر. كلما زاد الارتباط، كلما اقتربت نقاط مخطط التشتت من خط الانحدار، وزادت ثقتك في صحة افتراضاتك. وبالتالي، فإن مشكلة تحديد النطاق المذكورة سابقًا، والتي تقلل الارتباط، تقلل أيضًا من صحة التنبؤات.

يوضح الرسم البياني لمعادلة الانحدار كيفية عمل التنبؤات باستخدام خط الانحدار.

على سبيل المثال، ما هو متوسط ​​الدرجة المتوقعة من الطالب الذي يقضي 34 ساعة في الأسبوع في الدراسة. للحصول على الإجابة نرسم خطوطا متعامدة من المحور X إلى خط الانحدار ثم من نقطة التقاطع إلى المحور Y وستكون قيمة النقطة على المحور Y هي القيمة المقدرة (تذكر صحة الافتراض يعتمد على قوة الارتباط). وبالتالي، فإن 40 ساعة من وقت الدراسة من شأنها أن تتنبأ بمعدل تراكمي قدره 3.4، وإهدار 41 ساعة من شأنه أن يتنبأ بمعدل تراكمي أعلى بقليل من 2.3. باستخدام الصيغيمكن للانحدار حساب قيم أكثر دقة وإجراء تنبؤات أكثر دقة.

يجب أن تعلم أن تحليل الانحدار يستخدم في معظم الدراسات التي نتعرف عليها من وسائل الإعلام.

على سبيل المثال، ربما نصادف تقريراً عن دراسة حول "عوامل خطر الإصابة بالنوبات القلبية"، والتي خلصت، استناداً إلى ارتباط كبير بين التدخين وأمراض القلب، إلى أن المدخنين الشرهين هم أكثر عرضة للإصابة بأمراض القلب والأوعية الدموية مقارنة بغير المدخنين. وهذا يعني أن التدخين مؤشر على الإصابة بأمراض القلب. واستناداً إلى دراسة أخرى بحثت في "ملف تعريف الزوج المسيء"، يمكن الاستنتاج أن احتمالية مثل هذا السلوك تزداد إذا كان الجاني عاطلاً عن العمل. وينبع ذلك من العلاقة بين البطالة والميل إلى الانخراط في سلوكيات مسيئة. على أساس وجود الارتباط باستخدام تحليل الانحداروبمعرفة الأول يمكننا أن نفترض الثاني.

تبعيات الارتباط

يتم بناء نماذج الانحدار الرياضية في الحالات التي يكون من المعروف فيها وجود علاقة بين عاملين ويشترط الحصول على وصفها الرياضي. الآن سوف ننظر إلى مشاكل من نوع مختلف. يترك خاصية مهمةلبعض الأنظمة المعقدة هو العامل A. ويمكن أن يتأثر في وقت واحد بالعديد من العوامل الأخرى: B، C، D، وما إلى ذلك.

سننظر في نوعين من المشاكل - نحتاج إلى تحديد:

1. هل للعامل B أي تأثير منتظم ملحوظ على العامل A؛

كمثال على نظام معقد، سننظر في المدرسة. بالنسبة للنوع الأول من المشكلة، فليكن العامل (أ) هو متوسط ​​الأداء الأكاديمي لطلاب المدرسة، والعامل (ب) هو النفقات المالية للمدرسة للاحتياجات الاقتصادية: تجديد المبنىوتحديث الأثاث والتصميم الجمالي للغرفة وما إلى ذلك. هنا تأثير العامل B على العامل A ليس واضحًا. ربما، هناك أسباب أخرى لها تأثير أقوى بكثير على الأداء الأكاديمي: مستوى مؤهلات المعلمين، وعدد الطلاب، والمستوى الوسائل التقنيةالتدريب وغيرها.

يعرف الإحصائيون أنه من أجل تحديد الاعتماد على عامل معين، من الضروري استبعاد تأثير العوامل الأخرى قدر الإمكان. ببساطة، عند جمع المعلومات من مدارس مختلفة، تحتاج إلى اختيار المدارس التي لديها نفس عدد الطلاب تقريبًا، ومؤهلات المعلمين، وما إلى ذلك، ولكن نفقات تشغيل المدارس مختلفة (قد يكون لدى بعض المدارس رعاة أثرياء، وقد لا يكون لدى مدارس أخرى).


لذا، فلنعبر عن نفقات أعمال المدرسة بعدد الروبلات لكل عدد من الطلاب في المدرسة (فرك/شخص) الذين قضوا خلال فترة زمنية معينة (على سبيل المثال، على مدى السنوات الخمس الماضية). دع الأداء الأكاديمي يتم تقييمه من خلال متوسط ​​​​درجات طلاب المدارس بناءً على نتائجهم الأخيرة العام الدراسي. مرة أخرى، نلفت انتباهكم إلى حقيقة أنه عادة ما يتم استخدام القيم النسبية والمتوسطة في الحسابات الإحصائية.

يتم عرض نتائج جمع البيانات لـ 20 مدرسة، والتي تم إدخالها في جدول بيانات، في الشكل 1. 1. في الشكل. ويبين الشكل 2 مخططًا مبعثرًا تم إنشاؤه من هذه البيانات.

أرز. 1 الإحصائيات

أرز. 2 مؤامرة مبعثر

إن قيم الكميتين: التكاليف المالية وأداء الطالب لها تشتت كبير، وللوهلة الأولى لا تظهر العلاقة بينهما. ومع ذلك، فمن الممكن أن تكون موجودة.

تسمى التبعيات بين الكميات، التي تخضع كل منها لتشتت لا يمكن التحكم فيه تمامًا، بتبعيات الارتباط.

الفصل الإحصائيات الرياضيةالذي يدرس مثل هذه التبعيات يسمى تحليل الارتباط. يدرس تحليل الارتباط قانون متوسط ​​سلوك كل كمية اعتمادا على قيم كمية أخرى، فضلا عن قياس هذا الاعتماد.

يبدأ تقييم ارتباط القيم بفرضية حول الطبيعة المحتملة للعلاقة بين قيمها. في أغلب الأحيان، يُفترض وجود علاقة خطية. وفي هذه الحالة، فإن مقياس الاعتماد على الارتباط هو قيمة تسمى معامل الارتباط. كما كان من قبل، لن نكتب الصيغ التي يتم حسابها بها؛ ليس من الصعب كتابتهم، ولكن من الأصعب بكثير فهم سبب كونهم على ما هم عليه. على في هذه المرحلةكل ما تحتاج إلى معرفته هو ما يلي:

· معامل الارتباط (يُشار إليه عادةً بالحرف اليوناني ρ) هو رقم يتراوح من -1 إلى +1؛

· إذا كان هذا الرقم قريبًا من حيث القيمة المطلقة من 1، فهناك ارتباط قوي، وإذا كان قريبًا من 0، فهو ضعيف؛

· القرب من ρ إلى +1 يعني أن الزيادة في مجموعة واحدة من القيم تتوافق مع زيادة في مجموعة أخرى، والقرب من -1 يعني العكس؛

· من السهل العثور على قيمة ρ باستخدام برنامج Excel (الوظائف الإحصائية المضمنة).

في Excel، تسمى وظيفة حساب معامل الارتباط CORREL وهي جزء من مجموعة الوظائف الإحصائية. سنوضح لك كيفية استخدامه. في نفس ورقة Excel حيث الجدول الموضح في الشكل. 1، تحتاج إلى وضع المؤشر على أي خلية حرة وتشغيل وظيفة CORREL. سوف يطلب نطاقين من القيم. سوف نشير إلى التكاليف والأداء. وبعد إدخالها سيتم عرض الإجابة: ρ = 0,. تشير هذه القيمة إلى مستوى متوسط ​​من الارتباط.

ليس من الصعب فهم العلاقة بين تكاليف تشغيل المدرسة والأداء الأكاديمي. يسعد التلاميذ بالذهاب إلى مدرسة نظيفة وجميلة ومريحة، وهناك يشعرون وكأنهم في المنزل وبالتالي يدرسون بشكل أفضل.

وفي المثال التالي، يتم إجراء دراسة لتحديد مدى اعتماد أداء طلاب المدارس الثانوية على عاملين: الثروة مكتبة المدرسةالكتب المدرسية وتوفير أجهزة الكمبيوتر المدرسية. يتم التعبير عن كلتا الخاصيتين كميًا كنسبة مئوية من القاعدة. الحكم القياسي للكتب المدرسية هو طقم كاملأي المبلغ الذي يُعطى فيه كل طالب من المكتبة جميع الكتب التي يحتاجها لدراسته. سنعتبر عدد أجهزة الكمبيوتر هو القاعدة بحيث يوجد جهاز كمبيوتر واحد لكل أربعة طلاب في المدرسة الثانوية. من المفترض أن الطلاب يستخدمون أجهزة الكمبيوتر ليس فقط في علوم الكمبيوتر، ولكن أيضًا في الدروس الأخرى، وكذلك خلال الساعات اللامنهجية.


في الجدول الموضح في الشكل. ويبين الجدول 3 نتائج قياس كلا العاملين في 11 مدرسة مختلفة. دعونا نتذكر أنه تتم دراسة تأثير كل عامل بشكل مستقل عن العوامل الأخرى (أي أن تأثير العوامل المهمة الأخرى يجب أن يكون هو نفسه تقريبًا).

تم الحصول على معاملات الارتباط الخطي لكلا التبعيات. وكما يتبين من الجدول، فإن الارتباط بين توفير الكتب المدرسية والأداء الأكاديمي أقوى من الارتباط بين دعم الكمبيوتر والأداء الأكاديمي (على الرغم من أن كلا معاملي الارتباط ليسا كبيرين للغاية). من هذا يمكننا أن نستنتج أن الكتاب لا يزال مصدرًا للمعرفة أكثر أهمية من الكمبيوتر.

باختصار عن الشيء الرئيسي

تسمى التبعيات بين الكميات، التي تخضع كل منها لتشتت لا يمكن السيطرة عليه تمامًا، بالارتباطات.

باستخدام تحليل الارتباط، يمكنك حل المشكلات التالية: تحديد ما إذا كان أحد العوامل له تأثير كبير على عامل آخر؛ اختر الأكثر أهمية من بين عدة عوامل.

المقياس الكمي للارتباط بين كميتين هو معامل الارتباط.

قيمة معامل الارتباط تقع بين -1 و +1. وكلما اقتربت قيمتها المطلقة من 1، كلما كان الارتباط (الاتصال) أقوى.

في MS Excel، لتحديد معامل الارتباط، يتم استخدام وظيفة CORREL من مجموعة الوظائف الإحصائية.

الأسئلة والمهام

1. ما هو الاعتماد على الارتباط؟

2. ما هو تحليل الارتباط؟

3. ما هي أنواع المشاكل التي يمكن حلها باستخدام تحليل الارتباط؟

4. ما هي قيمة المقياس الكمي للارتباط؟ ما هي القيم التي يمكن أن تتخذها؟

5. باستخدام أي معالج جداول بيانات يمكنك حساب معامل الارتباط؟

6. للحصول على البيانات من الجدول الموضح في الشكل. 3، بناء اثنين من الخطية تراجععارضات ازياء.

7. لنفس البيانات، احسب معامل الارتباط. قارن مع تلك الموضحة في الشكل. 3 نتائج.

ورشة عمل حاسوبية "حساب تبعيات الارتباط في MS Excel"

أهداف العمل: الحصول على فكرة عن العلاقة الارتباطية بين الكميات؛ إتقان طريقة حساب معامل الارتباط باستخدام دالة CORREL.

البرامج المستخدمة: معالج جداول البيانات MS Excel.

المهمة 1. يحتوي الجدول أدناه على بيانات عن القياسات المقترنة لكميتين تم إجراؤها في مدرسة معينة: درجة حرارة الهواء في الفصل x ونسبة الطلاب المصابين بنزلات البرد y:

الاعتماد إحصائي بطبيعته، لأنه من المستحيل القول بشكل موثوق، على سبيل المثال، أنه عند درجة حرارة 15 درجة مئوية في المدرسة، 5٪ من الطلاب يمرضون، وعند درجة حرارة 20 درجة مئوية - 2٪. بالإضافة إلى درجة الحرارة، هناك عوامل أخرى تؤثر على نزلات البرد، تختلف باختلاف المدارس، ومن المستحيل السيطرة عليها جميعها.

قم بما يلي:

Þ استخدم مخططًا مبعثرًا لعرض الاعتماد الجدولي بشكل مرئي؛

Þ أجب عن سؤال ما إذا كان من الممكن، بناءً على هذا المخطط المبعثر، افتراض وجود علاقة خطية بين الكميات؛

Þ إذا كانت الإجابة سلبية بشكل واضح، فقم بتصحيح الجدول بحيث تصبح فرضية الارتباط الخطي أكثر قبولا؛

Þ باستخدام الدالة CORREL، ابحث عن معامل الارتباط وتأكد أو دحض الفرضية المحددة.

المهمة 2. قم بإعداد جدول القياسات المقترنة لقيم بعض الكميات التي يوجد بينها ارتباط افتراضي. تحليل هذه العلاقة لوجود علاقة خطية.

تتضمن أمثلة الكميات ذات الصلة ذات الصلة ما يلي:

ü المستوى التعليمي (يقاس مثلاً بسنوات التعليم بشكل عام) ومستوى الدخل الشهري؛

ü المستوى التعليمي ومستوى الوظيفة (بالنسبة للأخيرة، ضع مقياسًا تقليديًا)؛

ü عدد أجهزة الكمبيوتر في المدرسة لكل طالب ومتوسط ​​الدرجة عند اختبار مستوى الكفاءة في التقنيات القياسية معالجة المعلومات ;

ü عدد الساعات التي يقضيها طالب الثانوية العامة في أداء الواجبات المنزلية ومتوسط ​​درجاته؛

ü كمية الأسمدة المطبقة على التربة وإنتاجية محصول زراعي معين.

في هذه الحالة، يمكنك الذهاب بطريقتين. الأول، والأكثر جدية ومفيدًا من الناحية العملية - لا تتوصل إلى علاقة افتراضية فحسب، بل تجد أيضًا بيانات فعلية عنها في الأدبيات. الطريقة الثانية، أسهل - أنت تعتبر هذه المهمة لعبة ضرورية لفهم ماهية الارتباط، وتطوير المهارات الفنية لتحليلها، والتوصل إلى البيانات المقابلة، ومحاولة القيام بذلك بالطريقة الأكثر قبولا.