الملخصات صياغات قصة

مثال على سلسلة تباين الفاصل الزمني الخامس

عند معالجة كميات كبيرة من المعلومات، وهو أمر مهم بشكل خاص عند تنفيذ التطورات العلمية الحديثة، يواجه الباحث مهمة خطيرة تتمثل في تجميع البيانات المصدر بشكل صحيح. إذا كانت البيانات منفصلة بطبيعتها، فلن تنشأ أي مشاكل، كما رأينا، - ما عليك سوى حساب تكرار كل ميزة. إذا كانت الصفة قيد الدراسة موجودة مستمرالطبيعة (وهي أكثر شيوعًا في الممارسة العملية)، فإن اختيار العدد الأمثل لفترات تجميع الميزات ليس مهمة تافهة بأي حال من الأحوال.

لتجميع المتغيرات العشوائية المستمرة، يتم تقسيم النطاق المتغير الكامل للخاصية إلى عدد معين من الفواصل الزمنية ل.

الفاصل الزمني المجمع (مستمر) سلسلة الاختلافتسمى الفواصل الزمنية مرتبة حسب قيمة السمة ()، حيث تتم الإشارة إلى أعداد الملاحظات التي تقع في الفاصل الزمني r، أو الترددات النسبية ()، مع الترددات المقابلة ():

فترات القيمة المميزة

تردد مي

شريط الرسم البيانيو تتراكم (ogiva) ،التي تمت مناقشتها بالفعل بالتفصيل من قبلنا، هي وسيلة ممتازة لتصور البيانات، مما يسمح لك بالحصول على فكرة أولية عن بنية البيانات. يتم إنشاء هذه الرسوم البيانية (الشكل 1.15) للبيانات المستمرة بنفس طريقة البيانات المنفصلة، ​​مع الأخذ في الاعتبار فقط حقيقة أن البيانات المستمرة تملأ المنطقة بالكامل بقيمها المحتملة، مع الأخذ في الاعتبار أي قيم.

أرز. 1.15.

لهذا يجب أن تلامس الأعمدة الموجودة في الرسم البياني والتراكمي بعضها البعض ولا تحتوي على مناطق لا تقع فيها قيم السمات ضمن كل ما هو ممكن(أي أن الرسم البياني والتراكمات لا ينبغي أن يكون لها "ثقوب" على طول محور الإحداثي السيني، والتي لا تحتوي على قيم المتغير قيد الدراسة، كما في الشكل 1.16). ويتوافق ارتفاع الشريط مع التردد - عدد الملاحظات التي تقع ضمن فترة زمنية معينة، أو التردد النسبي - نسبة الملاحظات. فترات يجب ألا تتقاطعوعادة ما تكون بنفس العرض.

أرز. 1.16.

الرسم البياني والمضلع عبارة عن تقديرات تقريبية لمنحنى كثافة الاحتمال (وظيفة تفاضلية) و (خ)التوزيع النظري، الذي تم النظر فيه في سياق نظرية الاحتمالات. لذلك، فإن بنائها مهم جدًا في المعالجة الإحصائية الأولية للبيانات الكمية المستمرة - من خلال مظهرها، يمكن الحكم على قانون التوزيع الافتراضي.

التراكم – منحنى الترددات المتراكمة (الترددات) للفاصل الزمني سلسلة الاختلاف. تتم مقارنة الرسم البياني لوظيفة التوزيع التراكمي مع التراكم و(خ)، تمت مناقشته أيضًا في دورة نظرية الاحتمالات.

في الأساس، يرتبط مفهوما الرسم البياني والتراكم بشكل خاص بالبيانات المستمرة وسلسلة تباين الفواصل الزمنية الخاصة بها، نظرًا لأن الرسوم البيانية الخاصة بها عبارة عن تقديرات تجريبية لوظيفة كثافة الاحتمال ووظيفة التوزيع، على التوالي.

يبدأ إنشاء سلسلة تباين الفاصل الزمني بتحديد عدد الفواصل الزمنية ك.ولعل هذه المهمة هي الأصعب والأهم والأكثر إثارة للجدل في القضية قيد الدراسة.

يجب ألا يكون عدد الفواصل الزمنية صغيرًا جدًا، لأن ذلك سيجعل الرسم البياني سلسًا للغاية ( مفرط)،يفقد جميع ميزات تباين البيانات الأصلية - في الشكل 1. 1.17 يمكنك أن ترى كيف أن نفس البيانات التي تعتمد عليها الرسوم البيانية في الشكل. 1.15، يستخدم لإنشاء رسم بياني بعدد أقل من الفواصل الزمنية (الرسم البياني الأيسر).

في الوقت نفسه، لا ينبغي أن يكون عدد الفواصل الزمنية كبيرًا جدًا - وإلا فلن نتمكن من تقدير كثافة توزيع البيانات المدروسة على طول المحور الرقمي: سيكون الرسم البياني أقل سلاسة (مخفف)،مع فترات فارغة، غير متساوية (انظر الشكل 1.17، الرسم البياني الأيمن).

أرز. 1.17.

كيفية تحديد العدد الأكثر تفضيلا من الفترات؟

في عام 1926، اقترح هربرت ستورجيس صيغة لحساب عدد الفواصل الزمنية التي من الضروري تقسيم مجموعة القيم الأصلية للخاصية قيد الدراسة. لقد أصبحت هذه الصيغة شائعة جدًا حقًا - حيث توفرها معظم الكتب المدرسية الإحصائية، وتستخدمها العديد من الحزم الإحصائية بشكل افتراضي. ما مدى مبرر ذلك وفي جميع الحالات هو سؤال خطير للغاية.

إذًا، على ماذا تعتمد صيغة ستورجيس؟

النظر في التوزيع ذي الحدين)