Abstraktlar Bəyanatlar Hekayə

İnterval variasiya seriyası nümunəsi. V

Müasir elmi inkişafları həyata keçirərkən xüsusilə vacib olan böyük həcmli məlumatların işlənməsi zamanı tədqiqatçının qarşısında mənbə məlumatlarını düzgün qruplaşdırmaq kimi ciddi vəzifə durur. Əgər məlumatlar diskret xarakter daşıyırsa, onda gördüyümüz kimi, heç bir problem yaranmır - sadəcə olaraq hər bir xüsusiyyətin tezliyini hesablamaq lazımdır. Tədqiq olunan xüsusiyyət varsa davamlı təbiət (praktikada daha çox yayılmışdır), onda xüsusiyyət qruplaşdırma intervallarının optimal sayını seçmək heç bir əhəmiyyət kəsb etmir.

Davamlı təsadüfi dəyişənləri qruplaşdırmaq üçün xarakteristikanın bütün variasiya diapazonu müəyyən sayda intervala bölünür. Kimə.

Qruplaşdırılmış interval (davamlı) variasiya seriyası atributunun () dəyəri ilə sıralanan intervallar adlanır, burada r"-ci intervala düşən müşahidələrin sayı və ya nisbi tezliklər (), müvafiq tezliklərlə () ilə birlikdə göstərilir:

Xarakterik dəyər intervalları

mi tezlik

bar diaqramıtoplamaq (ogiva), artıq bizim tərəfimizdən ətraflı şəkildə müzakirə edilmiş, məlumatların vizuallaşdırılması üçün əla vasitədir və məlumat strukturu haqqında ilkin təsəvvür əldə etməyə imkan verir. Belə qrafiklər (şəkil 1.15) fasiləsiz verilənlər üçün diskret verilənlər üçün olduğu kimi, yalnız fasiləsiz verilənlərin istənilən qiymətləri alaraq onun mümkün qiymətlərinin regionunu tamamilə doldurması nəzərə alınmaqla qurulur.

düyü. 1.15.

Buna görə də histoqramdakı sütunlar və kumulyasiya bir-birinə toxunmalı və atribut dəyərlərinin mümkün olan bütün sahələrə düşmədiyi sahələr olmamalıdır.(yəni histoqramma və kumulyasiyalarda Şəkil 1.16-da olduğu kimi tədqiq olunan dəyişənin dəyərlərini ehtiva etməyən absis oxu boyunca “deşiklər” olmamalıdır). Çubuğun hündürlüyü tezliyə - müəyyən bir intervala düşən müşahidələrin sayına və ya nisbi tezlikə - müşahidələrin nisbətinə uyğundur. Intervallar kəsişməməlidir və adətən eyni genişlikdədir.

düyü. 1.16.

Histoqram və çoxbucaqlı ehtimal sıxlığı əyrisinin təxminləridir (diferensial funksiya) f(x) ehtimal nəzəriyyəsi kursunda nəzərdən keçirilən nəzəri paylanma. Buna görə də, onların qurulması kəmiyyət davamlı məlumatların ilkin statistik emalı üçün çox vacibdir - onların görünüşü ilə hipotetik paylanma qanununu mühakimə etmək olar.

Kumulyat – intervalın yığılmış tezliklərinin (tezliklərinin) əyrisi variasiya seriyası. Kumulyativ paylanma funksiyasının qrafiki kumulyasiya ilə müqayisə edilir F(x), ehtimal nəzəriyyəsi kursunda da müzakirə olunur.

Əsasən, histoqramma və kumulyasiya anlayışları xüsusi olaraq davamlı verilənlər və onların interval dəyişmə seriyaları ilə əlaqələndirilir, çünki onların qrafikləri müvafiq olaraq ehtimal sıxlığı funksiyası və paylanma funksiyasının empirik təxminləridir.

İnterval variasiya seriyasının qurulması intervalların sayını təyin etməklə başlayır k. Və bu məsələ araşdırılan məsələdə bəlkə də ən çətin, vacib və mübahisəlidir.

Fasilələrin sayı çox kiçik olmamalıdır, çünki bu histoqramı çox hamar edəcək ( həddindən artıq hamarlanmış), orijinal məlumatların dəyişkənliyinin bütün xüsusiyyətlərini itirir - Şek. 1.17-də Şəkil 1-dəki qrafiklərin eyni məlumatların necə olduğunu görə bilərsiniz. 1.15, daha az intervalla histoqram qurmaq üçün istifadə olunur (soldakı qrafik).

Eyni zamanda, intervalların sayı çox böyük olmamalıdır - əks halda biz tədqiq olunan məlumatların ədədi ox boyunca paylanma sıxlığını qiymətləndirə bilməyəcəyik: histoqram az hamarlanacaq. (az hamarlanmış), boş intervallarla, qeyri-bərabər (bax. Şəkil 1.17, sağdakı qrafik).

düyü. 1.17.

Ən çox üstünlük verilən intervalların sayını necə təyin etmək olar?

Hələ 1926-cı ildə Herbert Sturges, tədqiq olunan xarakteristikanın orijinal dəyər dəstini bölmək lazım olan intervalların sayını hesablamaq üçün bir düstur təklif etdi. Bu düstur həqiqətən də son dərəcə populyarlaşdı - əksər statistik dərsliklər bunu təklif edir və bir çox statistik paketlər ondan standart olaraq istifadə edir. Bunun nə dərəcədə əsaslı olduğu və bütün hallarda çox ciddi sualdır.

Beləliklə, Sturges düsturu nəyə əsaslanır?

binom paylanmasına nəzər salın)