Хураангуй Мэдэгдэл Өгүүллэг

Интервал вариацын цувралын жишээ. В

Орчин үеийн шинжлэх ухааны хөгжлийг хэрэгжүүлэхэд онцгой ач холбогдолтой их хэмжээний мэдээллийг боловсруулахдаа судлаач эх сурвалжийг зөв бүлэглэх ноцтой ажилтай тулгардаг. Хэрэв өгөгдөл нь салангид шинж чанартай бол бидний харж байгаагаар ямар ч асуудал гарахгүй - та функц бүрийн давтамжийг тооцоолох хэрэгтэй. Хэрэв судалж буй шинж чанар нь байвал Үргэлжилсэншинж чанар (энэ нь практикт илүү түгээмэл байдаг), дараа нь функцийг бүлэглэх интервалын оновчтой тоог сонгох нь тийм ч энгийн ажил биш юм.

Тасралтгүй санамсаргүй хэмжигдэхүүнүүдийг бүлэглэхийн тулд шинж чанарын бүх вариацын хүрээг тодорхой тооны интервалд хуваана. руу.

Бүлэглэсэн интервал (Үргэлжилсэн) вариацын цуврал r"-р интервалд орсон ажиглалтын тоо эсвэл харьцангуй давтамж () -ийг харгалзах давтамжийн () -ийн хамт тэмдэглэсэн атрибутын () утгаар эрэмблэгдсэн интервалууд гэж нэрлэдэг.

Онцлог утгын интервалууд

ми давтамж

баганат графикТэгээд хуримтлагдах (огива),Бидний аль хэдийн нарийвчлан хэлэлцсэн эдгээр нь өгөгдлийн бүтцийн талаар анхан шатны ойлголт авах боломжийг олгодог өгөгдлийг дүрслэх маш сайн хэрэгсэл юм. Ийм графикуудыг (Зураг 1.15) тасралтгүй өгөгдөлд зориулж салангид өгөгдлийн нэгэн адил бүтээдэг бөгөөд зөвхөн тасралтгүй өгөгдөл нь боломжит утгуудын мужийг бүрэн дүүргэж, ямар ч утгыг авч байгааг харгалзан үздэг.

Цагаан будаа. 1.15.

Тийм ч учраас гистограм дээрх баганууд ба хуримтлал нь бие биедээ хүрч, атрибутын утгууд нь боломжит бүх хэсэгт багтахгүй байх ёстой.(жишээ нь, гистограмм болон хуримтлал нь 1.16-р зурагт үзүүлсэн шиг судлагдсан хувьсагчийн утгыг агуулаагүй абсцисса тэнхлэгийн дагуу "нүх" байх ёсгүй). Баарны өндөр нь давтамжтай тохирч байна - өгөгдсөн интервал доторх ажиглалтын тоо, эсвэл харьцангуй давтамж - ажиглалтын эзлэх хувь. Интервалууд огтлолцох ёсгүйихэвчлэн ижил өргөнтэй байдаг.

Цагаан будаа. 1.16.

Гистограм ба олон өнцөгт нь магадлалын нягтын муруй (дифференциал функц) f(x)магадлалын онолын хүрээнд авч үзсэн онолын тархалт. Тиймээс тэдгээрийн бүтэц нь тоон тасралтгүй өгөгдлийн анхан шатны статистик боловсруулалтад маш чухал байдаг - тэдгээрийн гадаад төрхөөр нь таамаглалын тархалтын хуулийг шүүж болно.

Хуримтлал – интервалын хуримтлагдсан давтамжийн (давтамж) муруй вариацын цуврал. Хуримтлагдсан тархалтын функцийн графикийг хуримтлалтай харьцуулна F(x), мөн магадлалын онолын хичээлээр хэлэлцсэн.

Үндсэндээ гистограмм ба хуримтлал гэсэн ойлголтууд нь тасралтгүй өгөгдөл, тэдгээрийн интервалын хэлбэлзлийн цувралтай холбоотой байдаг, учир нь тэдгээрийн графикууд нь магадлалын нягтын функц ба тархалтын функцийн эмпирик тооцоолол юм.

Интервалын вариацын цувралыг бүтээх нь интервалын тоог тодорхойлохоос эхэлдэг к.Энэ даалгавар нь судалж буй асуудлын хамгийн хэцүү, чухал, маргаантай байж магадгүй юм.

Интервалын тоо хэт бага байж болохгүй, учир нь энэ нь гистограмыг хэт жигд болгоно ( хэт гөлгөр),анхны өгөгдлийн хувьсах бүх шинж чанараа алддаг - Зураг дээр. 1.17. Зураг дээрх графиктай ижил өгөгдөл хэрхэн байгааг харж болно. 1.15, цөөн тооны интервалтай гистограммыг бүтээхэд ашигладаг (зүүн график).

Үүний зэрэгцээ интервалын тоо хэт том байх ёсгүй - эс тэгвээс бид тоон тэнхлэгийн дагуу судлагдсан өгөгдлийн тархалтын нягтыг тооцоолох боломжгүй болно: гистограмм нь дутуу гөлгөр болно. (дутуу гөлгөр),хоосон зайтай, тэгш бус (Зураг 1.17, баруун талын графикийг үз).

Цагаан будаа. 1.17.

Хамгийн тохиромжтой интервалын тоог хэрхэн тодорхойлох вэ?

1926 онд Герберт Стергес судалж буй шинж чанарын анхны багц утгыг хуваах шаардлагатай интервалын тоог тооцоолох томъёог санал болгосон. Энэ томьёо үнэхээр их алдартай болсон - ихэнх статистикийн сурах бичгүүд үүнийг санал болгодог бөгөөд олон статистикийн багцууд үүнийг анхдагч байдлаар ашигладаг. Энэ нь хэр үндэслэлтэй, бүх тохиолдолд маш ноцтой асуулт юм.

Тэгэхээр Стержсийн томъёо юунд үндэслэсэн бэ?

бином тархалтыг авч үзье)