Аннотациялар Мәлімдеме Оқиға

Статистикадағы вариациялық қатар дегеніміз не. Қатарларды бөлу және топтастыру

Вариациялықсандық негізде құрылған таралу қатарлары деп аталады. Популяцияның жеке бірліктеріндегі сандық сипаттамалардың мәндері тұрақты емес және бір-бірінен азды-көпті ерекшеленеді.

Вариация- популяция бірліктері арасындағы сипаттама мәнінің ауытқуы, өзгермелілігі. Бөлек сандық мәндерзерттелетін популяцияда табылған белгілер деп аталады опцияларқұндылықтар. Популяцияны толық сипаттау үшін орташа мәннің жеткіліксіздігі бізді орташа мәндерді зерттелетін сипаттаманың өзгергіштігін (вариациясын) өлшеу арқылы осы орташа мәндердің типтілігін бағалауға мүмкіндік беретін көрсеткіштермен толықтыруға мәжбүр етеді.

Вариацияның болуы қасиет деңгейінің қалыптасуына көптеген факторлардың әсерінен болады. Бұл факторлар бірдей емес күшпен және әртүрлі бағытта әрекет етеді. Вариациялық индекстер белгілердің өзгергіштігінің өлшемін сипаттау үшін қолданылады.

Вариацияны статистикалық зерттеудің міндеттері:

  • 1) популяцияның жеке бірліктеріндегі белгілердің өзгеру сипаты мен дәрежесін зерттеу;
  • 2) популяцияның белгілі бір белгілерінің өзгеруіндегі жеке факторлардың немесе олардың топтарының рөлін анықтау.

Статистикада қолданылады арнайы әдістеркөрсеткіштер жүйесін пайдалану негізінде вариацияны зерттеу, біргевариация немен өлшенеді.

Вариацияны зерттеу маңызды. Вариацияларды өлшеу іріктемелерді бақылау, корреляциялық және дисперсиялық талдау және т.б. жүргізу кезінде қажет. Ермолаев О.Ю. Математикалық статистикапсихологтарға арналған: Оқу құралы [Мәтін]/ О.Ю. Ермолаев. - М.: Мәскеу психологиялық-әлеуметтік институтының Флинт баспасы, 2012. - 335 б.

Вариация дәрежесі бойынша популяцияның біртектілігін, сипаттамалардың жеке мәндерінің тұрақтылығын және орташа мәннің типтілігін бағалауға болады. Олардың негізінде сипаттамалар мен іріктемелік бақылаудың дұрыстығын бағалау көрсеткіштерінің арасындағы жақындықтың көрсеткіштері әзірленеді.

Кеңістіктегі вариация мен уақыттың вариациясы арасындағы айырмашылық бар.

Кеңістіктегі вариация жеке аумақтарды білдіретін халық бірліктері арасындағы атрибут мәндерінің ауытқуы ретінде түсініледі. Уақыттың өзгеруі әр түрлі уақыт кезеңіндегі сипаттама мәндерінің өзгеруін білдіреді.

Тарату жолдарының вариациясын зерттеу үшін атрибут мәндерінің барлық нұсқалары өсу немесе кему ретімен орналасады. Бұл процесс серияларды бағалау деп аталады.

Вариацияның ең қарапайым белгілері минимум және максимум- ең аз және ең жоғары мәнжиынтықтағы белгілер. Мүмкіндік мәндерінің жеке нұсқаларының қайталану саны қайталану жиілігі (fi) деп аталады. Жиіліктерді жиіліктермен ауыстыру ыңғайлы - wi. Жиілік - жиіліктің салыстырмалы көрсеткіші, ол бірлік немесе пайыздық үлестермен көрсетілуі мүмкін және әртүрлі бақылау сандарымен вариациялық қатарларды салыстыруға мүмкіндік береді. Формула арқылы өрнектеледі:

мұндағы Xmax, Xmin - жиынтықтағы сипаттаманың ең үлкен және ең аз мәндері; n – топтардың саны.

Сипаттаманың вариациясын өлшеу үшін әртүрлі абсолютті және салыстырмалы көрсеткіштер қолданылады. Вариацияның абсолютті көрсеткіштеріне вариация диапазоны, орташа сызықтық ауытқу, дисперсия және стандартты ауытқу жатады. Тербелістің салыстырмалы көрсеткіштеріне тербеліс коэффициенті, салыстырмалы сызықтық ауытқу және вариация коэффициенті жатады.

Мысал табу вариациялық қатар

Жаттығу.Бұл үлгі үшін:

  • а) Вариациялық қатарды табыңыз;
  • б) Тарату функциясын құру;

№=42. Үлгі элементтері:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Шешім.

  • а) реттелген вариациялық қатарды құру:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • б) дискретті вариациялық қатарды құру.

Стерджесс формуласы арқылы вариациялық қатардағы топтардың санын есептейік:

7-ге тең топтардың санын алайық.

Топтардың санын біле отырып, интервал өлшемін есептейміз:

Кестені құруға ыңғайлы болу үшін біз 8-ге тең топтар санын аламыз, интервал 1 болады.

Күріш. 1 Дүкеннің белгілі бір уақыт аралығындағы тауарды өткізу көлемі

Осы тарауды меңгеру нәтижесінде студент: білу

  • вариация көрсеткіштері және олардың өзара байланысы;
  • сипаттамалардың таралуының негізгі заңдылықтарын;
  • келісім критерийлерінің мәні; білу
  • вариация көрсеткіштерін және сәйкестік критерийлерін есептеу;
  • таралу сипаттамаларын анықтау;
  • статистикалық таралу қатарларының негізгі сандық сипаттамаларын бағалау;

меншік

  • таралу қатарларын статистикалық талдау әдістері;
  • дисперсияны талдау негіздері;
  • статистикалық таралу қатарларының таралудың негізгі заңдарына сәйкестігін тексеру әдістері.

Вариация көрсеткіштері

Әртүрлі статистикалық популяциялардың сипаттамаларын статистикалық зерттеуде халықтың жеке статистикалық бірліктерінің сипаттамасының вариациясын, сондай-ақ осы сипаттамаға сәйкес бірліктердің таралу сипатын зерттеу үлкен қызығушылық тудырады. Вариация -бұл зерттелетін популяция бірліктері арасындағы сипаттаманың жеке мәндеріндегі айырмашылықтар. Вариацияны зерттеудің практикалық маңызы зор. Вариация дәрежесі бойынша сипаттаманың өзгеру шегін, берілген сипаттама бойынша популяцияның біртектілігін, орташа мәннің типтілігін және вариацияны анықтайтын факторлардың байланысын бағалауға болады. Вариациялық көрсеткіштер статистикалық популяцияларды сипаттау және ұйымдастыру үшін қолданылады.

Статистикалық таралу қатары түрінде ұсынылған статистикалық бақылау материалдарын жинақтау және топтастыру нәтижелері топтастыру (өзгермелі) критерийлер бойынша топтарға зерттелетін халық бірліктерінің реттелген бөлінуін білдіреді. Топтастырудың негізі ретінде сапалық сипаттама алынса, онда мұндай таралу қатары деп аталады атрибутивті(мамандығы, жынысы, түсі және т.б. бойынша бөлу). Егер таралу қатары сандық негізде құрылса, онда мұндай қатар деп аталады вариациялық(бойы, салмағы, жалақысы және т.б. бойынша бөлу). Вариациялық қатарды құру дегеніміз, сипаттамалық мәндер бойынша популяция бірліктерінің сандық таралуын ұйымдастыру, осы мәндермен (жиілік) популяция бірліктерінің санын санау және нәтижелерді кестеде орналастыру.

Нұсқаның жиілігінің орнына оның бақылаулардың жалпы көлеміне қатынасын қолдануға болады, оны жиілік (салыстырмалы жиілік) деп атайды.

Вариациялық қатардың екі түрі бар: дискретті және интервал. Дискретті қатар- Бұл вариациялық қатар, оның құрылысы үзіліссіз өзгеретін сипаттамаларға негізделген (дискретті сипаттамалар). Соңғысына кәсіпорындағы жұмысшылар саны, тарифтік разряд, отбасындағы бала саны және т.б. Дискретті вариациялық қатар екі бағаннан тұратын кестені білдіреді. Бірінші баған төлсипаттың нақты мәнін көрсетеді, ал екінші баған төлсипаттың белгілі бір мәні бар жиынтықтағы бірліктердің санын көрсетеді. Егер сипаттама үздіксіз өзгеріске ие болса (белгілі бір шектерде кез келген мәндерді қабылдай алатын кіріс мөлшері, қызмет өтілі, кәсіпорынның негізгі қорларының құны және т.б.), онда бұл сипаттама үшін құруға болады. интервалдық вариациялық қатар.Интервалдық вариациялық қатарды құру кезінде кестеде де екі баған болады. Біріншісі «-ден -ге дейін» (опциялар) аралығындағы атрибуттың мәнін көрсетеді, екіншісі интервалға (жиілік) енгізілген бірліктердің санын көрсетеді. Жиілік (қайталану жиілігі) – атрибут мәндерінің белгілі бір вариантының қайталану саны. Интервалдар жабық немесе ашық болуы мүмкін. Жабық интервалдар екі жағынан да шектелген, яғни. төменгі («нен») және жоғарғы («қаға») шекарасы бар. Ашық интервалдардың бір шекарасы бар: жоғарғы немесе төменгі. Егер опциялар өсу немесе кему ретімен орналасса, онда жолдар шақырылады дәрежелі.

Вариациялық қатарлар үшін жиілікке жауап беру опцияларының екі түрі бар: жинақталған жиілік және жинақталған жиілік. Жинақталған жиілік сипаттама мәні берілген мәннен аз мәндерді қабылдаған қанша бақылауды көрсетеді. Жинақталған жиілік алдыңғы топтардың барлық жиіліктерімен берілген топ үшін сипаттаманың жиілік мәндерін қосу арқылы анықталады. Жинақталған жиілік атрибут мәндері берілген топтың жоғарғы шегінен аспайтын бақылау бірліктерінің үлесін сипаттайды. Осылайша, жинақталған жиілік жиынтықтағы берілген мәннен аспайтын мәнге ие опциялардың үлесін көрсетеді. Жиілік, жиілік, абсолютті және салыстырмалы тығыздықтар, жинақталған жиілік пен жиілік нұсқа шамасының сипаттамалары болып табылады.

Популяцияның статистикалық бірліктерінің сипаттамаларының вариациялары, сондай-ақ таралу сипаты қатардың орташа деңгейін, орташа сызықтық ауытқуды, стандартты ауытқуды, дисперсияны қамтитын вариациялық қатардың көрсеткіштері мен сипаттамаларын пайдалана отырып зерттеледі. , тербеліс коэффициенттері, вариация, ассиметрия, куртоз және т.б.

Орташа мәндер тарату орталығын сипаттау үшін қолданылады. Орташа мән – зерттелетін популяция мүшелеріне тән сипаттаманың типтік деңгейі сандық сипатталатын жалпылама статистикалық сипаттама. Дегенмен, арифметикалық құралдардың әртүрлі таралу заңдылықтарымен сәйкес келуі жағдайлары болуы мүмкін, сондықтан вариациялық қатарлардың статистикалық сипаттамалары ретінде құрылымдық құралдар деп аталатындар есептеледі - мода, медиана, сондай-ақ таралу қатарын теңге бөлетін квантилдер. бөліктер (квартил, дециль, процентиль, т.б.).

Сән -Бұл таралу қатарында оның басқа мәндеріне қарағанда жиі кездесетін сипаттаманың мәні. Дискретті қатарлар үшін бұл ең жиілігі бар опция. Интервалдық вариациялық қатарда режимді анықтау үшін ең алдымен модальды интервал деп аталатын оның орналасқан интервалын анықтау керек. Бірдей интервалдары бар вариациялық қатарда модальды интервал ең жоғары жиілікпен, тең емес аралықтары бар қатарда – бірақ ең жоғары таралу тығыздығымен анықталады. Содан кейін формула тең аралықтағы жолдардағы режимді анықтау үшін қолданылады

мұндағы Mo - сән құндылығы; xMo – модальды интервалдың төменгі шегі; h-модальды интервал ені; / Mo – модальды интервалдың жиілігі; / Mo j – премодальды интервалдың жиілігі; / Mo+1 – постмодальдық интервалдың жиілігі, ал осы есептеу формуласындағы интервалдары тең емес қатар үшін / Mo, / Mo, / Mo жиіліктерінің орнына таралу тығыздықтарын пайдалану керек. Ақыл 0 _| , Ақыл 0> UMO+"

Егер жалғыз режим болса, онда ықтималдық үлестірімі кездейсоқ шамабірмодальды деп аталады; бірнеше режим болса, ол мультимодальды (полимодальды, мультимодальды), екі режим болған жағдайда - бимодальды деп аталады. Әдетте, мультимодальдылық зерттелетін бөлу заңға бағынбайтынын көрсетеді қалыпты таралу. Біртекті популяциялар, әдетте, бір төбелік таралумен сипатталады. Мультивертекс сонымен қатар зерттелетін популяцияның гетерогенділігін көрсетеді. Екі немесе одан да көп шыңдардың пайда болуы біртекті топтарды анықтау үшін деректерді қайта топтауды қажет етеді.

Интервалдық вариация қатарында режимді гистограмма арқылы графикалық түрде анықтауға болады. Ол үшін гистограмманың ең жоғарғы бағанының жоғарғы нүктелерінен екі көршілес бағанның жоғарғы нүктелеріне дейін қиылысатын екі сызық сызыңыз. Содан кейін олардың қиылысу нүктесінен абсцисса осіне перпендикуляр түсіріледі. Перпендикулярға сәйкес x осіндегі мүмкіндіктің мәні режим болып табылады. Көп жағдайда жалпыланған көрсеткіш ретінде популяцияны сипаттағанда орташа арифметикалық мәнге емес, режимге артықшылық беріледі.

Медиана -Бұл атрибуттың орталық мәні; ол таралудың реттелген қатарының орталық мүшесіне ие. Дискретті қатарда медиананың мәнін табу үшін алдымен оның реттік нөмірі анықталады. Ол үшін бірлік саны тақ болса, барлық жиіліктердің қосындысына бір қосылып, сан екіге бөлінеді. Егер қатарда бірліктердің жұп саны болса, екі медиана бірлігі болады, сондықтан бұл жағдайда медиана екі медиана бірлігінің мәндерінің орташа мәні ретінде анықталады. Осылайша, дискретті вариациялық қатардағы медиана қатарды опциялардың бірдей санын қамтитын екі бөлікке бөлетін мән болып табылады.

Интервалдық қатарда медиананың реттік нөмірін анықтағаннан кейін жинақталған жиіліктерді (жиіліктерді) пайдалана отырып, медианалық интервал табылады, содан кейін медиананы есептеу формуласы арқылы медиананың өзі анықталады:

мұндағы Me – медианалық мән; x Мен -медианалық интервалдың төменгі шегі; h-медианалық интервалдың ені; - таралу қатарларының жиіліктерінің қосындысы; /D – медианаға дейінгі интервалдың жинақталған жиілігі; / Me – медианалық интервал жиілігі.

Медианды кумулят арқылы графикалық түрде табуға болады. Ол үшін жинақталған жиіліктердің (жиіліктердің) шкаласында сәйкес нүктеден жинақталады. сериялық нөмірмедиана, абсцисса осіне параллель түзу кумулятпен қиылысқанша жүргізілген. Әрі қарай, көрсетілген сызықтың кумулятпен қиылысу нүктесінен абсцисса осіне перпендикуляр түсіріледі. Салынған ординатаға (перпендикуляр) сәйкес х осіндегі атрибуттың мәні медиана болып табылады.

Медиана келесі қасиеттермен сипатталады.

  • 1. Ол оның екі жағында орналасқан атрибут мәндеріне тәуелді емес.
  • 2. Ол минималдылық қасиетіне ие, бұл атрибут мәндерінің медианадан абсолютті ауытқуларының қосындысы атрибут мәндерінің кез келген басқа мәннен ауытқуымен салыстырғанда ең төменгі мәнді білдіретінін білдіреді.
  • 3. Екі таралуды белгілі медианалармен біріктіру кезінде жаңа таралу медианасының мәнін алдын ала болжау мүмкін емес.

Медиананың бұл қасиеттері халыққа қызмет көрсету пункттерінің – мектептердің, емханалардың, жанар-жағармай құю станцияларының, су сорғыштарының және т.б. орналастыру орындарын жобалау кезінде кеңінен қолданылады. Мәселен, қаланың белгілі бір блогында емхана салу жоспарланса, оны блоктың ұзындығын емес, тұрғындардың санын екі есеге азайтатын пунктке орналастырған дұрыс болар еді.

Моданың, медиананың және орташа арифметикалық шаманың қатынасы жиынтықтағы сипаттаманың таралу сипатын көрсетеді және таралу симметриясын бағалауға мүмкіндік береді. Егер x Me онда қатардың оң жақты асимметриясы бар. Қалыпты таралумен X -Мен - Мо.

К.Пирсон қисықтардың әртүрлі типтерін теңестіруге сүйене отырып, орташа асимметриялық таралулар үшін арифметикалық орта, медиана және мода арасындағы келесі жуық жуық қатынастар жарамды екенін анықтады:

мұндағы Me – медианалық мән; Мо - сәннің мағынасы; x arifm – орташа арифметикалық шаманың мәні.

Егер вариациялық қатардың құрылымын толығырақ зерделеу қажет болса, онда медианаға ұқсас сипаттамалық мәндерді есептеңіз. Мұндай сипаттамалық мәндер барлық таралу бірліктерін тең сандарға бөледі, олар квантил немесе градиент деп аталады. Квантильдер квартилге, децильге, процентильге және т.б.

Квартилдер халықты тең төрт бөлікке бөледі. Бірінші квартиль бірінші тоқсандық интервалды алдын ала анықтай отырып, бірінші квартилді есептеу формуласы арқылы медианаға ұқсас есептеледі:

мұндағы Qi – бірінші квартилдің мәні; xQ^-бірінші квартиль диапазонының төменгі шегі; h- бірінші тоқсандық интервалдың ені; /, - интервалдық қатардың жиіліктері;

Бірінші квартильдік интервалдың алдындағы аралықтағы жиынтық жиілік; Jq ( - бірінші квартильдік интервалдың жиілігі.

Бірінші квартиль популяция бірліктерінің 25% оның мәнінен аз, ал 75% көп екенін көрсетеді. Екінші квартиль медианаға тең, яғни. Q 2 =Мен.

Аналогия бойынша, бірінші тоқсандық интервалды тауып, үшінші квартиль есептеледі:

мұндағы үшінші квартиль диапазонының төменгі шегі; h- үшінші квартиль интервалының ені; /, - интервалдық қатардың жиіліктері; /X" -алдындағы аралықта жинақталған жиілік

Г

үшінші квартиль аралығы; Jq – үшінші квартил интервалының жиілігі.

Үшінші квартиль популяция бірліктерінің 75% оның мәнінен аз, ал 25% көп екенін көрсетеді.

Үшінші және бірінші квартилдер арасындағы айырмашылық квартиларалық диапазон болып табылады:

мұндағы Aq – квартильаралық диапазонның мәні; Q 3 -үшінші квартиль құны; Q, бірінші квартилдің мәні.

Децильдер популяцияны 10 тең бөлікке бөледі. Ондық – таралу қатарындағы сипаттаманың бас санының оннан бір бөлігіне сәйкес келетін мәні. Квартилдерге ұқсастық бойынша бірінші ондық популяция бірлігінің 10% оның мәнінен аз, ал 90% артық екенін көрсетеді, ал тоғызыншы дециль популяция бірліктерінің 90% оның мәнінен аз екенін көрсетеді, ал 10% үлкенірек. Тоғызыншы және бірінші ондықтардың қатынасы, яғни. Децильдік коэффициент табыстардың дифференциациясын зерттеуде ең ауқатты 10% және ең аз ауқатты халықтың 10% табыс деңгейлерінің арақатынасын өлшеу үшін кеңінен қолданылады. Процентильдер рейтингтегі халықты 100 тең бөлікке бөледі. Процентильдердің есептелуі, мағынасы және қолданылуы децильдерге ұқсас.

Квартилдерді, децильдерді және басқа құрылымдық сипаттамаларды кумуляттарды пайдалана отырып, медианаға ұқсастық арқылы графикалық түрде анықтауға болады.

Вариация өлшемін өлшеу үшін келесі көрсеткіштер қолданылады: вариация диапазоны, орташа сызықтық ауытқу, стандартты ауытқу, дисперсия. Вариация диапазонының шамасы толығымен қатардың шеткі мүшелерінің таралуының кездейсоқтығына байланысты. Бұл көрсеткіш сипаттама мәндеріндегі ауытқу амплитудасы қандай екенін білу маңызды болған жағдайларда қызығушылық тудырады:

Қайда R-вариация диапазонының мәні; x max – атрибуттың максималды мәні; x тт -атрибуттың ең төменгі мәні.

Вариация диапазонын есептеу кезінде қатар мүшелерінің басым көпшілігінің мәні есепке алынбайды, бұл ретте вариация қатар мүшесінің әрбір мәнімен байланысты. Сипаттаманың жеке мәндерінің олардың орташа мәнінен ауытқуынан алынған орташа мәндер болып табылатын көрсеткіштерде бұл кемшілік жоқ: орташа сызықтық ауытқу және стандартты ауытқу. Орташа мәннен жеке ауытқулар мен белгілі бір белгінің өзгергіштігі арасында тікелей байланыс бар. Флуктуация неғұрлым күшті болса, орташадан ауытқулардың абсолютті мөлшері соғұрлым үлкен болады.

Орташа сызықтық ауытқу – жеке нұсқалардың орташа мәнінен ауытқуларының абсолютті мәндерінің орташа арифметикалық мәні.

Топталмаған деректер үшін орташа сызықтық ауытқу

мұндағы /pr – орташа сызықтық ауытқудың мәні; x, - атрибуттың мәні; X - P -популяциядағы бірлік саны.

Топтастырылған қатардың орташа сызықтық ауытқуы

мұндағы / vz - орташа сызықтық ауытқудың мәні; x, атрибуттың мәні; X -зерттелетін популяция үшін сипаттаманың орташа мәні; / - жеке топтағы халық бірліктерінің саны.

Бұл жағдайда ауытқулардың белгілері еленбейді, әйтпесе барлық ауытқулардың қосындысы нөлге тең болады. Талданатын мәліметтерді топтастыруға байланысты орташа сызықтық ауытқу әртүрлі формулалар арқылы есептеледі: топтастырылған және топталмаған деректер үшін. Орташа сызықтық ауытқу өзінің шарттылығына байланысты басқа вариация көрсеткіштерінен бөлек тәжірибеде салыстырмалы түрде сирек қолданылады (атап айтқанда, жеткізудің біркелкілігі бойынша шарттық міндеттемелердің орындалуын сипаттау үшін; айналымды талдауда сыртқы сауда, жұмысшылардың құрамы, өндіріс ырғағы, өндірістің технологиялық ерекшеліктерін ескере отырып өнім сапасы және т.б.).

Стандартты ауытқу зерттелетін сипаттаманың жеке мәндерінің жалпы санының орташа мәнінен орташа қанша ауытқуын сипаттайды және зерттелетін сипаттаманың өлшем бірліктерімен көрсетіледі. Стандартты ауытқу вариацияның негізгі өлшемдерінің бірі бола отырып, біртекті популяциядағы сипаттаманың өзгеру шегін бағалауда, қалыпты таралу қисығының ордината мәндерін анықтауда, сондай-ақ байланысты есептеулерде кеңінен қолданылады. іріктемелік бақылауды ұйымдастыру және таңдама сипаттамаларының дәлдігін белгілеу. Топталмаған деректердің стандартты ауытқуы келесі алгоритмді қолдану арқылы есептеледі: орташа мәннен әрбір ауытқу квадрат болып табылады, барлық квадраттар жинақталады, содан кейін квадраттар қосындысы қатардың мүшелерінің санына бөлінеді және квадрат түбірден алынады. үлес:

мұндағы a Iip – стандартты ауытқудың мәні; Xj-атрибут мәні; X- зерттелетін популяция үшін сипаттаманың орташа мәні; P -популяциядағы бірлік саны.

Топтастырылған талданатын деректер үшін деректердің стандартты ауытқуы өлшенген формула арқылы есептеледі

Қайда - стандартты ауытқу мәні; Xj-атрибут мәні; X -зерттелетін популяция үшін сипаттаманың орташа мәні; f x -белгілі бір топтағы халық бірліктерінің саны.

Екі жағдайда да түбір астындағы өрнек дисперсия деп аталады. Осылайша, дисперсия атрибут мәндерінің орташа мәнінен ауытқуының орташа квадраты ретінде есептеледі. Салмақсыз (қарапайым) атрибут мәндері үшін дисперсия келесі түрде анықталады:

Салмақталған сипаттамалық мәндер үшін

Сондай-ақ дисперсияны есептеудің арнайы жеңілдетілген әдісі бар: жалпы

өлшенбеген (қарапайым) сипаттамалық мәндер үшін салмақты сипаттамалық мәндер үшін
нөлге негізделген әдісті қолдану

мұндағы a 2 – дисперсия мәні; x, - атрибуттың мәні; X -сипаттаманың орташа мәні, h-топ интервалының мәні, t 1 -салмағы (A =

Дисперсияның статистикада өзіндік көрінісі бар және вариацияның маңызды көрсеткіштерінің бірі болып табылады. Ол зерттелетін сипаттаманың өлшем бірліктерінің квадратына сәйкес бірліктермен өлшенеді.

Дисперсия келесі қасиеттерге ие.

  • 1. Дисперсия тұрақты мәннөлге тең.
  • 2. Сипаттаманың барлық мәндерін бірдей А мәніне азайту дисперсия мәнін өзгертпейді. Бұл ауытқулардың орташа квадратын сипаттаманың берілген мәндерінен емес, олардың қандай да бір тұрақты саннан ауытқуларынан есептеуге болатынын білдіреді.
  • 3. Кез келген сипаттамалық мәндерді азайту кесе дисперсияны азайтады к 2 есе, ал стандартты ауытқу в крет, яғни. атрибуттың барлық мәндерін қандай да бір тұрақты санға бөлуге болады (мысалы, сериялар аралығының мәні бойынша), стандартты ауытқуды есептеуге болады, содан кейін тұрақты санға көбейтіледі.
  • 4. Кез келген мәннен ауытқудың орташа квадратын есептесек Жәнеорташа арифметикалық мәннен бір немесе басқа дәрежеде ерекшеленетін болса, онда ол әрқашан орташа арифметикалық мәннен есептелген ауытқулардың орташа квадратынан үлкен болады. Ауытқулардың орташа квадраты өте белгілі бір шамаға - орташа және осы шартты түрде қабылданған мән арасындағы айырмашылықтың квадратына көбірек болады.

Альтернативті сипаттаманың вариациясы зерттелетін мүліктің бас бірлікте болуы немесе болмауынан тұрады. Сандық түрде альтернативті атрибуттың вариациясы екі мәнмен өрнектеледі: зерттелетін қасиет бірлігінің болуы бір (1) арқылы, ал оның жоқтығы нөлмен (0) белгіленеді. Зерттелетін қасиетке ие бірліктердің үлесі P арқылы, ал бұл қасиеті жоқ бірліктердің үлесі келесі арқылы белгіленеді. Г.Осылайша, альтернативті атрибуттың дисперсиясы осы қасиетке ие бірліктердің үлесінің (P) осы қасиетке ие емес бірліктердің үлесіне көбейтіндісіне тең. (G).Популяцияның ең үлкен вариациясына халықтың жалпы көлемінің 50%-ын құрайтын халықтың бір бөлігі сипаттамаға ие болса, ал халықтың 50%-ға тең басқа бөлігінде бұл белгі болмаған жағдайда қол жеткізіледі. және дисперсия 0,25 максималды мәнге жетеді, t .e. P = 0,5, G= 1 - P = 1 - 0,5 = 0,5 және o 2 = 0,5 0,5 = 0,25. Бұл көрсеткіштің төменгі шегі нөлге тең, ол жиынтықта вариация болмайтын жағдайға сәйкес келеді. Практикалық қолдануальтернативті сипаттаманың дисперсиясы таңдамалы бақылау жүргізу кезінде сенімділік интервалдарын құрудан тұрады.

Дисперсия және стандартты ауытқу неғұрлым аз болса, популяция соғұрлым біртекті және орташа көрсеткіш соғұрлым типтік болады. Статистика тәжірибесінде әртүрлі сипаттамалардың вариацияларын салыстыру қажеттілігі жиі туындайды. Мысалы, жұмысшылардың жасы мен олардың біліктілігінің, еңбек өтілі мен жалақысының, өзіндік құн мен пайданың, еңбек өтілі мен еңбек өнімділігінің т.б. өзгерулерін салыстыру қызықты. Мұндай салыстырулар үшін сипаттамалардың абсолютті өзгергіштігінің көрсеткіштері жарамсыз: жылдармен көрсетілген жұмыс тәжірибесінің өзгермелілігін рубльмен көрсетілген жалақының өзгеруімен салыстыру мүмкін емес. Осындай салыстыруларды, сондай-ақ әртүрлі арифметикалық орташа мәндері бар бірнеше популяциялардағы бір сипаттаманың өзгергіштігін салыстыруды жүзеге асыру үшін вариациялық көрсеткіштер қолданылады - тербеліс коэффициенті, вариацияның сызықтық коэффициенті және өлшемді көрсететін вариация коэффициенті. орташа шамадағы экстремалды мәндердің ауытқуы.

Тербеліс коэффициенті:

Қайда V R -тербеліс коэффициентінің мәні; Р- вариация диапазонының мәні; X -

Сызықтық вариация коэффициенті».

Қайда Vj-сызықтық вариация коэффициентінің мәні; мен -орташа сызықтық ауытқудың мәні; X -зерттелетін популяция үшін сипаттаманың орташа мәні.

Вариация коэффициенті:

Қайда V a -вариация мәнінің коэффициенті; a – стандартты ауытқудың мәні; X -зерттелетін популяция үшін сипаттаманың орташа мәні.

Тербеліс коэффициенті - зерттелетін сипаттаманың орташа мәніне вариация диапазонының пайыздық қатынасы, ал вариацияның сызықтық коэффициенті - орташа сызықтық ауытқудың зерттелетін сипаттаманың орташа мәніне қатынасы, мына түрде өрнектеледі. пайыз. Вариация коэффициенті - стандартты ауытқудың зерттелетін сипаттаманың орташа мәніне пайыздық қатынасы. Пайызбен көрсетілген салыстырмалы шама ретінде әртүрлі сипаттамалардың өзгеру дәрежесін салыстыру үшін вариация коэффициенті қолданылады. Вариация коэффициентінің көмегімен статистикалық жиынтықтың біртектілігі бағаланады. Егер вариация коэффициенті 33%-дан аз болса, онда зерттелетін популяция біртекті, ал вариация әлсіз. Егер вариация коэффициенті 33%-дан жоғары болса, онда зерттелетін популяция гетерогенді, вариация күшті, ал орташа мән атипті болып табылады және оны осы популяцияның жалпы көрсеткіші ретінде пайдалануға болмайды. Сонымен қатар, бір сипаттаманың өзгергіштігін салыстыру үшін вариация коэффициенттері қолданылады әртүрлі агрегаттар. Мысалы, екі кәсіпорындағы жұмысшылардың еңбек өтілінің вариациясын бағалау. Коэффициент мәні неғұрлым жоғары болса, сипаттаманың өзгеруі соғұрлым маңызды болады.

Есептелген квартилдерге сүйене отырып, формула арқылы тоқсандық вариацияның салыстырмалы көрсеткішін де есептеуге болады.

қайда Q 2 Және

Квартильаралық диапазон формула бойынша анықталады

Төтенше мәндерді пайдаланумен байланысты кемшіліктерді болдырмау үшін вариация диапазонының орнына квартильді ауытқу қолданылады:

Бірдей емес интервалдық вариациялық қатарлар үшін таралу тығыздығы да есептеледі. Ол сәйкес жиіліктің немесе жиіліктің интервал мәніне бөлінген бөлігі ретінде анықталады. Тең емес интервалдық қатарларда абсолютті және салыстырмалы таралу тығыздықтары қолданылады. Абсолютті таралу тығыздығы интервалдың бірлік ұзындығына жиілік болып табылады. Салыстырмалы таралу тығыздығы – бірлік интервал ұзындығына жиілік.

Жоғарыда айтылғандардың барлығы таралу заңы қалыпты таралу заңымен жақсы сипатталған немесе оған жақын таралу қатарлары үшін дұрыс.

Топтастыру әдісі де өлшеуге мүмкіндік береді вариациябелгілердің (өзгермелілігі, ауытқуы). Популяциядағы бірліктердің саны салыстырмалы түрде аз болса, вариация популяцияны құрайтын бірліктердің реттелген санына қарай өлшенеді. сериясы деп аталады дәрежелі,бірліктер сипаттама бойынша өсу (кему) ретімен орналасса.

Дегенмен, қажет болған кезде рейтингті сериялар айтарлықтай көрсеткіш болып табылады Салыстырмалы сипаттамаларвариациялар. Сонымен қатар, көп жағдайда нақты қатар түрінде көрсету іс жүзінде қиын болатын, көп бірліктерден тұратын статистикалық популяциялармен айналысуға тура келеді. Осыған байланысты статистикалық деректермен бастапқы жалпы танысу үшін және әсіресе сипаттамалардың вариациясын зерттеуді жеңілдету үшін әдетте зерттелетін құбылыстар мен процестер топтарға біріктіріліп, топтастыру нәтижелері топтық кестелер түрінде беріледі.

Егер топтық кестеде тек екі баған болса - таңдалған сипаттама (параметрлер) және топтар саны (жиілік немесе жиілік) бойынша топтар, ол деп аталады. таратуға жақын.

Таралу диапазоны -бір сипаттамаға негізделген құрылымдық топтастырудың қарапайым түрі, сипаттама нұсқалары мен жиіліктері бар екі бағанмен топтық кестеде көрсетіледі. Көптеген жағдайларда мұндай құрылымдық топтастырумен, т.б. Тарату қатарын құрастырумен бастапқы статистикалық материалды зерттеу басталады.

Бөлу қатары түріндегі құрылымдық топтастыру, егер таңдалған топтар тек жиіліктермен ғана емес, басқа да статистикалық көрсеткіштермен сипатталатын болса, шынайы құрылымдық топқа айналуы мүмкін. Тарату қатарларының негізгі мақсаты сипаттамалардың вариациясын зерттеу болып табылады. Таралу қатарларының теориясы математикалық статистикамен егжей-тегжейлі әзірленген.

Тарату сериялары бөлінеді атрибутивті(атрибутивтік белгілер бойынша топтау, мысалы, халықты жынысы, ұлты, отбасылық жағдайы және т.б. бойынша бөлу) және вариациялық(сандық белгілері бойынша топтастыру).

Вариациялық қатарекі бағанды ​​қамтитын топтық кесте: бір сандық сипаттамаға сәйкес бірліктерді топтастыру және әр топтағы бірлік саны. Вариациялық қатардағы интервалдар әдетте тең және тұйық құрылады. Вариациялық қатар – жан басына шаққандағы орташа ақшалай табыс бойынша Ресей халқының келесі топтамасы (3.10-кесте).

3.10-кесте

Ресей халқының 2004-2009 жж. жан басына шаққандағы орташа табысы бойынша бөлінуі.

Жан басына шаққандағы орташа ақшалай табыс бойынша халық топтары, руб./ай

Топтағы халық саны, жалпы саннан %

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25 000,0 астам

Бүкіл халық

Вариациялық қатарлар өз кезегінде дискретті және интервалдық болып бөлінеді. Дискреттівариациялық қатарлар тар шектерде өзгеретін дискретті сипаттамалардың нұсқаларын біріктіреді. Дискретті вариациялық қатарға үлестірімді мысал келтіруге болады орыс отбасыларықол жетімді балалар санына сәйкес.

Аралықвариациялық қатарлар кең ауқымда өзгеретін үздіксіз сипаттамалардың немесе дискретті сипаттамалардың нұсқаларын біріктіреді. Интервал - Ресей халқының орташа жан басына шаққандағы ақшалай табысы бойынша бөлінуінің вариациялық қатары.

Дискретті вариациялық қатарлар практикада көп қолданылмайды. Сонымен қатар, оларды құрастыру қиын емес, өйткені топтардың құрамы зерттелетін топтастыру сипаттамаларына нақты ие болатын нақты нұсқалармен анықталады.

Интервалдық вариациялық қатарлар кең тараған. Оларды құрастырған кезде пайда болады қиын сұрақтоптардың саны, сондай-ақ белгіленуі тиіс аралықтардың мөлшері туралы.

Бұл мәселені шешу принциптері статистикалық топтастыруларды құру әдістемесі тарауында келтірілген (3.3-тармақты қараңыз).

Вариациялық қатарлар әртүрлі ақпаратты ықшамдауға немесе сығуға арналған құрал болып табылады; олардан вариацияның табиғаты туралы жеткілікті нақты пайымдау жасауға және зерттелетін жиынтыққа кіретін құбылыстардың сипаттамаларындағы айырмашылықтарды зерттеуге болады. Бірақ вариациялық қатарлардың ең маңызды маңыздылығы олардың негізінде вариацияның арнайы жалпылама сипаттамалары есептеледі (7-тарауды қараңыз).

Статистикалық таралу қатары– бұл популяция бірліктерін белгілі бір өзгермелі сипаттама бойынша топтарға реттелген бөлу.
Таралу қатарының қалыптасуының негізінде жатқан сипаттамаға байланысты болады атрибутивтік және вариациялық таралу қатарлары.

Жалпы сипаттаманың болуы сипаттама немесе өлшеу нәтижелерін білдіретін статистикалық жиынтықты қалыптастырудың негізі болып табылады ортақ ерекшеліктерізерттеу объектілері.

Статистиканың зерттеу пәні өзгермелі (өзгеретін) сипаттамалар немесе статистикалық сипаттамалар болып табылады.

Статистикалық сипаттамалардың түрлері.

Тарату қатарлары атрибутивтік деп аталадысапа критерийлері бойынша салынған. Атрибутивтік– бұл аты бар белгі (мысалы, мамандық: тігінші, мұғалім, т.б.).
Тарату сериясы әдетте кесте түрінде беріледі. Кестеде 2.8 атрибуттарды тарату қатарын көрсетеді.
2.8-кесте – Ресей Федерациясының аймақтарының бірінің азаматтарына адвокаттар көрсететін заң көмегінің түрлерін бөлу.

Вариациялық қатар– бұл сипаттаманың мәндері (немесе мәндер интервалдары) және олардың жиіліктері.
Вариациялық қатарлар таралу қатарлары болып табылады, сандық негізде құрылған. Кез келген вариациялық қатар екі элементтен тұрады: опциялар мен жиіліктер.
Варианттар вариациялық қатарда қабылдайтын сипаттаманың жеке мәндері болып саналады.
Жиіліктер - жеке нұсқалардың немесе вариациялық қатардың әрбір тобының сандары, яғни. Бұл тарату қатарында белгілі опциялардың қаншалықты жиі болатынын көрсететін сандар. Барлық жиіліктердің қосындысы бүкіл популяцияның мөлшерін, оның көлемін анықтайды.
Жиіліктер - бірлік бөліктерінің немесе жалпы санның пайызымен көрсетілген жиіліктер. Тиісінше, жиіліктердің қосындысы 1 немесе 100% тең. Вариациялық қатар нақты деректер негізінде таралу заңының нысанын бағалауға мүмкіндік береді.

Белгінің өзгеру сипатына қарай болады дискретті және интервалдық вариациялық қатарлар.
Дискретті вариациялық қатардың мысалы кестеде келтірілген. 2.9.
2.9-кесте – 1989 жылы Ресей Федерациясында жеке пәтерлердегі тұратын бөлмелер саны бойынша отбасыларды бөлу.

Кестенің бірінші бағанында дискретті вариациялық қатардың опциялары берілген, екінші бағанда вариациялық қатардың жиіліктері, ал үшіншісі жиілік көрсеткіштерінен тұрады.

Вариациялық қатар

IN халықбелгілі бір сандық қасиет зерттелуде. Одан кездейсоқ түрде көлем үлгісі алынады n, яғни үлгі элементтерінің саны тең n. Статистикалық өңдеудің бірінші кезеңінде ауқымдыүлгілер, яғни. нөмірге тапсырыс беру x 1 , x 2 , …, x nКөтерілу. Әрбір бақыланатын мән x iшақырды опция. Жиілік м менмәнді бақылау саны болып табылады x iүлгіде. Салыстырмалы жиілік(жиілік) w iжиілік қатынасы болып табылады м менүлгі өлшеміне n: .
Вариациялық қатарларды зерттегенде жинақталған жиілік және жинақталған жиілік ұғымдары да қолданылады. Болсын xкейбір сан. Содан кейін опциялар саны , құндылықтары аз x, жинақталған жиілік деп аталады: x i үшін nжинақталған жиілік w i max деп аталады.
Сипаттама дискретті айнымалы деп аталады, егер оның жеке мәндері (нұсқалары) бір-бірінен белгілі бір соңғы мәнмен (әдетте бүтін сан) ерекшеленетін болса. Мұндай сипаттаманың вариациялық қатары дискретті вариациялық қатар деп аталады.

Кесте 1. Дискретті вариациялық жиілік қатарының жалпы көрінісі

Сипаттамалық құндылықтарx i x 1 x 2 x n
Жиіліктерм мен м 1 м 2 м н

Сипаттама үздіксіз өзгеретін деп аталады, егер оның мәндері бір-бірінен ерікті түрде аз мөлшерде ерекшеленсе, яғни. белгі белгілі бір аралықта кез келген мәнді қабылдай алады. Мұндай сипаттама үшін үздіксіз вариациялық қатар интервал деп аталады.

Кесте 2. Жиіліктердің интервалдық вариация қатарының жалпы көрінісі

Кесте 3. Вариациялық қатардың графикалық кескіндері

ҚатарКөпбұрыш немесе гистограммаЭмпирикалық таралу функциясы
Дискретті
Аралық
Бақылау нәтижелерін қарастыра отырып, әрбір нақты интервалға қанша нұсқа мәндері түсетіні анықталады. Әрбір интервал оның бір ұшына жатады деп болжанады: не барлық жағдайларда сол жақта (жиірек) немесе барлық жағдайларда оң жақта, ал жиіліктер немесе жиіліктер көрсетілген шекаралардағы опциялардың санын көрсетеді. Айырмашылықтар a i – a i +1жартылай интервалдар деп аталады. Кейінгі есептеулерді жеңілдету үшін интервалдық вариациялық қатарды шартты дискреттімен ауыстыруға болады. Бұл жағдайда орташа мән мен-интервал опция ретінде қабылданады x i, және сәйкес интервал жиілігі м мен– осы аралық жиілігі үшін.
Вариациялық қатарларды графикалық бейнелеу үшін көпбұрыш, гистограмма, кумулятивтік қисық және эмпирикалық таралу функциясы жиі қолданылады.

Кестеде 2.3 (1994 жылғы сәуірдегі жан басына шаққандағы орташа табыс бойынша Ресей халқын топтастыру) ұсынылған интервалдық вариациялық қатар.
Графикалық кескіннің көмегімен таралу қатарын талдау ыңғайлы, бұл таралу пішінін бағалауға мүмкіндік береді. Вариациялық қатардың жиіліктерінің өзгеру сипатының көрнекі көрінісі арқылы берілген көпбұрыш және гистограмма.
Көпбұрыш дискретті вариациялық қатарларды бейнелегенде қолданылады.
Мысалы, тұрғын үй қорының пәтер түрлері бойынша бөлінуін графикалық түрде көрсетейік (2.10-кесте).
2.10-кесте – Қалалық аумақтың тұрғын үй қорын пәтер түрлері бойынша бөлу (шартты сандар).


Күріш. Тұрғын үй тарату аймағы


Ордината осьтерінде тек жиілік мәндерін емес, вариациялық қатардың жиіліктерін де салуға болады.
Гистограмма интервалдық вариация қатарын бейнелеу үшін қолданылады. Гистограмманы құру кезінде интервалдардың мәндері абсцисса осіне, ал жиіліктер сәйкес интервалдарға салынған тіктөртбұрыштар арқылы бейнеленеді. Бағандардың биіктігі тең интервалдар болған жағдайда жиіліктерге пропорционалды болуы керек. Гистограмма - бұл қатар бір-біріне іргелес жолақтар түрінде бейнеленген график.
Кестеде берілген интервалдық үлестіру қатарын графикалық түрде көрсетейік. 2.11.
2.11-кесте – Бір адамға шаққандағы тұрғын үй алаңының көлемі бойынша отбасыларды бөлу (шартты сандар).
N p/p Бір адамға шаққандағы тұрғын үй алаңының көлемі бойынша отбасы топтары Тұрғын үй алаңының берілген көлемі бар отбасылар саны Отбасылардың жиынтық саны
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
БАРЛЫҒЫ 115 ----


Күріш. 2.2. Жанұялардың бір адамға шаққандағы тұрғын үй көлемі бойынша таралу гистограммасы


Жинақталған қатардың (2.11-кесте) мәліметтерін пайдалана отырып, құрастырамыз жинақталған бөлу.


Күріш. 2.3. Жанұялардың бір адамға шаққандағы тұрғын алаңының көлемі бойынша жиынтық бөлінуі


Вариациялық қатарды кумулят түрінде көрсету, әсіресе жиіліктері қатар жиіліктерінің қосындысының үлестері немесе пайыздары түрінде көрсетілген вариациялық қатарлар үшін тиімді.
Вариациялық қатарды кумулят түрінде графикалық бейнелеу кезінде осьтерді өзгертсек, онда аламыз огива. Суретте. 2.4 Кестедегі деректер негізінде құрастырылған огиваны көрсетеді. 2.11.
Гистограмманы тіктөртбұрыштардың қабырғаларының орта нүктелерін тауып, содан кейін осы нүктелерді түзулермен қосу арқылы таралу полигонына түрлендіруге болады. Алынған таралу көпбұрышы суретте көрсетілген. 2.2 нүктелі сызықпен.
Тең емес интервалдардағы вариациялық қатардың таралу гистограммасын құру кезінде ордината осі бойынша жиіліктер емес, сәйкес интервалдардағы сипаттаманың таралу тығыздығы салынады.
Тарату тығыздығы - бірлік аралық еніне есептелген жиілік, яғни. интервал мәнінің бірлігіне әр топта қанша бірлік бар. Бөлу тығыздығын есептеу мысалы кестеде берілген. 2.12.
2.12-кесте – Кәсіпорындарды жұмысшылар саны бойынша бөлу (шартты сандар)
N p/p Жұмысшылар саны, адамдар бойынша кәсіпорындар топтары. Кәсіпорындар саны Интервал мөлшері, адамдар. Таралу тығыздығы
А 1 2 3=1/2
1 20-ға дейін 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
БАРЛЫҒЫ 147 ---- ----

Вариациялық қатарларды графикалық түрде көрсету үшін де пайдалануға болады жиынтық қисық. Кумулят (сома қисығы) көмегімен жинақталған жиіліктер қатары бейнеленген. Жиынтық жиіліктер топтар бойынша жиіліктерді дәйекті түрде қосу арқылы анықталады және популяциядағы қанша бірлікте қарастырылатын мәннен аспайтын атрибут мәндері бар екенін көрсетеді.


Күріш. 2.4. Жанұяларды бір адамға шаққандағы тұрғын үй көлемі бойынша бөлу туралы түсінік

Интервалдық вариациялық қатардың кумуляттарын тұрғызған кезде қатардың нұсқалары абсцисса осі бойымен, ал жинақталған жиіліктер ордината осі бойымен сызылады.

Үздіксіз вариациялық қатар

Үздіксіз вариациялық қатар – сандық статистикалық сипаттама негізінде құрылған қатар. Мысал. Ағымдағы жылдың күзгі-қысқы кезеңіндегі сотталғандардың ауыруының орташа ұзақтығы (адам шаққандағы күн):
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5