Generell befolknings- og utvalgsstudie. Statistisk signifikant

Et utvalg er et sett med data tatt ved hjelp av visse prosedyrer fra en populasjon for utforskende analyse. Representativitet er egenskapen til å reprodusere ideen om helheten ved sin del. Med andre ord, dette er muligheten for å utvide ideen om en del til helheten, som inkluderer denne delen.

Representativiteten til et utvalg er en indikator på at utvalget fullt ut og pålitelig må gjenspeile egenskapene til populasjonen det er en del av. Det kan også defineres som egenskapen til et utvalg å representere populasjonskarakteristikkene som er signifikante med tanke på formålet med studien.

La oss anta at den generelle befolkningen er alle skoleelever (900 personer fra 30 klasser, 30 personer i hver klasse). Målet med studien er skoleelevenes holdning til røyking. En utvalgspopulasjon bestående av 90 elever vil bare representere hele befolkningen mye dårligere enn et utvalg av de samme 90 elevene, som vil omfatte 3 elever fra hver klasse. Hovedårsaken er ulik aldersfordeling. I det første tilfellet vil altså representativiteten til utvalget være lav. I det andre tilfellet - høy.

I sosiologi sier de at det er representativitet for et utvalg og dets ikke-representativitet.

Et eksempel på et ikke-representativt utvalg er en klassisk sak som skjedde i 1936 i USA under presidentvalget.

Literary Digest, som hadde vært svært vellykket med å forutsi resultatene fra tidligere valg, tok feil i sine prognoser denne gangen, selv om den sendte flere millioner skriftlige spørsmål til abonnenter og til respondenter de valgte fra telefonbøker og bilregistreringslister. Av 1/4 av stemmesedlene som ble returnert fullført, ble stemmene fordelt som følger: 57 % ga preferanse til den republikanske kandidaten ved navn Alf Landon, og 41 % foretrakk den sittende presidenten, demokraten Franklin Roosevelt.

Faktisk vant F. Roosevelt valget, og fikk nesten 60 % av stemmene. The Literary Digests feil var som følger. De ønsket å øke representativiteten til utvalget . Og siden de visste at de fleste av abonnentene deres identifiserte seg som republikanere, bestemte de seg for å utvide utvalget til å inkludere respondenter de valgte fra telefonbøker og bilregistreringslister. Men de tok ikke hensyn til de eksisterende realitetene og valgte faktisk ut enda flere republikanske tilhengere, for på den tiden hadde middel- og overklassen råd til å ha biler og telefoner. Og disse var stort sett republikanere, ikke demokrater.

Det finnes ulike typer prøvetaking: enkel tilfeldig, seriell, typisk, mekanisk og kombinert.

Enkel tilfeldig prøvetaking består i å velge fra hele populasjonen av enheter som studeres tilfeldig uten noe system.

Mekanisk prøvetaking brukes når det er orden i befolkningen generelt, for eksempel er det en viss rekkefølge av enheter av arbeidere, valglister, telefonnumre til respondenter, antall leiligheter og hus osv.).

Typisk utvalg brukes når hele befolkningen kan deles inn i grupper etter type. Når du arbeider med befolkningen, kan disse for eksempel være utdanning, alder, sosiale grupper; når du studerer bedrifter - en industri eller en egen organisasjon, etc.

Serievalg er praktisk når enheter kombineres i små serier eller grupper. En slik serie kan være partier med ferdige produkter, skoleklasser og andre grupper.

Kombinert prøvetaking innebærer bruk av alle tidligere typer prøvetaking i en eller annen kombinasjon.

Prøve

Prøve eller utvalgspopulasjon- et sett med tilfeller (emner, objekter, hendelser, prøver), ved hjelp av en bestemt prosedyre, valgt fra den generelle befolkningen for å delta i studien.

Prøveegenskaper:

Kvalitative egenskaper ved utvalget - hvem velger vi akkurat og hvilke prøvetakingsmetoder vi bruker for dette.
Kvantitative egenskaper ved utvalget - hvor mange saker vi velger ut, med andre ord, utvalgsstørrelse.

Nødvendigheten av prøvetaking

Studieobjektet er svært omfattende. For eksempel er forbrukere av et globalt selskaps produkter representert av et stort antall geografisk spredte markeder.
Det er behov for å samle inn primærinformasjon.

Prøvestørrelse

Prøvestørrelse- antall tilfeller inkludert i utvalgspopulasjonen. Av statistiske grunner anbefales det at antall tilfeller er minst 30-35.

Avhengige og uavhengige utvalg

Når du sammenligner to (eller flere) prøver, er en viktig parameter deres avhengighet. Hvis et homomorft par kan etableres (det vil si når ett tilfelle fra prøve X tilsvarer ett og bare ett tilfelle fra prøve Y og omvendt) for hvert tilfelle i to prøver (og dette forholdet er viktig for egenskapen som måles i prøvene), kalles slike prøver avhengig. Eksempler på avhengige prøver:

tvillingpar,
to målinger av en egenskap før og etter eksperimentell eksponering,
ektemenn og koner
og så videre.

Hvis det ikke er et slikt forhold mellom prøvene, vurderes disse prøvene uavhengig, For eksempel:

Følgelig har avhengige utvalg alltid samme størrelse, mens størrelsen på uavhengige utvalg kan variere.

Sammenligning av prøver er gjort ved hjelp av ulike statistiske kriterier:

og så videre.

Representativitet

Utvalget kan anses som representativt eller ikke-representativt.

Eksempel på et ikke-representativt utvalg

En studie med forsøks- og kontrollgrupper, som er plassert under ulike forhold.
- Studer med eksperimentelle og kontrollgrupper ved å bruke en parvis seleksjonsstrategi
En studie som bruker bare én gruppe - en eksperimentell gruppe.
En studie som bruker en blandet (faktoriell) design - alle grupper er plassert under forskjellige forhold.

Prøvetakingstyper

Prøver er delt inn i to typer:

sannsynlighet
ikke-sannsynlighet

Sannsynlighetsprøver

Enkelt sannsynlighetsutvalg:
- Enkel resampling. Bruken av et slikt utvalg er basert på antakelsen om at hver respondent er like sannsynlig å bli inkludert i utvalget. Basert på listen over befolkningen generelt, er det satt sammen kort med respondentnummer. De legges i en kortstokk, stokkes og et kort tas ut tilfeldig, tallet skrives ned og returneres deretter. Deretter gjentas prosedyren så mange ganger som prøvestørrelsen vi trenger. Ulempe: repetisjon av utvalgsenheter.

Prosedyren for å konstruere en enkel tilfeldig prøve inkluderer følgende trinn:

1. det er nødvendig å få en fullstendig liste over medlemmer av befolkningen og nummerere denne listen. En slik liste, husker, kalles en samplingsramme;

2. bestemme forventet utvalgsstørrelse, det vil si forventet antall respondenter;

3. trekke ut så mange tall fra tilfeldig talltabellen som vi trenger prøveenheter. Dersom det skulle være 100 personer i utvalget, tas 100 tilfeldige tall fra tabellen. Disse tilfeldige tallene kan genereres av et dataprogram.

4. velg fra basislisten de observasjonene hvis tall tilsvarer de skrevne tilfeldige tallene

Enkel tilfeldig prøvetaking har åpenbare fordeler. Denne metoden er ekstremt enkel å forstå. Resultatene av studien kan generaliseres til befolkningen som studeres. De fleste tilnærminger til statistisk slutning innebærer å samle informasjon ved hjelp av et enkelt tilfeldig utvalg. Imidlertid har den enkle tilfeldige prøvetakingsmetoden minst fire signifikante begrensninger:

1. Det er ofte vanskelig å lage en samplingsramme som tillater enkel tilfeldig prøvetaking.

2. Enkelt tilfeldig utvalg kan resultere i en stor populasjon, eller en populasjon fordelt over et stort geografisk område, noe som øker tiden og kostnadene ved datainnsamling betydelig.

3. Resultatene av enkel tilfeldig prøvetaking er ofte preget av lav presisjon og større standardfeil enn resultatene av andre sannsynlighetsmetoder.

4. Som et resultat av bruk av SRS kan det dannes et ikke-representativt utvalg. Selv om prøver oppnådd ved enkel tilfeldig prøvetaking i gjennomsnitt representerer populasjonen tilstrekkelig, er noen av dem ekstremt feilrepresentative for populasjonen som studeres. Dette er spesielt sannsynlig når prøvestørrelsen er liten.

Enkel ikke-repeterende prøvetaking. Samplingsprosedyren er den samme, bare kortene med respondentnummer blir ikke returnert til kortstokken.

Systematisk sannsynlighetsutvalg. Det er en forenklet versjon av enkel sannsynlighetsprøvetaking. Basert på listen over den generelle befolkningen velges respondentene med et visst intervall (K). Verdien av K bestemmes tilfeldig. Det mest pålitelige resultatet oppnås med en homogen populasjon, ellers kan trinnstørrelsen og enkelte interne sykliske mønstre i prøven falle sammen (prøveblanding). Ulemper: det samme som i et enkelt sannsynlighetsutvalg.
Seriell (klynge) prøvetaking. Utvalgsenheter er statistiske serier (familie, skole, lag osv.). De valgte elementene er gjenstand for en fullstendig eksamen. Utvalget av statistiske enheter kan organiseres som tilfeldig eller systematisk utvalg. Ulempe: Mulighet for større homogenitet enn i befolkningen generelt.
Regional prøvetaking. Ved en heterogen populasjon anbefales det før bruk av sannsynlighetsprøvetaking med noen seleksjonsteknikk å dele populasjonen inn i homogene deler, et slikt utvalg kalles distriktsutvalg. Sonegrupper kan omfatte både naturformasjoner (for eksempel bydeler) og alle funksjoner som ligger til grunn for studien. Karakteristikken som delingen utføres på grunnlag av kalles karakteristikken for stratifisering og sonering.
Eksempel på "bekvemmelighet". Prosedyren for "bekvemmelig" prøvetaking består i å etablere kontakter med "praktiske" prøvetakingsenheter - en gruppe studenter, et idrettslag, venner og naboer. Hvis du ønsker å få informasjon om folks reaksjoner på et nytt konsept, er denne typen prøvetaking ganske rimelig. Bekvemmelighetsprøver brukes ofte til å forhåndsteste spørreskjemaer.

Ikke-sannsynlighetsprøver

Utvelgelse i et slikt utvalg utføres ikke i henhold til prinsippene om tilfeldighet, men i henhold til subjektive kriterier - tilgjengelighet, typiskhet, lik representasjon, etc.

Kvoteutvalg - utvalget er konstruert som en modell som gjengir strukturen til den generelle befolkningen i form av kvoter (proporsjoner) av egenskapene som studeres. Antall utvalgselementer med ulike kombinasjoner av studerte egenskaper bestemmes slik at det tilsvarer deres andel (andel) i befolkningen generelt. Så hvis for eksempel vår generelle befolkning består av 5000 mennesker, hvorav 2000 kvinner og 3000 menn, så vil vi i kvoteutvalget ha 20 kvinner og 30 menn, eller 200 kvinner og 300 menn. Kvoteutvalg er oftest basert på demografiske kriterier: kjønn, alder, region, inntekt, utdanning og andre. Ulemper: vanligvis er slike prøver ikke representative, fordi det er umulig å ta hensyn til flere sosiale parametere samtidig. Fordeler: lett tilgjengelig materiale.
Snøballmetoden. Prøven er konstruert som følger. Hver respondent, som starter med den første, blir bedt om kontaktinformasjon til venner, kolleger, bekjente som passer til utvelgelsesbetingelsene og kan delta i studien. Således, med unntak av det første trinnet, dannes utvalget med deltagelse av selve forskningsobjektene. Metoden brukes ofte når det er nødvendig å finne og intervjue vanskelig tilgjengelige grupper av respondenter (for eksempel respondenter med høy inntekt, respondenter som tilhører samme yrkesgruppe, respondenter med lignende hobbyer/interesser osv.)
Spontan prøvetaking – prøvetaking av den såkalte «første personen du kommer over». Ofte brukt i TV- og radioavstemninger. Størrelsen og sammensetningen av spontane prøver er ikke kjent på forhånd, og bestemmes kun av én parameter - aktiviteten til respondentene. Ulemper: det er umulig å fastslå hvilken populasjon respondentene representerer, og som et resultat er det umulig å fastslå representativitet.
Ruteundersøkelse – ofte brukt når studieenheten er familien. På kartet over lokaliteten der undersøkelsen skal gjennomføres er alle gater nummerert. Ved hjelp av en tabell (generator) av tilfeldige tall velges store tall. Hvert stort tall anses å bestå av 3 komponenter: gatenummer (2-3 første tall), husnummer, leilighetsnummer. For eksempel nummeret 14832: 14 er gatenummeret på kartet, 8 er husnummeret, 32 er leilighetsnummeret.
Regional prøvetaking med utvalg av typiske objekter. Dersom det etter soneinndeling velges et typisk objekt fra hver gruppe, dvs. et objekt som er nær gjennomsnittet når det gjelder de fleste egenskapene som er studert i studien, et slikt utvalg kalles regionalisert med utvalg av typiske objekter.

6.Modal prøvetaking. 7. ekspertprøvetaking. 8. Heterogen prøve.

Gruppebyggingsstrategier

Valg av grupper for deres deltagelse i psykologisk eksperiment gjennomføres gjennom ulike strategier som skal til for å sikre at intern og ekstern validitet opprettholdes i størst mulig grad.

Randomisering

Randomisering, eller tilfeldig utvalg, brukes til å lage enkle stikkprøver. Bruken av et slikt utvalg er basert på antakelsen om at hvert medlem av populasjonen er like sannsynlig å bli inkludert i utvalget. For å lage en tilfeldig prøve på 100 universitetsstudenter, kan du for eksempel legge papirbiter med navnene på alle universitetsstudenter i en lue, og deretter ta 100 stykker papir ut av det - dette vil være et tilfeldig utvalg (Goodwin J ., s. 147).

Parvis valg

Parvis valg- en strategi for å konstruere prøvetakingsgrupper, der grupper av forsøkspersoner er satt sammen av forsøkspersoner som er likeverdige når det gjelder sekundære parametere som er signifikante for eksperimentet. Denne strategien er effektiv for eksperimenter som bruker eksperimentelle grupper og kontrollgrupper, med det beste alternativet å involvere tvillingpar (mono- og dizygotiske), da den lar deg lage...

Stratometrisk utvalg

Stratometrisk utvalg- randomisering med tildeling av strata (eller klynger). Med denne prøvemetoden deles den generelle befolkningen inn i grupper (strata) med visse egenskaper (kjønn, alder, politiske preferanser, utdanning, inntektsnivå osv.), og emner med tilsvarende egenskaper velges.

Omtrentlig modellering

Omtrentlig modellering- trekke begrensede utvalg og generalisere konklusjoner om dette utvalget til den bredere befolkningen. For eksempel, med deltakelse av 2. års universitetsstudenter i studien, gjelder dataene i denne studien for "personer i alderen 17 til 21 år". Tillateligheten av slike generaliseringer er ekstremt begrenset.

Tilnærmet modellering er dannelsen av en modell som, for en klart definert klasse av systemer (prosesser), beskriver dens oppførsel (eller ønskede fenomener) med akseptabel nøyaktighet.

Notater

Litteratur

Nasledov A.D. Matematiske metoder psykologisk forskning. - St. Petersburg: Rech, 2004.

Ilyasov F.N. Representativitet av undersøkelsesresultater i markedsundersøkelser // Sosiologisk forskning. 2011. nr. 3. S. 112-116.

se også

I noen typer studier er utvalget delt inn i grupper:
- eksperimentell
- kontroll
Kohort

Linker

Konseptet med prøvetaking. Hovedkarakteristika for prøven. Prøvetakingstyper

Wikimedia Foundation. 2010.

Synonymer:

Shchepkin, Mikhail Semenovich
Befolkning

Se hva "Utvalg" er i andre ordbøker:

prøve- en gruppe forsøkspersoner som representerer en bestemt populasjon og valgt ut for et eksperiment eller studie. Det motsatte konseptet er den generelle helheten. Et utvalg er en del av befolkningen generelt. Ordbok for en praktisk psykolog. M.: AST,... ... Flott psykologisk leksikon

prøve- utvalg En del av den generelle populasjonen av elementer som dekkes av observasjon (ofte kalles det en utvalgspopulasjon, og et utvalg er selve metoden for prøvetaking av observasjon). I matematisk statistikk akseptert... ... Teknisk oversetterveiledning

Prøve- (prøve) 1. En liten mengde av et produkt, valgt for å representere hele kvantiteten. Se: salg pr. prøve. 2. En liten mengde varer gitt til potensielle kjøpere for å gi dem muligheten til å utføre det... ... Ordbok med forretningsvilkår

Prøve- en del av den generelle populasjonen av elementer som er dekket av observasjon (ofte kalles det en utvalgspopulasjon, og et utvalg er selve metoden for prøvetaking av observasjon). I matematisk statistikk er prinsippet om tilfeldig utvalg tatt i bruk; Dette … … Økonomisk og matematisk ordbok

PRØVE- (utvalg) Et tilfeldig utvalg av en undergruppe av elementer fra hovedpopulasjonen, hvis egenskaper brukes til å evaluere hele populasjonen som helhet. Prøvemetoden brukes når det er for tidkrevende eller for dyrt å kartlegge hele befolkningen... Økonomisk ordbok

Det totale antallet observasjonsobjekter (mennesker, husholdninger, bedrifter, bosetninger etc.), som har et visst sett med egenskaper (kjønn, alder, inntekt, antall, omsetning, etc.), begrenset i rom og tid. Eksempler på populasjoner

Alle innbyggere i Moskva (10,6 millioner mennesker ifølge folketellingen fra 2002)
Mannlige muskovitter (4,9 millioner mennesker ifølge folketellingen for 2002)
Juridiske enheter i Russland (2,2 millioner ved begynnelsen av 2005)
Utsalgssteder som selger matvarer (20 tusen ved begynnelsen av 2008), etc.

Utvalg (prøvepopulasjon)

En del av en populasjon valgt ut for studier for å trekke konklusjoner om hele populasjonen. For at konklusjonen som er oppnådd ved å studere utvalget skal utvides til hele populasjonen, må utvalget ha egenskapen representativitet.

Representativiteten til utvalget

Egenskapen til et utvalg for å reflektere populasjonen riktig. Det samme utvalget kan være representativt og lite representativt for ulike populasjoner.
Eksempel:

Et utvalg som utelukkende består av muskovitter som eier en bil, representerer ikke hele befolkningen i Moskva.
Et utvalg russiske virksomheter med opptil 100 ansatte representerer ikke alle virksomheter i Russland.
Et utvalg muskovitter som handler på markedet, representerer ikke kjøpsatferden til alle muskovitter.

Samtidig kan disse prøvene (underlagt andre forhold) perfekt representere henholdsvis muskovitter som eier biler, små og mellomstore russiske bedrifter og kjøpere som kjøper i markeder.
Det er viktig å forstå at utvalgsrepresentativitet og utvalgsfeil er forskjellige fenomener. Representativitet, i motsetning til feil, avhenger ikke på noen måte av utvalgsstørrelsen.
Eksempel:
Uansett hvor mye vi øker antallet muskovitter som er undersøkte bileiere, vil vi ikke kunne representere alle muskovittene med dette utvalget.

Sampling feil (konfidensintervall)

Avviket til resultatene oppnådd ved bruk av prøveobservasjon fra de sanne dataene fra den generelle befolkningen.
Det er to typer prøvetakingsfeil – statistiske og systematiske. Statistisk feil avhenger av utvalgsstørrelse. Jo større prøvestørrelsen er, jo lavere er den.
Eksempel:
For et enkelt tilfeldig utvalg på 400 enheter er den maksimale statistiske feilen (med 95 % konfidensnivå) 5 %, for et utvalg på 600 enheter – 4 %, for et utvalg på 1100 enheter – 3 % Vanligvis når de snakker om prøvetaking feil, de betyr statistisk feil.
Systematisk feil avhenger av ulike faktorer som hele tiden påvirker studien og fordreier resultatene av studien i en bestemt retning.
Eksempel:

Å bruke eventuelle sannsynlighetsprøver vil undervurdere andelen personer med høy inntekt som fører en aktiv livsstil. Dette skjer på grunn av det faktum at det er mye vanskeligere å finne slike mennesker på et bestemt sted (for eksempel hjemme).
Problemet med at respondentene nekter å svare på spørsmål (andelen "refuseniks" i Moskva, for forskjellige undersøkelser, varierer fra 50% til 80%)

I noen tilfeller, når de sanne fordelingene er kjent, kan den systematiske feilen utjevnes ved å innføre kvoter eller vekte dataene på nytt, men i de fleste virkelige studier kan det være ganske problematisk å til og med estimere det.

Prøvetyper

Prøver er delt inn i to typer:

sannsynlighet
ikke-sannsynlighet

1. Sannsynlighetsprøver
1.1 Tilfeldig utvalg (enkelt tilfeldig utvalg)
Et slikt utvalg antar homogeniteten til den generelle befolkningen, samme sannsynlighet for tilgjengelighet av alle elementer, tilstedeværelsen full liste alle elementer. Ved valg av elementer brukes som regel en tabell med tilfeldige tall.
1.2 Mekanisk (systematisk) prøvetaking
En type tilfeldig prøve, sortert etter en karakteristikk (alfabetisk rekkefølge, telefonnummer, fødselsdato osv.). Det første elementet velges tilfeldig, deretter, med trinn 'n', velges hvert 'k'te element. Størrelsen på befolkningen, i dette tilfellet – N=n*k
1.3 Stratifisert (sonert)
Det brukes i tilfelle av heterogenitet i befolkningen. Den generelle befolkningen er delt inn i grupper (strata). I hvert stratum utføres seleksjonen tilfeldig eller mekanisk.
1.4 Seriell (klynge eller klynge) prøvetaking
Ved serieprøver er ikke utvalgsenhetene selve objektene, men grupper (klynger eller reir). Grupper velges tilfeldig. Objekter innenfor grupper undersøkes i bulk.

2. Ikke-sannsynlighetsprøver
Utvelgelse i et slikt utvalg utføres ikke i henhold til prinsippene om tilfeldighet, men i henhold til subjektive kriterier - tilgjengelighet, typiskhet, lik representasjon, etc.
2.1. Kvoteprøvetaking
Til å begynne med identifiseres en rekke grupper av gjenstander (for eksempel menn i alderen 20-30 år, 31-45 år og 46-60 år gamle; personer med inntekt opptil 30 tusen rubler, med inntekt fra 30 til 60 tusen rubler og med inntekt over 60 tusen rubler ) For hver gruppe spesifiseres antall gjenstander som må undersøkes. Antall objekter som skal falle inn i hver av gruppene settes oftest enten i forhold til den tidligere kjente andelen av gruppen i befolkningen generelt, eller likt for hver gruppe. Innenfor grupper velges objekter tilfeldig. Kvoteprøvetaking brukes ganske ofte.
2.2. Snøballmetoden
Prøven er konstruert som følger. Hver respondent, som starter med den første, blir bedt om kontaktinformasjon til venner, kolleger, bekjente som passer til utvelgelsesbetingelsene og kan delta i studien. Således, med unntak av det første trinnet, dannes utvalget med deltagelse av selve forskningsobjektene. Metoden brukes ofte når det er nødvendig å finne og intervjue vanskelig tilgjengelige grupper av respondenter (for eksempel respondenter med høy inntekt, respondenter som tilhører samme yrkesgruppe, respondenter med lignende hobbyer/interesser osv.)
2.3 Spontan prøvetaking
De mest tilgjengelige respondentene er undersøkt. Typiske eksempler på spontane prøver er i aviser/magasiner, gitt til respondenter for egenutfylling, og de fleste nettundersøkelser. Størrelsen og sammensetningen av spontane prøver er ikke kjent på forhånd, og bestemmes kun av én parameter - aktiviteten til respondentene.
2.4 Eksempel på typiske tilfeller
Enheter av den generelle befolkningen som har en gjennomsnittlig (typisk) verdi av egenskapen velges. Dette reiser problemet med å velge en funksjon og bestemme dens typiske verdi.

Forelesningskurs om statistikkteori

Mer detaljert informasjon om prøveobservasjoner kan fås ved å se.

Prøve - et sett med tilfeller (emner, objekter, hendelser, prøver), ved hjelp av en bestemt prosedyre, valgt fra den generelle befolkningen for å delta i studien.

Prøvestørrelse

Utvalgsstørrelse er antall tilfeller inkludert i utvalgspopulasjonen. Av statistiske grunner anbefales det at antall tilfeller er minst 30-35.

Avhengige og uavhengige utvalg

Når du sammenligner to (eller flere) prøver, er en viktig parameter deres avhengighet. Hvis det er mulig å etablere et homomorft par (det vil si når ett tilfelle fra prøve X tilsvarer ett og bare ett tilfelle fra prøve Y og omvendt) for hvert tilfelle i to prøver (og dette grunnlaget for sammenhengen er viktig for egenskap som måles i prøvene), kalles slike prøver avhengige. Eksempler på avhengige prøver:

tvillingpar,
to målinger av en egenskap før og etter eksperimentell eksponering,
ektemenn og koner
og så videre.

Hvis det ikke er et slikt forhold mellom prøvene, anses disse prøvene som uavhengige, for eksempel:

menn og kvinner,
psykologer og matematikere.
Følgelig har avhengige utvalg alltid samme størrelse, mens størrelsen på uavhengige utvalg kan variere.

Sammenligning av prøver er gjort ved hjelp av ulike statistiske kriterier:

Elevens t-test
Wilcoxon T-test
Mann-Whitney U-test
Tegn kriterium
og så videre.

Representativitet

Utvalget kan anses som representativt eller ikke-representativt.

Eksempel på et ikke-representativt utvalg

I USA forekommer et av de mest kjente historiske eksemplene på ikke-representativ prøvetaking under presidentvalget i 1936. The Literary Digest, som hadde forutsett hendelsene ved flere tidligere valg, tok feil i sine spådommer da den sendte ut ti millioner prøvesedler til sine abonnenter, personer valgt fra telefonbøker over hele landet og personer fra bilregistreringslister. I 25 % av returnerte stemmesedler (nesten 2,5 millioner) ble stemmene fordelt som følger:

57% foretrakk den republikanske kandidaten Alf Landon

40 % valgte daværende demokratiske president Franklin Roosevelt

I selve valget vant Roosevelt som kjent og fikk mer enn 60 % av stemmene. The Literary Digests feil var denne: de ønsket å øke representativiteten til utvalget - siden de visste at de fleste av abonnentene deres betraktet seg som republikanere - utvidet de utvalget til å omfatte personer valgt fra telefonbøker og registreringslister. De tok imidlertid ikke hensyn til sin tids realiteter og rekrutterte faktisk enda flere republikanere: under den store depresjonen var det hovedsakelig representanter for middel- og overklassen som hadde råd til å eie telefoner og biler (det vil si de fleste republikanere , ikke demokrater).

Typer plan for å konstruere grupper fra prøver

Det er flere hovedtyper av gruppebyggeplaner:

En studie med forsøks- og kontrollgrupper, som er plassert under ulike forhold.
Studer med eksperimentelle og kontrollgrupper ved å bruke en parvis seleksjonsstrategi
En studie som bruker bare én gruppe - en eksperimentell gruppe.
En studie som bruker en blandet (faktoriell) design - alle grupper er plassert under forskjellige forhold.

Gruppebyggingsstrategier

Utvelgelsen av grupper for deltakelse i et psykologisk eksperiment gjennomføres ved hjelp av ulike strategier for å sikre størst mulig respekt for indre og ytre validitet.

Randomisering (tilfeldig utvalg)
Tiltrekker ekte grupper

Randomisering

Randomisering, eller tilfeldig utvalg, brukes til å lage enkle stikkprøver. Bruken av et slikt utvalg er basert på antakelsen om at hvert medlem av populasjonen er like sannsynlig å bli inkludert i utvalget. For eksempel, for å lage en tilfeldig prøve på 100 studenter, kan du legge papirstykker med navnene på alle universitetsstudenter i en lue, og deretter ta 100 stykker papir ut av det - dette vil være et tilfeldig utvalg (Goodwin J. , s. 147).

Parvis valg

I statistikk er det to hovedforskningsmetoder – kontinuerlig og selektiv. Ved gjennomføring av en prøvestudie er det obligatorisk å overholde følgende krav: representativitet av utvalgspopulasjonen og tilstrekkelig antall observasjonsenheter. Ved valg av observasjonsenheter er det mulig Offset feil, dvs. slike hendelser, hvis forekomst ikke kan forutsies nøyaktig. Disse feilene er objektive og naturlige. Når man bestemmer graden av nøyaktighet til en prøvetakingsstudie, estimeres mengden feil som kan oppstå under prøvetakingsprosessen - Tilfeldig representativitetsfeil (M) — Det er den faktiske forskjellen mellom de gjennomsnittlige eller relative verdiene oppnådd under en prøvestudie og lignende verdier som ville blitt oppnådd under en studie på den generelle befolkningen.

Å vurdere påliteligheten til forskningsresultatene innebærer å bestemme:

1. representativitetsfeil

2. konfidensgrenser for gjennomsnittlige (eller relative) verdier i befolkningen

3. påliteligheten av forskjellen mellom gjennomsnittlige (eller relative) verdier (i henhold til t-kriteriet)

Representativitetsfeilberegning(mm) aritmetisk middelverdi (M):

Hvor σ er standardavviket; n—prøvestørrelse (>30).

Beregning av representativitetsfeil (mР) relativ verdi (Р):

Hvor P er den tilsvarende relative verdien (beregnet for eksempel i %);

Q =100 - Ρ% - den resiproke av P; n – prøvestørrelse (n>30)

I klinisk og eksperimentelt arbeid er det ganske ofte nødvendig å bruke Liten prøve Når antall observasjoner er mindre enn eller lik 30. Med et lite utvalg for å beregne representativitetsfeil, både gjennomsnittlige og relative verdier , Antall observasjoner går ned med én, d.v.s.

; .

Størrelsen på representativitetsfeilen avhenger av utvalgsstørrelsen: jo større antall observasjoner, jo mindre feil. For å vurdere påliteligheten til en prøveindikator, brukes følgende tilnærming: indikatoren (eller gjennomsnittsverdien) må være 3 ganger større enn feilen, i så fall anses den som pålitelig.

Å vite størrelsen på feilen er ikke nok til å være sikker på resultatene av en prøvestudie, siden en spesifikk feil i en prøvestudie kan være betydelig større (eller mindre) enn gjennomsnittlig representativitetsfeil. For å bestemme nøyaktigheten som en forsker ønsker å oppnå et resultat med, bruker statistikken et slikt konsept som sannsynligheten for en feilfri prognose, som er en karakteristikk av påliteligheten til resultatene fra medisinske og biologiske prøver. statistisk forskning. Vanligvis, når du utfører biomedisinske statistiske studier, er sannsynligheten for en feilfri prognose 95 % eller 99 %. I de mest kritiske tilfellene, når det er nødvendig å trekke spesielt viktige konklusjoner i teoretiske eller praktiske termer, bruk sannsynligheten for en feilfri prognose på 99,7 %

En viss verdi tilsvarer en viss grad av sannsynlighet for en feilfri prognose Marginal feil ved tilfeldig prøvetaking (Δ - delta), som bestemmes av formelen:

Δ=t * m, hvor t er en konfidens koeffisient, som med et stort utvalg og 95 % sannsynlighet for en feilfri prognose er lik 2,6; med en sannsynlighet for en feilfri prognose på 99 % - 3,0; med en sannsynlighet for en feilfri prognose på 99,7% - 3,3, og med et lite utvalg bestemmes det ved hjelp av en spesiell tabell med Students t-verdier.

Ved å bruke den marginale prøvetakingsfeilen (Δ) kan man bestemme Stol på grenser, der, med en viss sannsynlighet for en feilfri prognose, er den faktiske verdien av den statistiske mengden inneholdt , Karakteriserer hele befolkningen (gjennomsnittlig eller relativ).

For å bestemme konfidensgrenser brukes følgende formler:

1) for gjennomsnittsverdier:

Hvor Mgen er konfidensgrensene gjennomsnittsstørrelse i den generelle befolkningen;

Msample - gjennomsnittsverdi , Innhentet under en studie på en utvalgspopulasjon; t er en konfidens koeffisient, hvis verdi bestemmes av graden av sannsynlighet for en feilfri prognose som forskeren ønsker å oppnå resultatet med; mM er representativitetsfeilen til gjennomsnittsverdien.

2) for relative verdier:

Hvor Pgen er konfidensgrensene for den relative verdien i befolkningen; Rsb er en relativ verdi oppnådd når man utfører en studie på en utvalgspopulasjon; t—konfidens koeffisient; mP er representativitetsfeilen til den relative verdien.

Konfidensgrenser viser grensene som utvalgsstørrelsen kan svinge innenfor avhengig av tilfeldige årsaker.

Med et lite antall observasjoner (n<30), для вычисления доверительных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, Angir tilgjengelig antall frihetsgrader (n) , Som er lik n-1.