초록 진술 이야기

일반 인구 및 표본 연구. 통계적 중요성

표본은 탐색적 분석을 위해 모집단에서 특정 절차를 사용하여 채취한 데이터 세트입니다. 대표성은 전체의 아이디어를 부분적으로 재현하는 속성입니다. 즉, 부분의 개념을 이 부분을 포함하는 전체로 확장할 수 있는 가능성이다.

표본의 대표성은 표본이 해당 모집단의 특성을 완전하고 확실하게 반영해야 한다는 지표입니다. 또한 연구 목적의 관점에서 중요한 모집단의 특성을 가장 완벽하게 나타내는 표본의 특성으로 정의할 수도 있습니다.

일반 인구가 모두 학교 학생(30개 학급 900명, 각 학급 30명)이라고 가정해보자. 연구의 목적은 흡연에 대한 학생들의 태도입니다. 90명의 학생으로 구성된 표본 모집단은 각 학급에서 3명의 학생을 포함하는 동일한 90명의 학생 표본보다 훨씬 더 나쁜 전체 모집단을 나타낼 뿐입니다. 가장 큰 이유는 불평등한 연령 분포 때문이다. 따라서 첫 번째 경우에는 표본의 대표성이 낮을 것이다. 두 번째 경우 - 높음.

사회학에서는 표본에는 대표성과 비대표성이 있다고 말합니다.

대표성이 없는 표본의 예로는 1936년 미국 대통령 선거 당시 발생한 고전적인 사례가 있습니다.

이전 선거 결과를 예측하는 데 매우 성공적이었던 Literary Digest는 가입자와 전화번호부 및 자동차 등록 목록에서 선택한 응답자에게 수백만 개의 서면 질문을 보냈음에도 불구하고 이번에는 예측이 틀렸습니다. 반송된 투표용지의 1/4 중 투표는 다음과 같이 분배되었습니다. 57%는 Alf Landon이라는 공화당 후보를 선호했고, 41%는 현직 대통령인 민주당 프랭클린 루즈벨트를 선호했습니다.

실제로 F. Roosevelt가 선거에서 승리하여 거의 60%의 득표율을 얻었습니다. Literary Digest의 실수는 다음과 같습니다. 그들은 표본의 대표성을 높이고 싶었습니다. . 그리고 대부분의 가입자가 공화당원이라는 사실을 알고 있었기 때문에 전화번호부와 자동차 등록 목록에서 선택한 응답자를 포함하도록 표본을 확대하기로 결정했습니다. 그러나 그들은 기존 현실을 고려하지 않고 실제로 더 많은 공화당 지지자들을 선택했습니다. 당시 중산층과 상류층은 자동차와 전화를 가질 여유가 있었기 때문입니다. 그리고 이들은 대부분 민주당원이 아닌 공화당원이었습니다.

있다 다양한 유형샘플: 단순 무작위, 직렬, 일반, 기계 및 결합.

단순 무작위 샘플링은 시스템 없이 무작위로 연구되는 전체 단위 모집단에서 선택하는 것으로 구성됩니다.

기계적 샘플링은 일반 인구에 질서가 있을 때 사용됩니다. 예를 들어 근로자 단위, 선거인 목록, 응답자 전화번호, 아파트 및 주택 수 등 특정 순서가 있습니다.

일반적인 선택은 전체 인구를 유형별로 그룹으로 나눌 수 있는 경우에 사용됩니다. 인구와 함께 일할 때 예를 들어 교육, 연령, 사회 집단, 기업(산업 또는 별도 조직 등)을 연구할 수 있습니다.

단위를 작은 시리즈나 그룹으로 결합할 때 직렬 선택이 편리합니다. 이러한 시리즈는 완제품, 학교 수업 및 기타 그룹의 배치일 수 있습니다.

결합 샘플링에는 이전의 모든 샘플링 유형을 하나 또는 다른 조합으로 사용하는 것이 포함됩니다.

견본

견본또는 표본 모집단- 특정 절차를 사용하여 연구에 참여하기 위해 일반 모집단에서 선택한 일련의 사례(주제, 객체, 이벤트, 샘플)입니다.

샘플 특성:

  • 샘플의 질적 특성 - 우리가 정확히 누구를 선택하고 이를 위해 어떤 샘플링 방법을 사용하는지.
  • 표본의 정량적 특성 - 선택한 사례 수, 즉 표본 크기입니다.

샘플링의 필요성

  • 연구 대상은 매우 광범위합니다. 예를 들어, 글로벌 기업 제품의 소비자는 지리적으로 분산된 수많은 시장으로 대표됩니다.
  • 기본적인 정보를 수집할 필요가 있습니다.

샘플 크기

샘플 크기- 표본 모집단에 포함된 사례 수. 통계적인 이유로 사례 수는 최소 30~35개 이상인 것이 좋습니다.

종속 및 독립 표본

두 개 이상의 샘플을 비교할 때 중요한 매개변수는 종속성입니다. 두 표본의 각 사례에 대해 동형 쌍이 확립될 수 있는 경우(즉, 표본 X의 한 사례가 표본 Y의 단 하나의 사례에 해당하고 그 반대인 경우)(그리고 이러한 관계의 기초는 측정되는 특성에 중요합니다) 샘플에서) 이러한 샘플을 호출합니다. 매달린. 종속 표본의 예:

  • 쌍둥이 한 쌍,
  • 실험 노출 전후의 특성에 대한 두 가지 측정,
  • 남편과 아내
  • 등.

샘플 간에 그러한 관계가 없으면 이러한 샘플이 고려됩니다. 독립적인, 예를 들어:

따라서 종속 표본의 부피는 항상 동일하지만 독립 표본의 부피는 다를 수 있습니다.

샘플 비교는 다양한 통계 기준을 사용하여 이루어집니다.

  • 등.

대표성

표본은 대표성 또는 비대표성으로 간주될 수 있습니다.

대표성이 없는 표본의 예

  1. 서로 다른 조건에 배치된 실험군과 대조군을 대상으로 한 연구입니다.
    • 쌍별 선택 전략을 사용하여 실험군과 대조군을 대상으로 연구
  2. 하나의 그룹, 즉 실험 그룹만을 사용한 연구입니다.
  3. 혼합(요인) 설계를 사용한 연구 - 모든 그룹이 서로 다른 조건에 배치됩니다.

샘플링 유형

샘플은 두 가지 유형으로 나뉩니다.

  • 확률적인
  • 비확률적

확률 샘플

  1. 단순 확률 샘플링:
    • 간단한 리샘플링. 이러한 표본의 사용은 각 응답자가 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 일반 인구 목록을 기반으로 응답자 번호가 적힌 카드가 작성됩니다. 카드를 덱에 넣고 섞은 후 무작위로 카드를 꺼내서 숫자를 기록한 다음 다시 반환합니다. 다음으로, 필요한 표본 크기만큼 절차가 반복됩니다. 단점: 선택 단위가 반복됩니다.

단순 무작위 표본을 구성하는 절차에는 다음 단계가 포함됩니다.

1. 인구 구성원의 전체 목록을 확보하고 이 목록에 번호를 매길 필요가 있습니다. 이러한 목록, 즉 회상을 샘플링 프레임이라고 합니다.

2. 예상 표본 크기, 즉 예상 응답자 수를 결정합니다.

3. 난수표에서 필요한 샘플 단위만큼의 숫자를 추출합니다. 표본에 100명이 있어야 한다면 테이블에서 무작위로 100개의 숫자를 가져옵니다. 이러한 난수는 컴퓨터 프로그램에 의해 생성될 수 있습니다.

4. 숫자가 기록된 난수에 해당하는 관측치를 기본 목록에서 선택합니다.

  • 단순 무작위 샘플링에는 분명한 이점이 있습니다. 이 방법은 이해하기 매우 쉽습니다. 연구 결과는 연구 대상 인구 집단에 일반화될 수 있습니다. 통계적 추론에 대한 대부분의 접근 방식에는 단순 무작위 표본을 사용하여 정보를 수집하는 작업이 포함됩니다. 그러나 단순 무작위 샘플링 방법에는 최소한 네 가지 중요한 제한 사항이 있습니다.

1. 단순 무작위 샘플링을 허용하는 샘플링 프레임을 만드는 것이 어려운 경우가 많습니다.

2. 단순 무작위 샘플링으로 인해 인구가 많아지거나 지리적으로 넓은 지역에 인구가 분산되어 데이터 수집 시간과 비용이 크게 증가할 수 있습니다.

3. 단순임의추출법의 결과는 다른 확률법의 결과에 비해 정밀도가 낮고 표준오차가 더 큰 특징을 갖는 경우가 많습니다.

4. SRS를 활용한 결과, 비대표표본이 형성될 수 있다. 단순 무작위 표본 추출로 얻은 표본은 평균적으로 모집단을 적절하게 대표하지만 일부는 연구 대상 모집단을 극도로 잘못 대표합니다. 특히 표본 크기가 작을 때 이런 현상이 발생할 가능성이 높습니다.

  • 단순 비반복 샘플링. 샘플링 절차는 동일하며 응답자 번호가 있는 카드만 덱으로 반환되지 않습니다.
  1. 체계적인 확률 샘플링. 이는 단순 확률 샘플링의 단순화된 버전입니다. 일반 인구 목록을 기준으로 일정 간격(K)을 두고 응답자를 선정합니다. K 값은 무작위로 결정됩니다. 가장 신뢰할 수 있는 결과는 균일한 모집단에서 달성됩니다. 그렇지 않으면 샘플의 단계 크기와 일부 내부 순환 패턴이 일치할 수 있습니다(샘플링 혼합). 단점: 단순 확률 표본과 동일합니다.
  2. 직렬(클러스터) 샘플링. 선발 단위는 통계 계열(가족, 학교, 팀 등)입니다. 선택한 요소는 완전한 검사를 받습니다. 통계 단위의 선택은 무작위 또는 체계적 샘플링으로 구성될 수 있습니다. 단점: 일반 인구에 비해 동질성이 더 클 가능성이 있습니다.
  3. 지역 샘플링. 이질적인 모집단의 경우 선택 기술과 함께 확률 샘플링을 사용하기 전에 모집단을 동질적인 부분으로 나누는 것이 좋습니다. 이러한 샘플을 구역 샘플링이라고 합니다. 구역 설정 그룹에는 자연 지형(예: 도시 지역)과 연구의 기초를 형성하는 모든 기능이 모두 포함될 수 있습니다. 분할이 수행되는 특성을 계층화 및 구역화의 특성이라고합니다.
  4. "편의성" 샘플. "편리한" 샘플링 절차는 "편리한" 샘플링 단위(학생 그룹, 스포츠 팀, 친구 및 이웃)와의 접촉을 설정하는 것으로 구성됩니다. 새로운 개념에 대한 사람들의 반응에 대한 정보를 얻으려면 이러한 유형의 샘플링이 매우 합리적입니다. 편의 샘플링은 종종 설문지를 사전 테스트하는 데 사용됩니다.

비확률 표본

이러한 표본의 선택은 무작위성의 원칙에 따르지 않고 주관적인 기준(가용성, 전형성, 평등한 표현 등)에 따라 수행됩니다.

  1. 할당량 샘플링 - 표본은 연구 대상 특성의 할당량(비율) 형태로 일반 모집단의 구조를 재현하는 모델로 구성됩니다. 연구된 특성의 다양한 조합을 가진 표본 요소의 수는 일반 모집단에서 해당 요소의 비율(비율)에 해당하도록 결정됩니다. 예를 들어 일반 인구가 5,000명으로 구성되어 있고 그 중 2,000명이 여성이고 3,000명이 남성이라면 할당량 샘플에는 여성 20명, 남성 30명, 즉 여성 200명과 남성 300명이 있습니다. 할당량 샘플은 성별, 연령, 지역, 소득, 교육 등 인구통계학적 기준을 기반으로 하는 경우가 가장 많습니다. 단점: 일반적으로 이러한 샘플은 대표성이 없습니다. 한 번에 여러 사회적 매개변수를 고려하는 것은 불가능합니다. 장점: 쉽게 구할 수 있는 재료.
  2. 눈덩이 방식. 샘플은 다음과 같이 구성됩니다. 첫 번째 응답자부터 각 응답자에게 선택 조건에 적합하고 연구에 참여할 수 있는 친구, 동료, 지인의 연락처를 요청합니다. 따라서 첫 번째 단계를 제외하고는 연구대상자들이 직접 참여하여 표본을 구성한다. 이 방법은 접근이 어려운 응답자 그룹(예: 고소득 응답자, 동일한 직업군에 속한 응답자, 비슷한 취미/관심사를 가진 응답자 등)을 찾아 인터뷰해야 할 때 자주 사용됩니다.
  3. 자발적인 샘플링 - 소위 "처음 만나는 사람"의 샘플링입니다. 텔레비전이나 라디오 여론조사에서 자주 사용됩니다. 자발적 표본의 크기와 구성은 사전에 알려지지 않았으며 응답자의 활동이라는 하나의 매개변수에 의해서만 결정됩니다. 단점: 응답자가 어떤 인구를 대표하는지 파악하는 것이 불가능하며 결과적으로 대표성을 판단하는 것이 불가능합니다.
  4. 경로 조사 – 학습 단위가 가족일 때 자주 사용됩니다. 조사가 수행될 지역의 지도에는 모든 거리에 번호가 표시되어 있습니다. 난수 테이블(생성기)을 사용하여 큰 숫자가 선택됩니다. 각 큰 숫자는 거리 번호(첫 번째 숫자 2~3개), 집 번호, 아파트 번호의 3가지 구성 요소로 구성된 것으로 간주됩니다. 예를 들어, 숫자 14832: 14는 지도의 거리 번호, 8은 집 번호, 32는 아파트 호수입니다.
  5. 전형적인 개체를 선택하여 지역 샘플링. 구역화 후 각 그룹에서 일반적인 개체를 선택한 경우, 즉 연구에서 연구된 대부분의 특성 측면에서 평균에 가까운 개체, 이러한 샘플을 전형적인 개체를 선택하여 지역화라고 합니다.

6. 모달 샘플링. 7. 전문가 샘플링. 8. 이종 샘플.

그룹 구축 전략

참여할 그룹 선택 심리 실험내부 및 외부 타당성을 최대한 유지하는 데 필요한 다양한 전략을 통해 수행됩니다.

무작위화

무작위화, 또는 무작위 선택, 단순 무작위 샘플을 생성하는 데 사용됩니다. 이러한 표본의 사용은 모집단의 각 구성원이 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 예를 들어, 100명의 대학생을 무작위로 추출하려면 모든 대학생의 이름이 적힌 종이를 모자에 넣은 다음 그 중에서 100개의 종이를 꺼내면 무작위 선택이 됩니다(Goodwin J ., 147 페이지).

쌍별 선택

쌍별 선택- 피험자 그룹이 실험에 중요한 2차 매개변수 측면에서 동등한 피험자로 구성되는 샘플링 그룹을 구성하기 위한 전략입니다. 이 전략은 실험군과 대조군을 사용하는 실험에 효과적이며, 가장 좋은 옵션은 쌍둥이 쌍(단일 및 이란성)을 참여시키는 것입니다.

계층적 선택

계층적 선택- 계층(또는 클러스터) 할당을 통한 무작위화. 이 표본추출 방법을 통해 일반 인구를 특정 특성(성별, 연령, 정치적 선호, 교육 수준, 소득 수준 등)을 가진 그룹(계층)으로 나누고 해당 특성을 가진 대상을 선택합니다.

대략적인 모델링

대략적인 모델링- 제한된 표본을 추출하고 이 표본에 대한 결론을 더 넓은 모집단에 일반화합니다. 예를 들어, 본 연구에 대학생 2학년이 참여하여 본 연구의 데이터는 '17~21세'를 대상으로 한다. 그러한 일반화의 허용 가능성은 극히 제한적입니다.

근사 모델링은 명확하게 정의된 시스템(프로세스) 클래스에 대해 해당 동작(또는 원하는 현상)을 허용 가능한 정확도로 설명하는 모델을 형성하는 것입니다.

메모

문학

나슬레도프 A.D.수학적 방법 심리학 연구. - 상트페테르부르크: Rech, 2004.

  • Ilyasov F. N. 마케팅 조사에서 설문 조사 결과의 대표성 // 사회학 연구. 2011. No. 3. P. 112-116.

또한보십시오

  • 일부 유형의 연구에서는 샘플이 다음과 같은 그룹으로 나뉩니다.
    • 실험적인
    • 제어
  • 보병대

모래밭

  • 샘플링의 개념. 샘플의 주요 특징. 샘플링 유형

위키미디어 재단.

2010.:
  • 동의어
  • 셰프킨, 미하일 세메노비치

인구

    다른 사전에 "선택"이 무엇인지 확인하십시오.견본 - 특정 모집단을 대표하고 실험이나 연구를 위해 선택된 피험자 그룹입니다. 그 반대 개념은 일반적인 총체성(general totality)이다. 표본은 일반 모집단의 일부입니다. 실용적인 심리학자의 사전. M.: AST,... ...

    다른 사전에 "선택"이 무엇인지 확인하십시오.훌륭한 심리학 백과사전 - 표본 관찰에 포함되는 요소의 일반 모집단 부분(종종 표본 모집단이라고 하며 표본은 관찰 자체를 샘플링하는 방법입니다). 안에수학적 통계 받아들여졌다... ...

    견본기술 번역가 가이드 - (예시) 1. 전체 수량을 대표하기 위해 선택한 소량의 제품입니다. 참조: 샘플별 판매. 2. 잠재 구매자에게 소량의 상품을 제공하여 실행 기회를 제공합니다... ...

    견본비즈니스 용어 사전 - 관찰에 포함되는 요소의 일반 모집단의 일부(종종 표본 모집단이라고 하며 표본은 관찰 자체를 샘플링하는 방법입니다). 수학적 통계에서는 무작위 선택의 원칙이 채택됩니다. 이것… …

    경제 및 수학 사전- (샘플) 주요 모집단에서 요소의 하위 그룹을 무작위로 선택하며, 그 특성은 전체 모집단을 전체적으로 평가하는 데 사용됩니다. 표본 추출 방법은 전체 인구를 대상으로 조사하기에는 시간이 너무 많이 걸리거나 비용이 많이 드는 경우에 사용됩니다. 경제사전

관찰대상의 총수(사람, 가구, 기업, 정착지등), 공간과 시간이 제한된 특정 특성(성별, 연령, 소득, 수, 매출액 등)을 보유하고 있습니다. 인구의 예

  • 모스크바 전체 거주자(2002년 인구 조사에 따르면 1,060만 명)
  • 남성 백운모(2002년 인구 조사에 따르면 490만 명)
  • 러시아 법인(2005년 초 기준 220만 명)
  • 식품판매 소매점(2008년초 2만개) 등

표본(표본 모집단)

전체 인구에 대한 결론을 도출하기 위해 연구를 위해 선택된 인구의 일부입니다. 표본을 연구하여 얻은 결론이 전체 모집단으로 확장되기 위해서는 표본이 대표성의 특성을 가져야 합니다.

표본의 대표성

모집단을 정확하게 반영하는 표본의 특성입니다. 동일한 표본이 다른 모집단에 대해 대표성이 있을 수도 있고 대표성이 없을 수도 있습니다.
예:

  • 자동차를 소유한 모스크바 시민들로만 구성된 표본은 모스크바 전체 인구를 대표하지 않습니다.
  • 최대 100명의 직원을 보유한 러시아 기업 샘플이 러시아의 모든 기업을 대표하는 것은 아닙니다.
  • 시장에서 쇼핑하는 Muscovites의 샘플은 모든 Muscovites의 구매 행동을 나타내지 않습니다.

동시에 이러한 샘플(다른 조건 적용)은 자동차를 소유한 모스크바인, 러시아 중소 기업, 시장에서 구매하는 구매자를 각각 완벽하게 나타낼 수 있습니다.
표본 대표성과 표본 추출 오류는 서로 다른 현상이라는 것을 이해하는 것이 중요합니다. 대표성은 오류와 달리 표본 크기에 전혀 의존하지 않습니다.
예:
설문 조사에 참여한 자동차 소유자인 Muscovites의 수를 아무리 늘리더라도 이 샘플로 모든 Muscovites를 대표할 수는 없습니다.

샘플링 오류(신뢰 구간)

일반 인구의 실제 데이터에서 표본 관찰을 사용하여 얻은 결과의 편차입니다.
샘플링 오류에는 통계적 오류와 체계적 오류의 두 가지 유형이 있습니다. 통계적 오류는 표본 크기에 따라 다릅니다. 표본 크기가 클수록 그 값은 낮아집니다.
예:
400개 단위의 단순 무작위 표본의 경우 최대 통계 오차(95% 신뢰 수준)는 5%, 600개 단위 표본의 경우 - 4%, 1100개 단위 표본의 경우 - 3% 일반적으로 표본 추출에 대해 이야기할 때 오류는 통계적 오류를 의미합니다.
체계적 오류는 연구에 지속적으로 영향을 미치고 연구 결과를 특정 방향으로 편향시키는 다양한 요인에 따라 달라집니다.
예:

  • 확률 표본을 사용하면 활동적인 생활 방식을 선도하는 고소득층의 비율이 과소평가됩니다.
  • 이는 특정 장소(예: 집)에서 그러한 사람들을 찾는 것이 훨씬 더 어렵기 때문에 발생합니다.

응답자가 질문에 답변하기를 거부하는 문제(모스크바의 "거부자" 비율은 다양한 설문조사에서 50%~80% 범위)

경우에 따라 실제 분포가 알려지면 할당량을 도입하거나 데이터에 가중치를 다시 적용하여 체계적인 오류를 평준화할 수 있지만 대부분의 실제 연구에서는 이를 추정하는 것조차 상당히 문제가 될 수 있습니다.

샘플은 두 가지 유형으로 나뉩니다.

  • 확률적인
  • 비확률적

샘플 유형
1. 확률 표본
1.1 무작위 표본추출(단순 무작위 표본추출) 이러한 표본은 일반 모집단의 동질성, 모든 요소의 동일한 가용성 확률, 존재 여부를 가정합니다.전체 목록
모든 요소. 요소를 선택할 때 일반적으로 난수 테이블이 사용됩니다.
1.2 기계적(체계적) 샘플링
특정 특성(알파벳 순서, 전화번호, 생년월일 등)에 따라 정렬된 일종의 무작위 표본입니다. 첫 번째 요소는 무작위로 선택되고, 'n' 단계에서는 모든 'k' 요소가 선택됩니다. 이 경우 인구의 크기 – N=n*k
1.3 계층화(구역화)
인구의 이질성이 있는 경우에 사용됩니다. 일반 인구는 여러 그룹(지층)으로 나뉩니다. 각 계층에서 선택은 무작위로 또는 기계적으로 수행됩니다.
1.4 직렬(클러스터 또는 클러스터) 샘플링

연속 샘플링에서 선택 단위는 개체 자체가 아니라 그룹(클러스터 또는 중첩)입니다. 그룹은 무작위로 선택됩니다. 그룹 내의 개체는 일괄적으로 검사됩니다.
2. 비확률 표본
2.1. 할당량 샘플링
처음에는 여러 개체 그룹이 식별됩니다(예: 20~30세, 31~45세, 46~60세 남성, 소득이 최대 30,000루블이고 소득이 30~60세인 사람). 천 루블, 소득 6만 루블 이상 ) 각 그룹에 대해 검사해야 하는 개체 수가 지정됩니다. 각 그룹에 속해야 하는 객체의 수는 이전에 알려진 일반 인구 중 해당 그룹의 비율에 비례하거나 각 그룹에 대해 동일하게 설정되는 경우가 가장 많습니다. 그룹 내에서 개체는 무작위로 선택됩니다. 할당량 샘플링은 매우 자주 사용됩니다.
2.2. 눈덩이 방식
샘플은 다음과 같이 구성됩니다. 첫 번째 응답자부터 각 응답자에게 선택 조건에 적합하고 연구에 참여할 수 있는 친구, 동료, 지인의 연락처를 요청합니다. 따라서 첫 번째 단계를 제외하고는 연구 대상자 스스로가 참여하여 표본이 형성된다. 이 방법은 접근이 어려운 응답자 그룹(예: 고소득 응답자, 동일한 직업군에 속한 응답자, 비슷한 취미/관심사를 가진 응답자 등)을 찾아 인터뷰해야 할 때 자주 사용됩니다.
2.3 자발적 샘플링
가장 접근하기 쉬운 응답자가 설문조사에 참여합니다. 자발적인 표본의 전형적인 예는 자가 완성을 위해 응답자에게 제공되는 신문/잡지와 대부분의 온라인 설문조사에 있습니다. 자발적 표본의 크기와 구성은 사전에 알려지지 않았으며 응답자의 활동이라는 하나의 매개변수에 의해서만 결정됩니다.
2.4 전형적인 사례의 예
특성의 평균(전형) 값을 갖는 일반 인구의 단위가 선택됩니다. 이로 인해 특성을 선택하고 해당 특성의 일반적인 값을 결정하는 문제가 발생합니다.

통계이론 강의과정

샘플 관찰에 대한 자세한 정보는 보기를 통해 얻을 수 있습니다.

표본(Sample) - 연구에 참여하기 위해 일반 모집단 중에서 특정 절차를 사용하여 선택된 일련의 사례(주체, 대상, 사건, 표본)입니다.

샘플 크기

표본 크기는 표본 모집단에 포함된 사례 수입니다. 통계적인 이유로 사례 수는 최소 30~35개 이상인 것이 좋습니다.

종속 및 독립 표본

두 개 이상의 샘플을 비교할 때 중요한 매개변수는 종속성입니다. 두 표본의 각 사례에 대해 동형 쌍(즉, 표본 X의 한 사례가 표본 Y의 하나의 사례에 해당하고 그 반대인 경우)을 확립하는 것이 가능한 경우(그리고 이 관계의 기초는 특성에 중요합니다. 샘플에서 측정됨) 이러한 샘플을 종속 샘플이라고 합니다. 종속 표본의 예:

  1. 쌍둥이 한 쌍,
  2. 실험 노출 전후의 특성에 대한 두 가지 측정,
  3. 남편과 아내
  4. 등.

샘플 간에 그러한 관계가 없으면 이러한 샘플은 독립적인 것으로 간주됩니다. 예를 들면 다음과 같습니다.

  1. 남자와 여자,
  2. 심리학자와 수학자.
  3. 따라서 종속 표본의 부피는 항상 동일하지만 독립 표본의 부피는 다를 수 있습니다.

샘플 비교는 다양한 통계 기준을 사용하여 이루어집니다.

  • 학생의 t- 테스트
  • 윌콕슨 T-검정
  • Mann-Whitney U 테스트
  • 서명 기준
  • 등.

대표성

표본은 대표성 또는 비대표성으로 간주될 수 있습니다.

대표성이 없는 표본의 예

미국에서는 비대표성 표본 추출의 가장 유명한 역사적 사례 중 하나가 1936년 대통령 선거에서 발생합니다. 이전 여러 선거의 사건을 성공적으로 예측했던 Literary Digest는 구독자, 전국 전화번호부에서 선정된 사람들, 자동차 등록 목록에서 선정된 사람들에게 천만 장의 시험 투표용지를 발송했을 때 예측이 틀렸습니다. 반환된 투표지의 25%(거의 250만 개)에서 투표는 다음과 같이 분배되었습니다.

57%가 선호하는 공화당 후보 Alf Landon

40%가 당시 민주당 대통령이었던 프랭클린 루즈벨트를 선택했습니다.

알려진 바와 같이 실제 선거에서 루즈벨트는 60% 이상의 득표율을 얻어 승리했습니다. Literary Digest의 실수는 다음과 같습니다. 표본의 대표성을 높이고자 - 대부분의 구독자가 자신을 공화당원으로 간주한다는 것을 알고 있었기 때문에 - 전화번호부 및 등록 목록에서 선택한 사람들을 포함하도록 표본을 확장했습니다. 그러나 그들은 시대의 현실을 고려하지 않았고 실제로 더 많은 공화당 원을 모집했습니다. 대공황 동안 전화기와 자동차를 소유할 여유가 있었던 것은 주로 중산층과 상류층의 대표자들이었습니다(즉, 대부분의 공화당원들) , 민주당이 아닙니다).

샘플로부터 그룹을 구성하기 위한 계획 유형

그룹 구축 계획에는 몇 가지 주요 유형이 있습니다.

  • 서로 다른 조건에 배치된 실험군과 대조군을 대상으로 한 연구입니다.
  • 쌍별 선택 전략을 사용하여 실험군과 대조군을 대상으로 연구
  • 하나의 그룹, 즉 실험 그룹만을 사용한 연구입니다.
  • 혼합(요인) 설계를 사용한 연구 - 모든 그룹이 서로 다른 조건에 배치됩니다.

그룹 구축 전략

심리 실험에 참여할 그룹 선택은 내부 및 외부 타당성을 최대한 존중하기 위해 다양한 전략을 사용하여 수행됩니다.

  • 무작위화(무작위 선택)
  • 실제 그룹 유치

무작위화

무작위화, 또는 무작위 선택, 단순 무작위 샘플을 생성하는 데 사용됩니다. 이러한 표본의 사용은 모집단의 각 구성원이 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 예를 들어, 100명의 학생을 무작위로 표본 추출하려면 모든 대학생의 이름이 적힌 종이 조각을 모자에 넣은 다음 그 중에서 100개의 종이를 꺼내면 무작위 선택이 됩니다(Goodwin J. , 147쪽)

쌍별 선택

쌍별 선택- 피험자 그룹이 실험에 중요한 2차 매개변수 측면에서 동등한 피험자로 구성되는 샘플링 그룹을 구성하기 위한 전략입니다. 이 전략은 실험군과 대조군을 사용하는 실험에 효과적이며 최선의 선택은 참여하는 것입니다.

통계에는 연속 및 선택적이라는 두 가지 주요 연구 방법이 있습니다. 표본 연구를 수행할 때 표본 모집단의 대표성 및 충분한 수의 관찰 단위라는 요구 사항을 준수하는 것이 필수입니다. 관측단위 선택시 가능 오프셋 오류즉, 발생을 정확하게 예측할 수 없는 이벤트입니다. 이러한 오류는 객관적이고 자연스러운 것입니다. 샘플링 연구의 정확성 정도를 결정할 때 샘플링 과정에서 발생할 수 있는 오류의 양을 추정합니다. 무작위 대표성 오류() — 이는 표본 연구에서 얻은 평균 또는 상대 값과 일반 인구를 대상으로 한 연구에서 얻은 유사한 값 간의 실제 차이입니다.

연구 결과의 신뢰성을 평가하려면 다음 사항을 결정해야 합니다.

1. 대표성의 오류

2. 모집단의 평균(또는 상대) 값의 신뢰 한계

3. 평균(또는 상대) 값 간의 차이에 대한 신뢰성(t 기준에 따름)

대표성 오류 계산(mm) 산술 평균값(M):

여기서 σ는 표준편차입니다. n - 샘플 크기(>30)

대표성 오류(mР) 상대값(Р) 계산:

여기서 P는 해당 상대 값(예: %로 계산됨)입니다.

Q =100 - Ρ% - P의 역수; n - 표본 크기(n>30)

임상 및 실험 작업에서는 다음을 사용해야 하는 경우가 많습니다. 작은 샘플관측치가 30개 이하인 경우. 대표성 오류를 계산하기 위해 작은 표본으로 평균값과 상대값 모두 , 관측치 수가 1씩 감소합니다. 즉,

; .

대표성 오류의 크기는 표본 크기에 따라 달라집니다. 관찰 수가 많을수록 오류는 작아집니다. 표본 지표의 신뢰성을 평가하기 위해 다음 접근 방식이 채택됩니다. 지표(또는 평균값)는 오류보다 3배 커야 하며, 이 경우 신뢰할 수 있는 것으로 간주됩니다.

표본 연구의 특정 오류는 평균 대표성 오류보다 상당히 클(또는 작을) 수 있기 때문에 오류의 크기를 아는 것만으로는 표본 연구 결과를 확신하기에 충분하지 않습니다. 연구자가 원하는 결과의 정확성을 결정하기 위해 통계에서는 오류 없는 예측 확률과 같은 개념을 사용합니다. 이는 샘플 의학 및 생물학적 결과의 신뢰성의 특징입니다. 통계 연구. 일반적으로 생의학 통계 연구를 수행할 때 오류 없는 예측 확률은 95% 또는 99%입니다. 가장 중요한 경우, 이론적 또는 실제적 측면에서 특히 중요한 결론을 도출해야 하는 경우 오류 없는 예측 확률 99.7%를 사용합니다.

오류가 없는 예측의 어느 정도 확률은 특정 값에 해당합니다. 무작위 샘플링의 한계 오차(Δ - 델타), 이는 다음 공식에 의해 결정됩니다.

Δ=t * m, 여기서 t는 신뢰 계수이며, 큰 표본과 오류 없는 예측 확률이 95%인 경우 2.6입니다. 오류 없는 예측 확률은 99% - 3.0입니다. 99.7% - 3.3의 오류 없는 예측 확률로 작은 샘플을 사용하여 스튜던트 t 값의 특수 테이블을 사용하여 결정됩니다.

한계 샘플링 오차(Δ)를 사용하여 다음을 결정할 수 있습니다. 신뢰 경계, 이는 오류 없는 예측의 특정 확률을 포함하며, 실제 가치통계적 가치 , 전체 인구(평균 또는 친척)를 특성화합니다.

신뢰 한계를 결정하기 위해 다음 공식이 사용됩니다.

1) 평균값의 경우:

Mgen이 신뢰 한계인 경우 평균 크기일반 인구에서;

M샘플 - 평균값 , 표본 집단에 대한 연구 중에 얻은 것입니다. t는 연구자가 결과를 얻고자 하는 오류 없는 예측의 확률 정도에 따라 그 값이 결정되는 신뢰 계수입니다. mM은 평균값의 대표성 오류입니다.

2) 상대값의 경우:

여기서 Rgen은 모집단의 상대값에 대한 신뢰 한계입니다. Rsb는 표본 모집단에 대한 연구를 수행할 때 얻은 상대 값입니다. t - 신뢰도 계수; mP는 상대값의 대표성 오류입니다.

신뢰 한계는 무작위 이유에 따라 표본 크기가 변동될 수 있는 한계를 보여줍니다.

적은 수의 관측치(n<30), для вычисления довери­тельных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, 사용 가능한 자유도(n)를 나타냅니다. , 이는 n-1과 같습니다.