샘플링 분포
Sampling distribution통계학에서 표본 분포 또는 유한 표본 분포는 주어진 랜덤 표본 기반 통계량의 확률 분포입니다.각 표본에 대해 하나의 통계량 값(예: 표본 평균 또는 표본 분산)을 계산하기 위해 여러 개의 관측치(데이터 점)를 포함하는 임의의 수의 표본을 별도로 사용한 경우 표본 분포는 통계량이 취하는 값의 확률 분포입니다.많은 상황에서 관찰되는 샘플은 1개뿐이지만 이론적으로는 샘플링 분포를 찾을 수 있습니다.
표본분포는 통계적 추론을 수행하는 과정에서 주요한 단순화를 제공하기 때문에 통계에서 중요하다.보다 구체적으로, 분석 고려사항이 모든 개별 표본 값의 공동 확률 분포보다는 통계량의 확률 분포에 기초할 수 있도록 한다.
서론
통계량의 표본분포는 크기n(\ n의 랜덤 표본에서 도출된 경우 랜덤 변수로 간주되는 해당 통계량의 분포이다. 이는 주어진 표본 크기의 동일한 모집단에서 가능한 모든 표본에 대한 통계량의 분포로 간주할 수 있다.표본 분포는 모집단의 기본 분포, 고려 중인 통계량, 사용된 표본 추출 절차 및 사용된 표본 크기에 따라 달라집니다.표본분포가 점근분포에 의해 근사될 수 있는지에 대해 종종 상당한 관심이 있는데, 이는 무한대 모집단에서 추출되어 분포를 생성하는 데 사용되는 유한 크기의 랜덤 표본의 수가 무한대인 경향이 있거나, 동일한 무한대 크기일 때 제한 사례에 해당된다."샘플"은 동일한 모집단에서 추출됩니다.
예를 들어 이(\displaystyle 이고 이 2^{인 정규 모집단을 가정합니다. 이 모집단에서 주어진 크기의 표본을 반복적으로 추출하여 각 표본에 대해 평균 x 을 계산한다고 가정합니다. 이 통계량을 표본 평균이라고 합니다.이러한 평균의 분포를 "표본 평균의 표본 추출 분포"라고 합니다.모집단 분포가 정규 분포가 아닌 경우에도 표본 분포가 정규 분포에 가까운 경우가 많지만(중앙 한계 정리 참조), 기초 모집단이 정규 분포를 따르므로 이 분포는 정규 / n {n)}(n은 표본 크기)입니다.표본 평균 대신 표본 중위수가 있습니다.동일한 모집단에서 계산하면 평균과 표본 분포가 다르며 일반적으로 정규 분포를 따르지 않습니다(그러나 표본 크기가 큰 경우에는 가까울 수 있음).
정규 분포를 갖는 모집단의 표본 평균은 가장 단순한 통계 모집단 중 하나에서 가져온 단순 통계량의 예입니다.다른 통계 및 기타 모집단의 경우 공식이 더 복잡하며, 닫힌 형태로 존재하지 않는 경우가 많다.이러한 경우, 표본 분포는 몬테카를로 시뮬레이션,[1] 부트스트랩 방법 또는 점근 분포 이론을 통해 근사될 수 있다.
표준오차
통계량 표본 분포의 표준 편차를 해당 수량의 표준 오차라고 합니다.통계량이 표본 평균이고 표본이 상관 관계가 없는 경우 표준 오차는 다음과 같습니다.
이 공식의 중요한 의미는 측정 오차의 절반(1/2)을 달성하려면 표본 크기를 4배로 해야 한다는 것입니다.비용이 요소인 통계 연구를 설계할 때, 이는 비용-편익 트레이드오프를 이해하는 역할을 할 수 있다.
통계량이 표본 총량이고 표본이 상관 관계가 없는 경우 표준 오차는 다음과 같습니다.
예
인구. | 통계 | 샘플링 분포 |
---|---|---|
표준: (, 2){ ( , \ {2} | 크기 X{\({ | n의 샘플에서 샘플 {\ { {\ {\{{^{ 표준 편차 { \}을 (를) 알 수 없는 경우, T () {\ ({\ \right) {\ { (학생의 t-displaystyledisplay 1)을 따르는 것을 할 수 .서 S는 샘플 분산이며 (\ T는 중심량이며, 분포는 \sigma에 의존하지 않습니다. |
베르누이: () { { } } | '시행 성공' 비율 X { {} } | |
두 개의 독립적인 정규 모집단: 1, 2 }^ 및 N 2,†)({}^ | 평균의 , X - 2 { { } _ {1 - { \ bar { {2} | |
밀도 f를 갖는 절대 연속 분포 F | n = 2k - 1 샘플의 중위수X () { X _ {( ) } 。여기서 은 (1) { display X _ { ( n )} ~ ( ) { X _ { ( n) } 。 | |
분포 함수 F가 있는 분포 | 크기 n의 랜덤 샘플에서 M k(\ M=\\ |
레퍼런스
- ^ Mooney, Christopher Z. (1999). Monte Carlo simulation. Thousand Oaks, Calif.: Sage. p. 2. ISBN 9780803959439.
- Merberg, A. 및 S.J. Miller(2008)."중위수의 표본 분포"입니다.수학 162: 수학 통계학, pgs 1~9.