보조통계량
Ancillary statistic![]() |
보조 통계량은 분포(또는 pmf 또는 pdf[1])가 모형의 모수에 의존하지 않는 표본의 척도다.보조 통계량은 또한 통계인 중추적인 수량이다.예측 구간을 구성하기 위해 보조 통계를 사용할 수 있다.null
이 개념은 1920년대에 로널드 피셔에 의해 소개되었다.[1]null
예
X1, ..., X는n 독립적이며 동일한 분포로, 일반적으로 알 수 없는 기대값 μ와 알려진 분산 1로 분포한다고 가정합시다.내버려두다
표본의 평균이다null
표본 분산에 대한 다음의 통계적 조치
표본 분포는 μ 변동에 따라 변하지 않기 때문에 모든 보조 통계량이다.계산적으로, 이는 공식에서 μ 항이 취소되기 때문이다 – 분포(및 모든 표본)에 일정한 숫자를 추가하면 표본 최대값과 최소값이 같은 양만큼 변경되기 때문에 차이점이 변하지 않는다. 다른 것과 마찬가지로, 이러한 분산 측정도 위치에 따라 달라지지 않는다.null
알려진 평균 1과 알려지지 않은 차이 σ2과 반대로, 주어진 i.i.d. 정상적인 변수, 샘플은 평균 X({\displaystyle{\overline{X}}}이 아닌 보조 통계의 변화, 시료 채취 유통의 샘플 평균은 N(1, σ2/n), 하기 달려 있에 σ 2– 이 조치의 위치(특별히, 그것의 표준 오차)depe.nds분산되어null
위치 축척 패밀리
위치 분포 계열에서( 1- , - X ,…, - - n )은 보조 통계량이다.null
In a scale family of distributions, is an ancillary statistic.null
In a location-scale family of distributions, , where is the sample variance, is an ancillary statistic.[1]null
정보 복구 중
}이 불충분한 통계량이고 2 }}이 보조적인 통계량이라면 1{\ T_1}의 관측값을 조절하면서 displaystytle }을 보고함으로써 전체 데이터에 포함된 알 수 없는 파라미터에 대한 모든 정보를 복구할 수 있는 경우가 있다. 이것을 조건부 추론이라고 한다.[1]null
예를 들어 , }}:N ( ,1) N,1) 다음에 을(를) 알 수 없다고 가정합시다.로 X 1}은는) {\에는 충분하지 않지만(이러한 Fisher 정보는 1인 반면 전체 X 의 Fisher 정보는 2) 보조 통계 - 에 대해서는 추가 보고한다. 피셔 정보 2와 조인 분포를 얻는다.[1]null
보조보충제
통계 T가 충분하지 않은 경우, 보조 보완물은 보조적인 통계 U이며, 따라서 (T, U)가 충분하다.[2]직관적으로, 보조 보완자는 "누락된 정보를 추가"한다(복제하지 않음).null
이 통계량은 일반적으로 충분하지 않은 T를 최대우도 추정기로 삼는 경우에 특히 유용하다. 그런 다음 보조 보완을 요구할 수 있다.이 경우, 피셔는 정보 콘텐츠를 결정하기 위해 보조적인 보완을 조건으로 해야 한다고 주장한다. 즉, T의 피셔 정보 콘텐츠를 T의 한계점이 아니라 주어진 U: T의 조건부 배포를 고려해야 한다.보조보충이 존재하지 않아도 되고, 보조보충이 존재한다면 고유할 필요도 없고, 최대 보조보충이 존재하지도 않기 때문에 일반적으로 이것은 가능하지 않다.null
예
야구에서 스카우트가 N타수에서 타자를 관찰한다고 가정하자.(비현실적으로) 타자의 능력과 무관한 어떤 무작위적인 과정에 의해 N 숫자가 선택된다고 가정하자 – 동전이 각 타석 뒤에 던져지고 그 결과가 스카우트가 다음 타석을 보기 위해 남을지 여부를 결정한다고 하자.최종 데이터는 타수 N과 타수 X이다. 데이터(X, N)는 충분한 통계량이다.관측된 타율 X/N은 타율 N을 보고하지 못하기 때문에 데이터에서 이용 가능한 모든 정보를 전달하지 못한다(예: 타율 0.400, 매우 높은 5타수 기준 타율은 100타수 기준 0.400 평균 이상의 선수 능력에 대한 신뢰감을 어느 곳에도 불어넣지 못한다).타수 N은 부차적인 통계치인데, 그 이유는 다음과 같다.
- 관측 가능한 데이터의 일부(통계량)이며,
- 타자의 능력과 무관하게 무작위 공정에 의해 선택되었기 때문에 그것의 확률 분포는 타자의 능력에 달려 있지 않다.
이 보조 통계량은 관측된 타율 X/N에 대한 보조적인 보완 요소로서, 즉 타율 X/N은 데이터의 모든 관련 정보보다 덜 전달되지만 N과 결합하면 충분하다는 점에서 충분한 통계치가 아니다.null