각 항목이 ~개의 범주에 속하는 것으로 관찰된 N ~}개의 항목을 샘플로 시작하십시오.=( 1,,… ,) 를 각 셀에서 관측된 항목 수로 정의할 수 있다. i= = .
Next, defining a vector of parameters where: 이것들은 귀무 가설의 모수 값이다.
귀무 가설에서 관찰된 구성 의 정확한 확률은 다음과 같다.
검정의 유의성 확률은 귀무 가설이 참일 경우 관측된 데이터 집합 또는 관측된 데이터 집합보다 발생 가능성이 낮은 데이터 집합의 발생 확률이다.정확한 테스트를 사용하여 다음과 같이 계산된다.
여기서 합계는 관측된 결과보다 발생 가능성이 높거나 낮은 모든 결과에 걸쳐 있다.실제로 은 k 과( N {\이(가) 증가함에 따라 계산상 부담이 되기 때문에 아마도 작은 표본에 대한 정확한 검사만 사용할 가치가 있을 것이다.큰 표본의 경우 점근 근사치가 충분히 정확하고 계산하기가 쉽다.
이 근사치 중 하나는 우도비다.대립 가설은 각 값 을(를) 최대우도 p = .{\에 따라 정의할 수 있다. 대립 가설에서 관찰된 구성 의 정확한 확률은 다음과 같다.
(인자- 을(를) 선택하여 통계량을 무증상적으로 카이-제곱 분포로 만들며, 동일한 애플리케이션에 일반적으로 사용되는 익숙한 통계와 쉽게 비교할 수 있다.)
가설이 참일 경우 N{\이(가) 증가함에 따라 -([의 분포는 이다.은(는) - 자유도를 가진 카이-제곱으로 수렴한다.그러나 유한 표본 크기의 경우 -2 L 의 모멘트가 카이-제곱의 모멘트보다 크므로타입 I 오류의 확률(오류)이 부풀어 오른다는 것은 오래[2] 전부터 알려져 있다.카이-제곱 모멘트와 시험 통계 모멘트의 차이는 - 1.{\의 함수다.} 윌리엄스는[3] 시험 통계를 지정된 인수로 나눈 경우 첫 번째 모멘트가 - 까지 일치할 수 있음을 보여주었다.
모든 값 i 이/ 즉, 균일한 분포를 규정함)과 같다는 귀무 가설이 있는 특수한 경우, 이는 다음과 같이 단순화된다.
그 후 스미스 외 [4]연구진은 첫 번째 순간과 하는 분할 인자를 도출하여 N- 3. i의 동일한 값의 경우 이 인자는 다음과 같다.
여기서 = 는 귀무 가설에서 범주 의 예상 환자 수입니다.또한 이 통계량은 귀무 가설이 참일 때 - 1 자유도를 갖는 분포로 수렴되지만, 위에서부터 -로 변환되지 않고, 아래로부터 변환된다이(가 그렇으므로되지 않은 - 2 ([ R]) {\보다 더 나을 수 있다.개의 작은 샘플용.[citation needed]
참조
^ Read, T.R.C.; Cressie, N.A.C. (1988). Goodness-of-Fit Statistics for Discrete Multivariate Data. New York, NY: Springer-Verlag. ISBN0-387-96682-X.
^ Lawley, D.N. (1956). "A general method of approximating to the distribution of likelihood ratio criteria". Biometrika. 43: 295–303. doi:10.1093/biomet/43.3-4.295.
^ Williams, D.A. (1976). "Improved Likelihood Ratio Tests for Complete Contingency Tables". Biometrika. 63: 33–37. doi:10.1093/biomet/63.1.33.
^ Smith, P.J.; Rae, D.S.; Manderscheid, R.W.; Manderscheid, S. (1981). "Approximating the moments and distribution of the likelihood ratio statistic for multinomial goodness of fit". Journal of the American Statistical Association. American Statistical Association. 76 (375): 737–740. doi:10.2307/2287541. JSTOR2287541.