굿맨과 크러스칼의 감마선
Goodman and Kruskal's gamma통계에서 Goodman과 Kruskal의 감마는 순위 상관관계의 척도, 즉 각 수량별로 순위를 매겼을 때 데이터의 순서가 유사하다는 것이다.두 변수가 모두 순서형 수준에서 측정될 때 교차표 데이터의 연관성 강도를 측정한다.테이블 크기나 타이를 조정하지 않는다.값은 -1(100% 음의 연관성 또는 완전 반전)부터 +1(100% 양의 연관성 또는 완전합치)까지 다양하다.값이 0이면 연관성이 없음을 나타낸다.
이 통계량(굿맨과 크러스칼의 람다와는 구별된다)은 1954년부터 1972년까지 일련의 논문에서 이를 제안한 레오 굿맨과 윌리엄 크러스칼의 이름을 따서 명명되었다.[1][2][3][4]
정의
감마선 G의 추정치는 다음 두 가지 수량에 따라 달라진다.
- Ns, 두 변수에 대해 동일한 순서로 순위가 매겨진 사례 쌍의 수(상호 일치 쌍의 수)
- Nd, 두 변수에 대해 역순으로 순위가 매겨진 사례 쌍 수(역행 쌍의 수)
여기서 "타이" (쌍의 두 변수 중 하나가 동일한 경우)가 삭제된다.그러면
이 통계량은 이론적 수량 에 대한 최대우도 추정기로 간주할 수 있다
여기서 P와s P는d 랜덤하게 선택된 관측치 쌍이 두 변수별로 순위가 매겨졌을 때 각각 동일하거나 반대 순서로 배치될 확률이다.
감마 통계량에 대한 임계값은 때때로 근사치를 사용하여 발견된다. 여기서 변환된 값으로 통계의 t를 학생[citation needed] t 분포로 참조한다.
여기서 n은 관측치의 수(쌍의 수가 아님):
율의 Q
굿맨과 크러스칼의 감마선의 특별한 경우는 율의 Q로, 2×2 행렬에 특유한 율 계수로도 알려져 있다.[5]각 값이 사건 빈도의 카운트인 경우 다음 사건 발생 분할표를 고려하십시오.
네 | 아니요. | 합계 | |
---|---|---|---|
긍정적인 | a | b | a+b |
네거티브 | c | d | c+d |
합계 | a+c | b+d | n |
Yule의 Q는 다음과 같다.
굿맨과 크러스칼의 감마와 같은 방식으로 계산되지만 명목 척도와 서수 척도의 구분이 이분법적 구분에 대해 자의적으로 라벨을 붙이는 문제가 되기 때문에 조금 더 넓은 해석을 가지고 있다.따라서 Q가 양수인지 음수인지 여부는 분석가가 일치한다고 간주하는 쌍에 따라 달라지지만 그렇지 않으면 대칭이다.
Q는 -1에서 +1. -1은 전체 음의 연관성을 반영하고, +1은 완전한 양의 연관성을 반영하며, 0은 연관성을 전혀 반영하지 않는다.부호는 분석가가 처음에 일치한다고 간주했던 쌍에 따라 달라지지만, 이 선택은 규모에 영향을 미치지 않는다.
승산비 OR의 관점에서 Yule의 Q는 다음과 같다.
그래서 Yule의 Q와 Yule의 Y는
참고 항목
- Kendall tau 순위 상관 계수
- 굿맨과 크러스칼의 람다
- 응고 계수라고도 하는 율의 Y
참조
- ^ Goodman, Leo A.; Kruskal, William H. (1954). "Measures of Association for Cross Classifications". Journal of the American Statistical Association. 49 (268): 732–764. doi:10.2307/2281536. JSTOR 2281536.
- ^ Goodman, Leo A.; Kruskal, William H. (1959). "Measures of Association for Cross Classifications. II: Further Discussion and References". Journal of the American Statistical Association. 54 (285): 123–163. doi:10.1080/01621459.1959.10501503. JSTOR 2282143.
- ^ Goodman, Leo A.; Kruskal, William H. (1963). "Measures of Association for Cross Classifications III: Approximate Sampling Theory". Journal of the American Statistical Association. 58 (302): 310–364. doi:10.1080/01621459.1963.10500850. JSTOR 2283271.
- ^ Goodman, Leo A.; Kruskal, William H. (1972). "Measures of Association for Cross Classifications, IV: Simplification of Asymptotic Variances". Journal of the American Statistical Association. 67 (338): 415–421. doi:10.1080/01621459.1972.10482401. JSTOR 2284396.
- ^ Yule, G U. (1912). "On the methods of measuring association between two attributes" (PDF). Journal of the Royal Statistical Society. 49 (6): 579–652. JSTOR 2340126.
추가 읽기
- Sheskin, D.J. (2007) 파라메트릭 및 비모수 통계 절차 핸드북.채프먼 & 홀/CRC, ISBN 9781584888147