굿맨과 크러스칼의 감마선

Goodman and Kruskal's gamma

통계에서 Goodman과 Kruskal의 감마순위 상관관계의 척도, 즉 각 수량별로 순위를 매겼을 때 데이터의 순서가 유사하다는 것이다.변수가 모두 순서형 수준에서 측정될 때 교차표 데이터의 연관성 강도를 측정한다.테이블 크기나 타이를 조정하지 않는다.값은 -1(100% 음의 연관성 또는 완전 반전)부터 +1(100% 양의 연관성 또는 완전합치)까지 다양하다.값이 0이면 연관성이 없음을 나타낸다.

이 통계량(굿맨과 크러스칼의 람다와는 구별된다)은 1954년부터 1972년까지 일련의 논문에서 이를 제안한 레오 굿맨윌리엄 크러스칼의 이름을 따서 명명되었다.[1][2][3][4]

정의

감마선 G의 추정치는 다음 두 가지 수량에 따라 달라진다.

  • Ns, 두 변수에 대해 동일한 순서로 순위가 매겨진 사례 쌍의 수(상호 일치 쌍의 수)
  • Nd, 두 변수에 대해 역순으로 순위가 매겨진 사례 쌍 수(역행 쌍의 수)

여기서 "타이" (쌍의 두 변수 중 하나가 동일한 경우)가 삭제된다.그러면

이 통계량은 이론적 수량 에 대한 최대우도 추정기로 간주할 수 있다

여기서 Ps Pd 랜덤하게 선택된 관측치 쌍이 두 변수별로 순위가 매겨졌을 때 각각 동일하거나 반대 순서로 배치될 확률이다.

감마 통계량에 대한 임계값은 때때로 근사치를 사용하여 발견된다. 여기서 변환된 값으로 통계의 t학생[citation needed] t 분포로 참조한다.

여기서 n은 관측치의 수(쌍의 수가 아님):

율의 Q

굿맨과 크러스칼의 감마선의 특별한 경우는 율의 Q로, 2×2 행렬에 특유한 율 계수로도 알려져 있다.[5]각 값이 사건 빈도의 카운트인 경우 다음 사건 발생 분할표를 고려하십시오.

아니요. 합계
긍정적인 a b a+b
네거티브 c d c+d
합계 a+c b+d n

Yule의 Q는 다음과 같다.

굿맨과 크러스칼의 감마와 같은 방식으로 계산되지만 명목 척도와 서수 척도의 구분이 이분법적 구분에 대해 자의적으로 라벨을 붙이는 문제가 되기 때문에 조금 더 넓은 해석을 가지고 있다.따라서 Q가 양수인지 음수인지 여부는 분석가가 일치한다고 간주하는 쌍에 따라 달라지지만 그렇지 않으면 대칭이다.

Q는 -1에서 +1. -1은 전체 음의 연관성을 반영하고, +1은 완전한 양의 연관성을 반영하며, 0은 연관성을 전혀 반영하지 않는다.부호는 분석가가 처음에 일치한다고 간주했던 쌍에 따라 달라지지만, 이 선택은 규모에 영향을 미치지 않는다.

승산비 OR의 관점에서 Yule의 Q는 다음과 같다.

그래서 Yule의 QYule의 Y는

참고 항목

참조

  1. ^ Goodman, Leo A.; Kruskal, William H. (1954). "Measures of Association for Cross Classifications". Journal of the American Statistical Association. 49 (268): 732–764. doi:10.2307/2281536. JSTOR 2281536.
  2. ^ Goodman, Leo A.; Kruskal, William H. (1959). "Measures of Association for Cross Classifications. II: Further Discussion and References". Journal of the American Statistical Association. 54 (285): 123–163. doi:10.1080/01621459.1959.10501503. JSTOR 2282143.
  3. ^ Goodman, Leo A.; Kruskal, William H. (1963). "Measures of Association for Cross Classifications III: Approximate Sampling Theory". Journal of the American Statistical Association. 58 (302): 310–364. doi:10.1080/01621459.1963.10500850. JSTOR 2283271.
  4. ^ Goodman, Leo A.; Kruskal, William H. (1972). "Measures of Association for Cross Classifications, IV: Simplification of Asymptotic Variances". Journal of the American Statistical Association. 67 (338): 415–421. doi:10.1080/01621459.1972.10482401. JSTOR 2284396.
  5. ^ Yule, G U. (1912). "On the methods of measuring association between two attributes" (PDF). Journal of the Royal Statistical Society. 49 (6): 579–652. JSTOR 2340126.

추가 읽기

  • Sheskin, D.J. (2007) 파라메트릭비모수 통계 절차 핸드북.채프먼 & 홀/CRC, ISBN 9781584888147