순위 상관

Rank correlation

통계학에서 순위 상관관계순서 연관성을 측정하는 여러 통계 중 하나이다. 즉, 서로 다른 서수 변수의 순위 또는 동일 변수의 서로 다른 순위 의 관계이다. 여기서 "순위"는 특정 변수의 서로 다른 관측치에 "첫 번째", "두 번째", "세 번째" 등의 순서 레이블을 할당하는 것이다.순위 상관 계수는 두 순위 간의 유사도를 측정하여 두 순위 간의 관계의 유의성을 평가하는 데 사용할 수 있습니다.예를 들어, 순위 상관 관계를 사용하는 두 가지 일반적인 유의 비모수 방법은 Mann-Whitney U 검정Wilcoxon 부호 순위 검정입니다.

맥락

예를 들어, 한 변수가 대학 농구 프로그램의 정체성이고 또 다른 변수가 대학 축구 프로그램의 정체성이라면, 사람들은 두 가지 유형의 프로그램의 여론조사 순위 사이의 관계를 테스트할 수 있다: 더 높은 순위를 가진 대학들이 더 높은 순위를 차지하는 경향이 있는가?순위 상관 계수는 이러한 관계를 측정할 수 있으며, 순위 상관 계수의 유의성 측정은 측정된 관계가 우연일 가능성이 충분히 작은지 여부를 나타낼 수 있습니다.

만약 대학 미식축구 프로그램의 정체성이라는 변수가 하나뿐이지만, 두 개의 다른 여론조사 순위(코치와 스포츠 기자에 의한 순위)가 적용된다면, 두 개의 다른 여론조사 순위의 유사성은 순위 상관 계수에 의해 측정될 수 있다.

또 다른 예로, 열 [1]변수에 고등학교, 고등학교, 대학교없는 행 변수와 교육 수준에서 낮은 소득, 중간 소득 및 고소득있는 분할표에서 순위 상관관계는 소득과 교육 수준 간의 관계를 측정한다.

상관 계수

가장 인기 있는 순위 상관 통계는 다음과 같습니다.

  1. Spearman's »
  2. Kendall's »
  3. 굿맨과 크루스칼의 »
  4. 서머스의 D

순위 상관 계수가 증가하면 순위 간의 일치도가 증가한다는 것을 의미합니다.계수는 구간 [-1, 1] 안에 있으며 다음 값을 가정합니다.

  • 1 두 랭킹의 합치가 완벽할 경우, 두 랭킹은 동일하다.
  • 순위가 완전히 독립적인 경우 0입니다.
  • 두 순위 간의 불일치가 완벽할 경우 -1. 한 랭킹은 다른 랭킹의 역순위가 된다.

Diaconis(1988)에 이어 순위는 일련의 객체의 순열로 볼 수 있다.따라서 표본 공간이 대칭 그룹일 때(와 동일시) 얻어진 데이터로 관측 순위를 볼 수 있다.그런 다음 메트릭을 도입하여 대칭 그룹을 메트릭 공간으로 만들 수 있습니다.다른 메트릭은 다른 순위 상관관계에 대응합니다.

일반상관계수

Kendall[2] 1970은 그의 와 스피어맨의 가 일반적인 상관계수의 특별한 경우임을 보여주었다.

x)와 y로 표현되는2개의 속성과 관련하여 고려되고있는n개의 \n개의 오브젝트 가 있다고 합니다. i i \ \ { i } \ { x _ { i \ { \ n } { } \ \i { { { { of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of { i 세트를 형성하고 있습니다. n 예를 들어 i i -th와 j j 되는 x x -score와 되는y(\ y -score를 합니다.이러한 기능의 유일한 요건은 안티바이러스이므로 j - i { } = - _ { } 、 b _ { }( a i j _ { ji } ) 。 ( = b 0} )다음으로 일반화 상관계수(\ 다음과 같이 정의합니다.

로 모든 계수를 행렬 ( ) { A = ( a { } ) 및 ( i) { B ( b { }} ( A _ A { \ { T} = - } } } B } } } = 행렬로 취합하면 과 같습니다.

여기서 A, \ \ { \ { A = A , A F F \ displaystyle \ { \ { F } , _ { \ } 。특히 일반 상관계수는 B의 각도의 코사인입니다

Kendall의 ①은 특정 케이스로

i })가 xx}) yy}) 품질에 따라 ii) 의 등급인 정의할 수 있습니다.

합계 j i \ 일치 쌍의 수에서 불일치 쌍의 수를 뺀 값입니다(Kendall tau 랭크 상관계수 참조).ij2의 합은 1)/({ /({이며, 와 같습니다.이 예에서는 다음과 같습니다.

Spearman's as의 특수한 경우

i })가x) 및(\ y 품질에 따른 i(\ i 순위인 a × 할 수 있습니다정의하다

11)에서 n n까지의 범위이므로

이 식을 단순화하기 위해 d : - i { \ _ { : _ { i - _ { } 。또한 U{ U}는 {,2,, { \ {, n } \ displaystyle \ \ ldots \ ldots \ ldots } } } for i for to to to to to on on on on to to to to 。r , {\1 2, {\1, 2ldots,의 순열입니다.두 변수 모두 UU와 같이 랜덤 변수로서 볼 수 있습니다. 이산 수학의 기본적인 합계 결과를 사용하면 균일하게 분포된 랜덤 변수 U)에 대해 쉽게 알 수 있습니다. [ n+ ( \ \} [ ] =\ \ + (n + )6 ( \ \ { E } [ ^ ]) = \ { } V r ( U)(+1) -(+ ) = - ( \ \ {} ( U ) = \ { + ) { } - { ( n + 1n + 1 ) {\12 대칭을 관찰하면 다음과 같이 \Gamma 부분을 계산할 수 있습니다.

그리고.

이런 이유로

{\}=}}는 등급 간의 차이로, 정확히 Spearman의 순위 상관 계수 {\입니다.

순위-이계수 상관

진 글래스(1965년)는 순위 2진수는 스피어먼의'(\에서 도출할 수 있다고 언급했다. "이중변수인 X와 순위 변수인 Y에 정의된 계수를 도출할 수 있는데, 이는 바이저 리어의 정규변수인 피어슨 R 사이의 X와 Y 사이의 스피어맨의 Rho를 추정하는 것과 같은 방식으로 추정할 수 있다."순위-이계 상관관계는 순위가 두 그룹으로 분류될 때 순위 상관관계 척도로 9년 전에 에드워드 쿠레톤(1956)에 의해 도입되었다.

Kerby 단순 차분 공식

Dave Kerby(2014)는 일반 논리를 입문 수준에서 설명할 수 있기 때문에 학생들에게 순위 상관관계를 소개하기 위한 척도로 순위-이원제를 추천했다.랭크-바이서리얼은 Mann-Whitney U 검정과 함께 사용되는 상관관계로, 통계 입문 과정에서는 일반적으로 다루어진다.이 검정의 데이터는 두 그룹으로 구성되어 있으며, 그룹의 각 구성원에 대해 연구 전체에 대한 결과가 순위가 매겨집니다.

Kerby는 이 순위 상관관계가 두 가지 개념으로 표현될 수 있음을 보여주었습니다. 즉, 명시된 가설을 뒷받침하는 데이터의 비율과 이를 뒷받침하지 않는 데이터의 비율입니다.Kerby 단순 차이 공식은 순위 상관관계가 유리한 증거의 비율(f)에서 불리한 증거의 비율(u)을 뺀 차이로 표현될 수 있다고 말한다.

예와 해석

계산을 설명하기 위해 코치가 두 가지 방법을 사용하여 한 달 동안 장거리 주자를 훈련시킨다고 가정합니다.그룹 A에는 5명의 주자가 있고 그룹 B에는 4명의 주자가 있습니다.명시된 가설은 방법 A가 더 빠른 주자를 만든다는 것입니다.결과를 평가하기 위한 경주에서 그룹 A의 달리기 선수들은 1, 2, 3, 4, 6의 순위를 가지고 더 빨리 달리는 것으로 나타났습니다.따라서 그룹 B의 저속 주자는 5, 7, 8, 9의 순위를 가집니다.

분석은 쌍으로 수행되며, 다른 그룹의 구성원과 비교하여 한 그룹의 구성원으로 정의됩니다.예를 들어, 연구에서 가장 빨리 달리는 사람은 (1,5), (1,7), (1,8) 및 (1,9)의 네 쌍의 구성원입니다.각 쌍에서 그룹 A의 러너가 그룹 B의 러너보다 빠르기 때문에 이들 네 쌍 모두 가설을 뒷받침합니다.총 20쌍이 있으며 19쌍이 가설을 뒷받침합니다.이 가설을 뒷받침하지 않는 유일한 쌍은 5위와 6위를 차지한 두 주자들이다. 왜냐하면 이 쌍에서는 그룹 B의 주자들이 더 빨랐기 때문이다.Kerby 단순 차이 공식에 따르면 데이터의 95%가 가설을 지지하고(20쌍 중 19개) 5%가 가설을 지지하지 않으므로(20쌍 중 1개) 순위 상관 관계는 r =.95 - 0.05 = .90입니다.

상관 관계의 최대값은 r = 1이며, 이는 쌍 중 100%가 가설을 선호한다는 것을 의미합니다.r = 0의 상관 관계는 쌍의 절반은 가설을 선호하고 절반은 그렇지 않음을 나타냅니다. 즉, 표본 그룹은 순위가 다르지 않으므로 서로 다른 두 모집단에서 추출되었다는 증거는 없습니다.효과 크기가 r = 0이면 그룹 구성원과 구성원의 순위 사이에 관계가 없음을 나타낼 수 있습니다.

레퍼런스

  1. ^ Kruskal, William H. (1958). "Ordinal Measures of Association". Journal of the American Statistical Association. 53 (284): 814–861. doi:10.2307/2281954. JSTOR 2281954.
  2. ^ Kendall, Maurice G (1970). Rank Correlation Methods (4 ed.). Griffin. ISBN 9780852641996.

추가 정보

외부 링크