순위 상관
Rank correlation통계학에서 순위 상관관계는 순서 연관성을 측정하는 여러 통계 중 하나이다. 즉, 서로 다른 서수 변수의 순위 또는 동일 변수의 서로 다른 순위 간의 관계이다. 여기서 "순위"는 특정 변수의 서로 다른 관측치에 "첫 번째", "두 번째", "세 번째" 등의 순서 레이블을 할당하는 것이다.순위 상관 계수는 두 순위 간의 유사도를 측정하여 두 순위 간의 관계의 유의성을 평가하는 데 사용할 수 있습니다.예를 들어, 순위 상관 관계를 사용하는 두 가지 일반적인 유의 비모수 방법은 Mann-Whitney U 검정과 Wilcoxon 부호 순위 검정입니다.
맥락
예를 들어, 한 변수가 대학 농구 프로그램의 정체성이고 또 다른 변수가 대학 축구 프로그램의 정체성이라면, 사람들은 두 가지 유형의 프로그램의 여론조사 순위 사이의 관계를 테스트할 수 있다: 더 높은 순위를 가진 대학들이 더 높은 순위를 차지하는 경향이 있는가?순위 상관 계수는 이러한 관계를 측정할 수 있으며, 순위 상관 계수의 유의성 측정은 측정된 관계가 우연일 가능성이 충분히 작은지 여부를 나타낼 수 있습니다.
만약 대학 미식축구 프로그램의 정체성이라는 변수가 하나뿐이지만, 두 개의 다른 여론조사 순위(코치와 스포츠 기자에 의한 순위)가 적용된다면, 두 개의 다른 여론조사 순위의 유사성은 순위 상관 계수에 의해 측정될 수 있다.
또 다른 예로, 열 [1]변수에 고등학교, 고등학교, 대학교가 없는 행 변수와 교육 수준에서 낮은 소득, 중간 소득 및 고소득이 있는 분할표에서 순위 상관관계는 소득과 교육 수준 간의 관계를 측정한다.
상관 계수
가장 인기 있는 순위 상관 통계는 다음과 같습니다.
순위 상관 계수가 증가하면 순위 간의 일치도가 증가한다는 것을 의미합니다.계수는 구간 [-1, 1] 안에 있으며 다음 값을 가정합니다.
- 1 두 랭킹의 합치가 완벽할 경우, 두 랭킹은 동일하다.
- 순위가 완전히 독립적인 경우 0입니다.
- 두 순위 간의 불일치가 완벽할 경우 -1. 한 랭킹은 다른 랭킹의 역순위가 된다.
Diaconis(1988)에 이어 순위는 일련의 객체의 순열로 볼 수 있다.따라서 표본 공간이 대칭 그룹일 때(와 동일시) 얻어진 데이터로 관측 순위를 볼 수 있다.그런 다음 메트릭을 도입하여 대칭 그룹을 메트릭 공간으로 만들 수 있습니다.다른 메트릭은 다른 순위 상관관계에 대응합니다.
일반상관계수
Kendall[2] 1970은 그의 와 스피어맨의 가 일반적인 상관계수의 특별한 경우임을 보여주었다.
x)와 y로 표현되는2개의 속성과 관련하여 고려되고있는n개의 \n개의 오브젝트 가 있다고 합니다. i i \ \ { i } \ { x _ { i \ { \ n } { } \ \i { { { { of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of of { i 세트를 형성하고 있습니다. n 예를 들어 i i -th와 j j 는 로 되는 x x -score와 로 되는y(\ y -score를 합니다.이러한 기능의 유일한 요건은 안티바이러스이므로 j - i { } = - _ { } 、 b _ { }( a i j _ { ji } ) 。 ( = b 0} )다음으로 일반화 상관계수(\를 다음과 같이 정의합니다.
로 모든 계수를 행렬 ( ) { A = ( a { } ) 및 ( i) { B ( b { }} ( A _ A { \ { T} = - } } } B } } } = 행렬로 취합하면 과 같습니다.
여기서 A, \ \ { \ { A = A , A F F \ displaystyle \ { \ { F } , _ { \ } 。특히 일반 상관계수는 B의 각도의 코사인입니다
Kendall의 ①은 특정 케이스로
i })가 xx}) 과 yy}) 품질에 따라 ii) 의 등급인 정의할 수 있습니다.
합계 j i \ 는 일치 쌍의 수에서 불일치 쌍의 수를 뺀 값입니다(Kendall tau 랭크 상관계수 참조).ij2의 합은 1)/({ /({이며, 는 와 같습니다.이 예에서는 다음과 같습니다.
Spearman's as의 특수한 경우
i })가x) 및(\ y 품질에 따른 i(\ i 의 순위인 a † × 할 수 있습니다정의하다
와 11)에서 n n까지의 범위이므로는
이 식을 단순화하기 위해 d : - i { \ _ { : _ { i - _ { } 。또한 U{ U}는 {,2,…, { \ {, n } \ displaystyle \ \ ldots \ ldots \ ldots } } } for i for to to to to to on on on on to to to to 。r , {\는1 2, {\1, 2ldots,의 순열입니다.두 변수 모두 UU와 같이 랜덤 변수로서 볼 수 있습니다. 이산 수학의 기본적인 합계 결과를 사용하면 균일하게 분포된 랜덤 변수 U)에 대해 쉽게 알 수 있습니다. [ n+ ( \ \} [ ] =\ \ + (n + )6 ( \ \ { E } [ ^ ]) = \ { } V r ( U)(+1) -(+ ) = - ( \ \ {} ( U ) = \ { + ) { } - { ( n + 1n + 1 ) {\12 대칭을 관찰하면 다음과 같이 \Gamma의 부분을 계산할 수 있습니다.
그리고.
이런 이유로
서 {\}=}}는 등급 간의 차이로, 정확히 Spearman의 순위 상관 계수 {\입니다.
순위-이계수 상관
진 글래스(1965년)는 순위 2진수는 스피어먼의'(\에서 도출할 수 있다고 언급했다. "이중변수인 X와 순위 변수인 Y에 정의된 계수를 도출할 수 있는데, 이는 바이저 리어의 정규변수인 피어슨 R 사이의 X와 Y 사이의 스피어맨의 Rho를 추정하는 것과 같은 방식으로 추정할 수 있다."순위-이계 상관관계는 순위가 두 그룹으로 분류될 때 순위 상관관계 척도로 9년 전에 에드워드 쿠레톤(1956)에 의해 도입되었다.
Kerby 단순 차분 공식
Dave Kerby(2014)는 일반 논리를 입문 수준에서 설명할 수 있기 때문에 학생들에게 순위 상관관계를 소개하기 위한 척도로 순위-이원제를 추천했다.랭크-바이서리얼은 Mann-Whitney U 검정과 함께 사용되는 상관관계로, 통계 입문 과정에서는 일반적으로 다루어진다.이 검정의 데이터는 두 그룹으로 구성되어 있으며, 그룹의 각 구성원에 대해 연구 전체에 대한 결과가 순위가 매겨집니다.
Kerby는 이 순위 상관관계가 두 가지 개념으로 표현될 수 있음을 보여주었습니다. 즉, 명시된 가설을 뒷받침하는 데이터의 비율과 이를 뒷받침하지 않는 데이터의 비율입니다.Kerby 단순 차이 공식은 순위 상관관계가 유리한 증거의 비율(f)에서 불리한 증거의 비율(u)을 뺀 차이로 표현될 수 있다고 말한다.
예와 해석
계산을 설명하기 위해 코치가 두 가지 방법을 사용하여 한 달 동안 장거리 주자를 훈련시킨다고 가정합니다.그룹 A에는 5명의 주자가 있고 그룹 B에는 4명의 주자가 있습니다.명시된 가설은 방법 A가 더 빠른 주자를 만든다는 것입니다.결과를 평가하기 위한 경주에서 그룹 A의 달리기 선수들은 1, 2, 3, 4, 6의 순위를 가지고 더 빨리 달리는 것으로 나타났습니다.따라서 그룹 B의 저속 주자는 5, 7, 8, 9의 순위를 가집니다.
분석은 쌍으로 수행되며, 다른 그룹의 구성원과 비교하여 한 그룹의 구성원으로 정의됩니다.예를 들어, 연구에서 가장 빨리 달리는 사람은 (1,5), (1,7), (1,8) 및 (1,9)의 네 쌍의 구성원입니다.각 쌍에서 그룹 A의 러너가 그룹 B의 러너보다 빠르기 때문에 이들 네 쌍 모두 가설을 뒷받침합니다.총 20쌍이 있으며 19쌍이 가설을 뒷받침합니다.이 가설을 뒷받침하지 않는 유일한 쌍은 5위와 6위를 차지한 두 주자들이다. 왜냐하면 이 쌍에서는 그룹 B의 주자들이 더 빨랐기 때문이다.Kerby 단순 차이 공식에 따르면 데이터의 95%가 가설을 지지하고(20쌍 중 19개) 5%가 가설을 지지하지 않으므로(20쌍 중 1개) 순위 상관 관계는 r =.95 - 0.05 = .90입니다.
상관 관계의 최대값은 r = 1이며, 이는 쌍 중 100%가 가설을 선호한다는 것을 의미합니다.r = 0의 상관 관계는 쌍의 절반은 가설을 선호하고 절반은 그렇지 않음을 나타냅니다. 즉, 표본 그룹은 순위가 다르지 않으므로 서로 다른 두 모집단에서 추출되었다는 증거는 없습니다.효과 크기가 r = 0이면 그룹 구성원과 구성원의 순위 사이에 관계가 없음을 나타낼 수 있습니다.
레퍼런스
- ^ Kruskal, William H. (1958). "Ordinal Measures of Association". Journal of the American Statistical Association. 53 (284): 814–861. doi:10.2307/2281954. JSTOR 2281954.
- ^ Kendall, Maurice G (1970). Rank Correlation Methods (4 ed.). Griffin. ISBN 9780852641996.
추가 정보
- Cureton, Edward E. (1956). "Rank-biserial correlation". Psychometrika. 21 (3): 287–290. doi:10.1007/BF02289138.
- Everitt, B. S. (2002), The Cambridge Dictionary of Statistics, Cambridge: Cambridge University Press, ISBN 0-521-81099-X
- Diaconis, P. (1988), Group Representations in Probability and Statistics, Lecture Notes-Monograph Series, Hayward, CA: Institute of Mathematical Statistics, ISBN 0-940600-14-5
- Glass, Gene V. (1965). "A ranking variable analogue of biserial correlation: implications for short-cut item analysis". Journal of Educational Measurement. 2 (1): 91–95. doi:10.1111/j.1745-3984.1965.tb00396.x.
- Kendall, M. G. (1970), Rank Correlation Methods, London: Griffin, ISBN 0-85264-199-0
- Kerby, Dave S. (2014). "The Simple Difference Formula: An Approach to Teaching Nonparametric Correlation". Comprehensive Psychology. 3 (1). doi:10.2466/11.IT.3.1.
외부 링크
- 실험심리학자인 칼 L.의 간단한 안내입니다. Weunsch - 비모수 효과 크기(Copyright 2015 by Karl L).원치)