피셔 변환
Fisher transformation통계에서 Fisher 변환(Fisher z-변환이라고도 함)을 사용하여 변수 X와 Y 사이의 모집단 상관 계수 ρ의 값에 대한 가설을 검정할 수 있다.[1][2] 이는 변환을 표본 상관 계수에 적용할 때 결과 변수의 표본 분포가 근사적으로 정규 분포를 따르고, 분산이 기초적인 참 상관 계수의 다른 값에 비해 안정적이기 때문이다.
정의
일련의 N 이변량 검체 쌍(Xi, Yi, i = 1, …, N)에 대해, 표본 상관 계수 r은 다음과 같이 주어진다.
여기서 (X , ) 은 변수 및 과 σ {\ 사이의 공분산을 나타내는 말이다. 피셔의 r의 z 변환은 다음과 같이 정의된다.
여기서 "ln"은 자연 로그 함수, "artanh"는 역 쌍곡 탄젠트 함수다.
(X, Y) 상관 관계가 b인 이변 정규 분포를 가지고 있고 (Xii, Y) 쌍이 독립적이고 동일한 분포인 경우, z는 평균과 함께 근사적으로 정규 분포를 따른다.
여기서 N은 표본 크기, ρ은 참 상관 계수다.
이 변환과 그 역변환
표준 정상 이론과 파생을 사용하여 r에 대한 대-변수 신뢰 구간을 구성하는 데 사용할 수 있다. 부분 상관 관계에 대한 적용도 참조하십시오.
파생
Hoteling은 피셔 변환을 간결하게 유도한다.[3]
Fisher 변환을 이끌어내기 위해, r say ( 의 임의 증가함수를 고려하는 것으로 시작한다 해당 왜도 의[4] N } 확장에서 첫 번째 용어를 찾는다.
= 을(를) 설정하고 = () {\) 함수를 계산한다.
() 의 평균과 분산을 비슷하게 확장하면 attanh를 얻게 된다
그리고
각각
추가 용어는 일반적인 피셔 변환의 일부가 아니다. 의 큰 값과 의 작은 값의 경우, 역의 계산을 크게 복잡하게 하지만 최소 비용으로 큰 정확도 향상을 나타낸다. - 폐쇄형 표현식은 사용할 수 없다. 변형의 거의 일정한 분산은 그 왜도를 제거한 결과인데, 실제 개선은 추가 조건이 아니라 후자에 의해 달성된다. 추가 조건 포함:
표준 정규 분포를 가진 훌륭한 근사치를 가지고 있다.[5]
토론
Fisher 변환은 X와 Y가 이변량 정규 분포를 따를 때 r에 대한 대략적인 분산 안정화 변환이다. 이는 z의 분산이 모집단 상관 계수 ρ의 모든 값에 대해 근사적으로 일정하다는 것을 의미한다. 피셔 변환이 없으면 ρ이 1에 가까워질수록 r의 분산이 작아진다. 피셔 변환은 r < 1/2일 때 대략적으로 식별함수이므로, ρ이 너무 크지 않고 N이 너무 작지 않은 한 r의 분산이 1/N만큼 충분히 근사하다는 것을 기억하는 것이 유용할 때가 있다. 이는 이변량 정규 데이터에 대해 r의 점근 분산이 1이라는 사실과 관련이 있다.
이 변형의 행동은 피셔가 1915년에 그것을 도입한 이후 광범위하게 연구되어 왔다. 피셔 자신은 1921년 이바리테 정규 분포에서 데이터에 대한 z의 정확한 분포를 발견했고, 1951년[6] 가옌은 이바리테이트 타입 A Edgeworth 분포에서 데이터에 대한 z의 정확한 분포를 결정했다. 1953년 Hoteling은 z의 순간과 몇몇[7] 관련 통계에 대한 Taylor 시리즈 식을 계산했고 1989년 Hawkins는 한계된 네 번째 순간을 가진 분포에서 데이터에 대한 z의 점근 분포를 발견했다.[8]
Fisher 변환의 대안은 다음과[9][10] 같은 ρ에 대해 정확한 신뢰 분포 밀도를 사용하는 것이다.
기타 용도
피셔 변환은 주로 이변량 정규 관측을 위한 피어슨 제품-순간 상관 계수와 연관되지만, 더 일반적인 경우 스피어맨의 순위 상관 계수에도 적용될 수 있다.[11] 점근 분포에도 유사한 결과가 적용되지만 사소한 조정 요인이 있는 경우: 자세한 내용은 후자를 참조하십시오[clarification needed].
참고 항목
- 데이터 변환(통계)
- 메타분석(이 변환은 분산을 안정화하기 위한 메타분석에 사용된다)
- 편상관
- R 실행
참조
- ^ Fisher, R. A. (1915). "Frequency distribution of the values of the correlation coefficient in samples of an indefinitely large population". Biometrika. 10 (4): 507–521. doi:10.2307/2331838. hdl:2440/15166. JSTOR 2331838.
- ^ Fisher, R. A. (1921). "On the 'probable error' of a coefficient of correlation deduced from a small sample" (PDF). Metron. 1: 3–32.
- ^ Hotelling, Harold (1953). "New Light on the Correlation Coefficient and its Transforms". Journal of the Royal Statistical Society, Series B (Methodological). 15 (2): 193–225. doi:10.1111/j.2517-6161.1953.tb00135.x. ISSN 0035-9246.
- ^ Winterbottom, Alan (1979). "A Note on the Derivation of Fisher's Transformation of the Correlation Coefficient". The American Statistician. 33 (3): 142. doi:10.2307/2683819. ISSN 0003-1305.
- ^ Vrbik, Jan (December 2005). "Population moments of sampling distributions". Computational Statistics. 20 (4): 611–621. doi:10.1007/BF02741318.
- ^ Gayen, A. K. (1951). "The Frequency Distribution of the Product-Moment Correlation Coefficient in Random Samples of Any Size Drawn from Non-Normal Universes". Biometrika. 38 (1/2): 219–247. doi:10.1093/biomet/38.1-2.219. JSTOR 2332329.
- ^ Hotelling, H (1953). "New light on the correlation coefficient and its transforms". Journal of the Royal Statistical Society, Series B. 15 (2): 193–225. JSTOR 2983768.
- ^ Hawkins, D. L. (1989). "Using U statistics to derive the asymptotic distribution of Fisher's Z statistic". The American Statistician. 43 (4): 235–237. doi:10.2307/2685369. JSTOR 2685369.
- ^ Taraldsen, Gunnar (2021). "The Confidence Density for Correlation". Sankhya A. doi:10.1007/s13171-021-00267-y. ISSN 0976-8378.
- ^ Taraldsen, Gunnar (2020). "Confidence in Correlation". doi:10.13140/RG.2.2.23673.49769. Cite 저널은 필요로 한다.
journal=(도움말) - ^ Zar, Jerrold H. (2005). "Spearman Rank Correlation: Overview". Encyclopedia of Biostatistics. doi:10.1002/9781118445112.stat05964. ISBN 9781118445112.