상관 계수
Correlation coefficient상관 계수는 어떤 유형의 상관 관계를 나타내는 수치 측정값으로, 두 변수 사이의 통계적 관계를 의미한다.[a] 변수는 종종 표본이라고 하는 특정 데이터 집합의 두 열 또는 알려진 분포가 있는 다변량 랜덤 변수의 두 성분일 수 있다.[citation needed]
몇 가지 유형의 상관 계수가 존재하며, 각 계수는 고유한 정의와 사용적합성 및 특성의 범위를 가지고 있다. 이들은 모두 -1 ~ +1 범위의 값을 가정한다. 여기서 ±1은 가능한 가장 강한 합치를 나타내고 0은 가능한 가장 강한 불일치를 나타낸다.[2] 분석 도구로서 상관 계수는 특이치에 의해 왜곡되는 일부 유형의 경향과 변수 사이의 인과관계를 추론하는 데 잘못 사용될 가능성을 포함하여 특정한 문제를 나타낸다(자세한 내용은 상관 계수가 인과 관계를 의미하지 않음 참조).[3]
종류들
데이터의 종류에 따라 데이터의 상관관계 정도에 대한 몇 가지 다른 척도가 있다: 주로 데이터가 측정인지, 순서형인지 또는 범주형인지.
피어슨
R, R 또는 Pearson의 r이라고도 하는 Pearson 제품 순간 상관 계수는 변수의 공분산을 표준 편차의 곱으로 나눈 두 변수 사이의 선형 관계의 강도 및 방향을 측정한 것이다.[4] 이것은 가장 잘 알려져 있고 가장 일반적으로 사용되는 상관 계수 유형이다. 추가 자격요건 없이 "상관 계수"라는 용어를 사용할 경우, 대개 Pearson 제품-순간 상관 계수를 가리킨다.
인트라클래스
ICC(Intraclass connective, ICC)는 그룹으로 구성된 단위에 대해 정량적 측정을 할 때 사용할 수 있는 기술 통계량이다. 이는 동일한 그룹의 단위가 얼마나 강하게 서로 닮았는지를 설명한다.
순위
순위 상관 관계는 두 변수 또는 동일한 변수의 두 순위 사이의 관계를 나타내는 척도입니다.
- 스피어맨의 순위 상관 계수는 두 변수 사이의 관계를 단조함수로 얼마나 잘 설명할 수 있는지를 나타내는 척도다.
- Kendall tau 순위 상관 계수는 두 데이터 집합 간에 일치하는 순위 부분을 측정한 것이다.
- Goodman과 Kruskal의 감마는 두 변수가 모두 순서형 수준에서 측정되었을 때 교차표 데이터 연관성의 강도를 측정한 것이다.
사차 및 다차
다핵산 상관 계수는 순서가 지정된 두 범주 변수 사이의 연관성을 측정한다. 기술적으로 다음과 같은 경우 Pearson 상관 계수의 추정치로 정의된다.
- 두 변수는 순서 범주형 변수 대신 연속적인 척도로 측정했다.
- 두 연속형 변수는 이변량 정규 분포를 따랐다.
두 변수 모두 순서 범주가 아닌 이분법적인 경우 다색상 상관 계수를 사색상 상관 계수라고 한다.
참고 항목
- 상관 해체
- 결정계수
- 상관관계와 의존성
- 상관비율
- 거리 상관 관계
- 적합도: 관측값과 모형에서 예상되는 값 사이의 차이를 요약하여 통계적 모형이 관측치를 얼마나 잘 적합시키는지 측정하는 여러 가지 측정값 중 하나
- 다중상관
- 편상관
메모들
참조
- ^ "correlation coefficient". NCME.org. National Council on Measurement in Education. Archived from the original on July 22, 2017. Retrieved April 17, 2014.
- ^ Taylor, John R. (1997). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements (PDF) (2nd ed.). Sausalito, CA: University Science Books. p. 217. ISBN 0-935702-75-X. Archived from the original (PDF) on 15 February 2019. Retrieved 14 February 2019.
- ^ Boddy, Richard; Smith, Gordon (2009). Statistical Methods in Practice: For scientists and technologists. Chichester, U.K.: Wiley. pp. 95–96. ISBN 978-0-470-74664-6.
- ^ Weisstein, Eric W. "Statistical Correlation". mathworld.wolfram.com. Retrieved 2020-08-22.