RV 계수
RV coefficient통계에서 RV 계수는[1] 제곱 피어슨 상관 계수의 다변량 일반화(RV 계수가 0과 1 사이의 값을 취하기 때문)[2]이다.각각 행렬로 나타낼 수 있는 두 점 집합의 근접도를 측정한다.
통계적 다변량 데이터 분석의 주요 접근방식은 모두 관련 제약조건에 따라 RV 계수가 최대화되는 공통의 프레임워크에 포함될 수 있다.특히 이러한 통계적 방법론에는 [1]다음이 포함된다.
RV 계수의 한 가지 적용은 두 피험자의 뇌 스캔[3] 시리즈 또는 동일한 피험자의 다른 스캔들 사이의 유사성을 측정할 수 있는 기능적 신경 이미지 생성에 있다.[4]
정의들
RV 효율성의 정의는 벡터 값 랜덤 변수의 "분산"과 "공분산"이라고 불리는 스칼라 값 수량의 정의에 관한 아이디어를 이용한다[5].표준 용도는 벡터 랜덤 변수의 분산 및 공분산 행렬을 갖는다는 점에 유의하십시오.이러한 혁신적인 정의에 비추어 볼 때, RV-cofficient는 통상적인 방법으로 정의된 상관 계수일 뿐이다.
X와 Y가 공분산 행렬이 제공된 중심 랜덤 벡터(열 벡터)의 행렬이라고 가정합시다.
다음으로 스칼라 값 공분산(COVV로 표시됨)을 정의한다[5].
스칼라 값 분산은 그에 따라 정의된다.
이러한 정의와 함께 분산과 공분산은 기존 벡터를 다른 벡터의 원소로 확장하여 새로운 벡터 수량의 형성과 관련하여 일정한 첨가 속성을 가진다.[5]
그 다음 RV-cofficient는 다음과[5] 같이 정의된다.
계수 및 수정 버전의 단점
계수는 구성으로 0과 1 사이의 값을 취하더라도 분모의 최대 달성 가능 값에 대해 분모가 너무 큰 경우가 많기 때문에 거의 1에 가까운 값을 획득하지 않는다.[6]
알려진 대각선 블록 및 YY}}의 크기이며 각각×q{\displaystyle q\times q}q, 일반성의 손실 없이 p≤ q{p\leq q\displaystyle}은 최대한 달성할 수 분자는 Tr(Λ XΛ YΠ),{\displaystyle \operatorname{Tr}(\Lambda _{X}\Pi \L proved[7]가 있다고 한다면×p{\displaystyle p\times p}p.amb 여기서 resp). 는 X resp)의 고유값의 대각 행렬을 나타낸다.는 가장 왼쪽 상단 모서리에서 가장 오른쪽 하단 모서리로 감소하여 정렬되었으며 and 은는) 행렬
이에 비추어, Mordant와 Segers는[7] 분모가 분자에 의해 얻을 수 있는 최대값인 RV 계수의 조정된 버전을 제안했다.라고 쓰여 있다.
이 조정의 영향은 실무에서 분명히 볼 수 있다.[7]
참고 항목
참조
- ^ a b Robert, P.; Escoufier, Y. (1976). "A Unifying Tool for Linear Multivariate Statistical Methods: The RV-Coefficient". Applied Statistics. 25 (3): 257–265. doi:10.2307/2347233. JSTOR 2347233.
- ^ Abdi, Hervé (2007). Salkind, Neil J (ed.). RV coefficient and congruence coefficient. Thousand Oaks. ISBN 978-1-4129-1611-0.
- ^ Ferath Kherif; Jean-Baptiste Poline; Sébastien Mériaux; Habib Banali; Guillaume Plandin; Matthew Brett (2003). "Group analysis in functional neuroimaging: selecting subjects using similarity measures" (PDF). NeuroImage. 20 (4): 2197–2208. doi:10.1016/j.neuroimage.2003.08.018. PMID 14683722.
- ^ Herve Abdi; Joseph P. Dunlop; Lynne J. Williams (2009). "How to compute reliability estimates and display confidence and tolerance intervals for pattern classiffers using the Bootstrap and 3-way multidimensional scaling (DISTATIS)". NeuroImage. 45 (1): 89–95. doi:10.1016/j.neuroimage.2008.11.008. PMID 19084072.
- ^ a b c d Escoufier, Y. (1973). "Le Traitement des Variables Vectorielles". Biometrics. International Biometric Society. 29 (4): 751–760. doi:10.2307/2529140. JSTOR 2529140.
- ^ Pucetti, G. (2019). "Measuring Linear Correlation Between Random Vectors". SSRN.
- ^ a b c Mordant Gilles; Segers Johan (2022). "Measuring dependence between random vectors via optimal transport,". Journal of Multivariate Analysis. 189.