Yuden's J 통계량

Youden's J statistic

Yuden's J 통계량(Yuden's index라고도 함)은 이분법적 진단 테스트의 성능을 포착하는 단일 통계량입니다. (Bookmaker) Informationness는 다중 클래스 사례에 대한 일반화이며 정보에 입각한 결정의 확률을 추정합니다.

정의.

유든의 J 통계량은

민감도와 특수성이라는 두 가지 오른손 양으로 말입니다. 따라서 확장된 공식은 다음과 같습니다.

이 지수는 1950년[1] W. J. Yuden에 의해 진단 테스트의 성능을 요약하는 방법으로 제안되었지만, 이 공식은 일찍이 Science by C에 의해 발표되었습니다. 1884년 S. Pierce.[2] 이 값의 범위는 -1에서 1 사이이며(포함),[1] 진단 검사가 질병이 있는 그룹과 없는 그룹에 대해 동일한 비율의 양성 결과를 제공할 때 즉, 검사가 쓸모가 없는 경우 0의 값을 갖습니다. 값이 1이면 위양성 또는 위음성이 없음을 나타냅니다. 즉, 검정이 완벽합니다. 이 지수는 거짓 양의 값과 거짓 음의 값에 동일한 가중치를 부여하므로, 이 지수의 값이 같은 모든 검정은 잘못 분류된 총 결과의 비율을 동일하게 제공합니다. 이 식에서 0보다 작은 값을 얻을 수 있지만, 예를 들어 분류를 사용하면 False Positive와 False Negative만 얻을 수 있지만, 0보다 작은 값은 양의 레이블과 음의 레이블이 전환되었음을 나타냅니다. 라벨을 수정한 후 결과는 0 ~ 1 범위가 됩니다.

수신기 작동 특성 곡선의 예입니다. 빨간색 실선: ROC 곡선; 점선: 확률 수준; ROC 곡선에 대한 Yuden 지수의 수직선(J) 최대값

Yuden의 지수는 종종 수신기 작동 특성(ROC) 분석과 함께 사용됩니다.[3] 지수는 ROC 곡선의 모든 점에 대해 정의되며, 진단 테스트에서 이분법적인 결과가 아닌 수치를 제공할 때 지수의 최대값이 최적의 컷오프 지점을 선택하는 기준으로 사용될 수 있습니다. 지수는 우연선 위의 높이로 그래픽으로 표시되며, 단일 작동점이 감산한 곡선 아래의 면적과 동일합니다.[4]

Yuden's index는 deltaP'라고도 하며 이분법에서 다중 클래스 사례로 정보로 일반화합니다.[4]

단일 지수를 사용하는 것은 "일반적으로 권장되지 않는 것"[6]이지만, 정보 또는 유든 지수는 (임의적인 추측과는 달리) 정보에 입각한 결정의 확률이며 모든 예측을 고려합니다.[4]

F-score정보 검색에서 사용되는 기본 통계의 관련성이 없지만 일반적으로 사용되는 조합으로, 리콜과 정밀도의 (possibly 가중) 조화 평균이며, 여기서 리콜 = 민감도 = 진양성 비율이지만 특이도와 정밀도는 완전히 다른 측정값입니다. F-score는 리콜 및 정밀도와 마찬가지로 소위 양의 예측만을 고려하며, 리콜은 양의 등급만을 예측할 확률이고, 정밀도는 양의 예측이 정확할 확률이며, 그리고 F-점수는 양의 레이블과 의 예측이 Fleiss의 카파의 기초가 [4]되는 가정과 유사하게 동일한 분포와 유병률을 가져야 한다는 효과적인 가정 하에서 이러한 확률을 동일하게 합니다. Yuden의 J, Informedness, Recall, Precision 및 F-score는 규칙, 이론 또는 분류기가 제안한 방향으로 예측의 연역적 효과를 평가하는 것을 목표로 하는 본질적으로 방향성이 없습니다. 표식성(deltaP)은 역방향 또는 유괴 방향을 평가하는 데 사용되는 Yuden의 J이며,[4][7] 가능한 인과 관계를 모델링할 때 연관성, 규칙 및 미신에 대한 인간의 학습과 잘 일치합니다.[5] 반면 상관 관계와 카파는 양방향으로 평가합니다.

매튜스 상관 계수는 문제의 회귀 계수이중기하 평균으로, 매튜스 상관 계수의 성분 회귀 계수는 Markness(Yuden's J 또는 deltaP의 역)와 정보성(Yuden's J 또는 deltaP')입니다. Fleiss' kappaCohen's kappa와 같은 Kappa 통계량은 한계 분포 또는 이전 분포에 대한 서로 다른 가정을 기반으로 평가자신뢰도를 계산하는 방법이며, 다른 맥락에서 정확도에 대한 우연 보정 대안으로 점점 더 많이 사용됩니다. F-score와 마찬가지로 Fleiss의 카파는 두 변수가 동일한 분포에서 추출되므로 동일한 기대 유병률을 갖는다고 가정하는 반면 Cohen의 카파는 변수가 서로 다른 분포에서 추출되어 유병률이 독립적이라고 가정하는 기대 모형을 참조한다고 가정합니다.[7]

두 개의 양성 변수에 대한 실제 유병률이 Fleiss kappa 및 F-score에서 가정한 것과 같을 때, 즉 양성 예측의 수가 이분법(두 클래스) 사례의 양성 클래스의 수와 일치할 때, 서로 다른 kappa 및 상관 척도가 Yuden's J와 동일성으로 붕괴되고, 회상됩니다. 정밀도와 F-score는 정확도와 유사합니다.[4][7]

참고문헌

  1. ^ a b Youden, W.J. (1950). "Index for rating diagnostic tests". Cancer. 3: 32–35. doi:10.1002/1097-0142(1950)3:1<32::aid-cncr2820030106>3.0.co;2-3. PMID 15405679.
  2. ^ Pierce, C.S. (1884). "The numerical measure of the success of predictions". Science. 4 (93): 453–454. doi:10.1126/science.ns-4.93.453.b.
  3. ^ Schisterman, E.F.; Perkins, N.J.; Liu, A.; Bondell, H. (2005). "Optimal cut-point and its corresponding Youden Index to discriminate individuals using pooled blood samples". Epidemiology. 16 (1): 73–81. doi:10.1097/01.ede.0000147512.81966.ba. PMID 15613948.
  4. ^ a b c d e f Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Score to ROC, Informedness, Markedness & Correlation". Journal of Machine Learning Technologies. 2 (1): 37–63. hdl:2328/27165.
  5. ^ a b Perruchet, P.; Peereman, R. (2004). "The exploitation of distributional information in syllable processing". J. Neurolinguistics. 17 (2–3): 97–119. doi:10.1016/s0911-6044(03)00059-9.
  6. ^ Everitt B.S. (2002) Cambridge Dictionary of Statistics CUP ISBN 0-521-81099-X
  7. ^ a b c Powers, David M W (2012). The Problem with Kappa. Conference of the European Chapter of the Association for Computational Linguistics. pp. 345–355. hdl:2328/27160.