중위수 절대 편차

Median absolute deviation

통계에서 중위수 절대 편차(MAD)는 정량 데이터의 일변량 표본의 변동성에 대한 강력한 척도다. 또한 표본에서 계산된 MAD로 추정되는 모집단 모수를 참조할 수 있다.

일변량 데이터 집합 X1, X2, ..., Xn 경우 MAD는 데이터 X~= X ()

즉, 데이터 중위수의 잔차(편차)부터 시작하여 MAD는 절대값중위수가 된다.

데이터(1, 1, 2, 2, 4, 6, 9)를 고려하십시오. 중위수 값이 2이다. 약 2의 절대 편차는 (1, 1, 0, 0, 2, 4, 7)이며, 중위수는 1이다(정렬된 절대 편차는 (0, 1, 2, 4, 7)이기 때문이다). 따라서 이 데이터의 중위수 절대 편차는 1이다.

사용하다

중위 절대 편차는 통계적 산포의 척도다. 또한 MAD는 표준 편차보다 데이터 집합의 특이치에 더 탄력적인 강력한 통계량이다. 표준편차에서는 평균으로부터의 거리가 제곱되므로 큰 편차는 가중치가 더 크므로 특이치는 이에 큰 영향을 미칠 수 있다. MAD에서 소수의 특이치들의 편차는 무관하다.

MAD는 표본 분산 또는 표준 편차보다 더 강력한 척도 추정기 때문에 Cauchy 분포와 같이 평균이나 분산이 없는 분포에서 더 잘 작동한다.

표준편차와의 관계

MAD는 평균에 편차를 사용하는 방법과 유사하게 사용될 수 있다. 표준 편차 {\을(를 추정하기 위한 일관된 추정기로 MAD를 사용하기 위해서는 다음과 같이 한다

여기서 은 분포에 따라 달라지는 일정한 척도 계수.[1]

정규 분포 k 의 경우

즉, 변위치 기능의 역수− 1{\displaystyle\Phi ^{)}}(또한 누적 분포 함수의 역으로 알려져)표준 정규 분포에 Z)(X− μ)/σ{Z=(X-\mu)/\sigma\displaystyle}.[2][3]그 논쟁 3/4은 그렇게는±위{\displaystyle\pm \operatorname{위}}Φ. 커버s 표준 정규 누적 분포 함수의 50%( 1/4 ~ 3/4)

그러므로 우리는 그것을 가져야 한다.

그것을 알아차리다.

we have that , from which we obtain the scale factor .

관계를 설정하는 또 다른 방법은 MAD가 반 정규 분포 중위수와 동일하다는 것이다.

이 양식은 예를 들어 발생 가능한 오류에 사용된다.

기하 중위수 절대 편차

다변량 데이터의 중위수기하학적 중위수에 일반화되는 방법과 유사하게, MAD를 일반화하는 기하학적 MAD를 구성할 수 있다. 2차원 쌍으로 구성된 데이터 집합(X1,Y1), (X2,Y2),..., (Xn,) 및 적절하게 계산된 기하학적 중위수 ~, Y~를 지정하면 다음과 같이 기하학적 중위수 절대 편차가 주어진다

이것은 일변량 MAD와 동일한 결과를 1차원에서 제공하며 더 높은 차원으로 쉽게 확장된다. 복합값(X+iY)의 경우 정규 분포 데이터의 경우 MAD와 표준 편차의 관계는 변하지 않는다.

인구 MAD

모집단 MAD는 표본 MAD와 유사하게 정의되지만 표본보다는 완전한 분포를 기초로 한다. 평균이 0인 대칭 분포의 경우 모집단 MAD는 분포의 75번째 백분위수가 된다.

무한할 수도 있고 정의되지 않을 수도 있는 분산과 달리 모집단 MAD는 항상 유한한 숫자다. 예를 들어 표준 Cauchy 분포는 정의되지 않은 분산을 가지지만 MAD는 1이다.

MAD의 개념에 대한 가장 일찍 알려진 언급은 1816년 칼 프리드리히 가우스의 논문에서 수치 관측의 정확성 결정에 관한 것이었다.[4][5]

참고 항목

메모들

  1. ^ Rousseeuw, P. J.; Croux, C. (1993). "Alternatives to the median absolute deviation". Journal of the American Statistical Association. 88 (424): 1273–1283. doi:10.1080/01621459.1993.10476408. hdl:2027.42/142454.
  2. ^ Ruppert, D. (2010). Statistics and Data Analysis for Financial Engineering. Springer. p. 118. ISBN 9781441977878. Retrieved 2015-08-27.
  3. ^ Leys, C.; et al. (2013). "Detecting outliers: Do not use standard deviation around the mean, use absolute deviation around the median" (PDF). Journal of Experimental Social Psychology. 49 (4): 764–766. doi:10.1016/j.jesp.2013.03.013.
  4. ^ Gauss, Carl Friedrich (1816). "Bestimmung der Genauigkeit der Beobachtungen". Zeitschrift für Astronomie und Verwandte Wissenschaften. 1: 187–197.
  5. ^ Walker, Helen (1931). Studies in the History of the Statistical Method. Baltimore, MD: Williams & Wilkins Co. pp. 24–25.

참조