사분위간 범위
Interquartile range기술 통계량에서 사분위간 범위(IQR)는 데이터의 [1]산포인 통계적 산포의 측도입니다.IQR은 미드 스프레드, 미들 50%, 네 번째 스프레드 또는 H-스프레드라고도 불립니다.이 값은 데이터의 [2][3][4]75번째 백분위수와 25번째 백분위수 간의 차이로 정의됩니다.IQR을 계산하기 위해 데이터 세트는 사분위수 또는 선형 [1]보간법을 통해 4개의 순위 짝수 부품으로 나뉩니다.이러한 사분위는 Q(하위 사분위수라고도 함), Q2(중위수) 및3 Q(상위 사분위수라고도 함)로 표시됩니다1.하위 사분위는 25번째 백분위수에 해당하고 상위 사분위는 75번째 백분위에 해당하므로 IQR = Q3 - Q1[1].
IQR은 25% 트리밍 범위로 정의되는 트리밍된 추정기의 한 예입니다. 이 예에서는 기여도가 낮은 외곽 [5]지점을 삭제하여 데이터 집합 통계의 정확도를 향상시킵니다.또한 강력한 척도[5] 척도로서도 사용됩니다. 상자 [1]그림에서 상자를 통해 명확하게 시각화할 수 있습니다.
사용하다
총 범위와 달리 사분위간 범위는 25%의 [6]분해점을 가지므로 종종 총 범위보다 선호됩니다.
IQR은 확률 분포의 단순한 그래픽 표현인 상자 그림을 작성하는 데 사용됩니다.
IQR은 기업에서 소득률을 나타내는 지표로 사용됩니다.
대칭 분포(중위수가 중위수인 1분위수와 3분위수의 평균)의 경우 IQR의 절반은 중위수 절대 편차(MAD)와 같습니다.
IQR을 사용하여 특이치를 식별할 수 있습니다(아래 참조).IQR은 데이터 집합의 [7]왜도를 나타낼 수도 있습니다.
4분위 편차 또는 반사분위 범위는 IQR의 [8][9]절반으로 정의됩니다.
알고리즘.
값 집합의 IQR은 상위 사분위수와 하위 사분위수 사이의 차이인3 Q와1 Q로 계산됩니다.각 사분위는 다음과 같이 계산된 중위수입니다[10].
짝수 2n 또는 홀수 2n+1의 값이 지정됩니다.
- 첫 번째 사분위수1 Q = n개의 가장 작은 값의 중위수
- 제3 사분위수3 Q = n개의 가장[10] 큰 값의 중위수
두 번째 사분위수2 Q는 일반 [10]중위수와 같습니다.
예
테이블 내의 데이터 세트
다음 표에는 13개의 행이 있으며 홀수 엔트리에 대한 규칙을 따르고 있습니다.
| i | x[i] | 중앙값 | 사분위수 |
|---|---|---|---|
| 1 | 7 | 문제2 = 87 (테이블 전체) | 문제1=31 (상반부, 1열부터 6열까지) |
| 2 | 7 | ||
| 3 | 31 | ||
| 4 | 31 | ||
| 5 | 47 | ||
| 6 | 75 | ||
| 7 | 87 | ||
| 8 | 115 | ||
| 문제3=119 (하반쪽, 8열부터 13열까지) | |||
| 9 | 116 | ||
| 10 | 119 | ||
| 11 | 119 | ||
| 12 | 155 | ||
| 13 | 177 |
이 표의 데이터의 경우 사분위간 범위는 IQR = Q3 - Q1 = 119 - 31 = 88입니다.
일반 텍스트 상자 그림에서 데이터 세트
+---+* -------------++---++---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+-+---+-+--+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-
이 상자 그림에 있는 데이터 세트의 경우:
- 하위 사분위수1 Q = 7
- 중위수(제2 사분위수) Q2 = 8.5
- 상위(세 번째) 사분위수3 Q = 9
- 사분위간 범위, IQR = Q3 - Q1 = 2
- 하위 1.5*IQR 수염 = Q1 - 1.5 * IQR = 7 - 3 = 4. (4에 데이터 점이 없으면 가장 낮은 점이 4보다 큽니다.)
- 상위 1.5*IQR 수염 = Q3 + 1.5 * IQR = 9 + 3 = 12. (12에 데이터 점이 없으면 12보다 작습니다.)
즉, 1.5의*IQR 수염은 길이가 일정하지 않을 수 있습니다.중위수, 최소값, 최대값 및 첫 번째 사분위수와 세 번째 사분위수가 5개 숫자 [11][12]요약을 구성합니다.
배포
연속 분포의 사분위 간 범위는 확률 밀도 함수를 통합하여 계산할 수 있습니다(누적 분포 함수를 생성함. CDF를 계산하는 다른 모든 수단도 작동합니다).하위 사분위수 Q는1 PDF의 -θ ~ Q의1 정수가 0.25인 숫자이고, 상위 사분위수3 Q는 -θ ~ Q의3 정수가 0.75인 숫자입니다. CDF의 관점에서 사분위수는 다음과 같이 정의할 수 있습니다.
여기서−1 CDF는 분위수 함수입니다.
일부 일반 분포의 사분위간 범위와 중위수는 다음과 같습니다.
| 분배 | 중앙값 | IQR |
|---|---|---|
| 보통의 | μ | 2Ω−1(0.75) ≈ 1.349 ( ( 27 / 20 ) |
| 라플라스 | μ | 2b ln (2) 1 1.386b |
| 코시 | μ | 2인치 |
사분위간 분포 정규성 검정
모집단 P의 IQR, 평균 및 표준 편차는 P가 정규 분포인지 또는 가우스 분포인지에 대한 간단한 테스트에서 사용할 수 있습니다.P가 정규 분포인 경우 1분위수 z의1 표준 점수는 -0.67이고 3분위수 z의3 표준 점수는 +0.67입니다.P에 평균 = P { {P 표준 편차 = for가 주어졌을 때 P가 정규 분포되어 있다면 제1 사분위수
그리고 제3 사분위수
제1 사분위수 또는 제3 사분위수의 실제 값이 계산된 값과 크게 다를[clarification needed] 경우 P는 정규 분포를 따르지 않습니다.그러나 정규 분포는 Q1 및 Q2 표준 점수를 0.67 및 -0.67로 유지하고 정규 분포가 아닌 경우(따라서 위의 테스트에서 잘못된 양성 반응이 발생함)에 따라 교란될 수 있습니다.Q-Q 그림과 같은 더 나은 정규성 검정이 여기에 표시됩니다.
이상치
사분위간 범위는 종종 데이터에서 특이치를 찾는 데 사용됩니다.여기서 특이치는 Q1 - 1.5 IQR보다 작거나 Q3 + 1.5 IQR보다 큰 관측치로 정의됩니다.상자 그림에서 이 한계 내에서 발생하는 최대값과 최소값은 상자의 수염(흔히 수염 끝에 추가 막대가 있음)과 특이치로 개별 점으로 표시됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ a b c d Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hen Paul; Meester, Ludolf Erwin (2005). A Modern Introduction to Probability and Statistics. Springer Texts in Statistics. London: Springer London. doi:10.1007/1-84628-168-7. ISBN 978-1-85233-896-1.
- ^ Upton, Graham; Cook, Ian (1996). Understanding Statistics. Oxford University Press. p. 55. ISBN 0-19-914391-9.
- ^ Zwilinger, D., Kokoska, S. (2000) CRC 표준 확률 및 통계 표와 공식, CRC Press.ISBN 1-58488-059-7 페이지 18.
- ^ Ross, Sheldon (2010). Introductory Statistics. Burlington, MA: Elsevier. pp. 103–104. ISBN 978-0-12-374388-6.
- ^ a b Kaltenbach, Hans-Michael (2012). A concise guide to statistics. Heidelberg: Springer. ISBN 978-3-642-23502-3. OCLC 763157853.
- ^ Rousseeuw, Peter J.; Croux, Christophe (1992). Y. Dodge (ed.). "Explicit Scale Estimators with High Breakdown Point" (PDF). L1-Statistical Analysis and Related Methods. Amsterdam: North-Holland. pp. 77–92.
- ^ Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). A Modern Introduction to Probability and Statistics. Springer Texts in Statistics. London: Springer London. doi:10.1007/1-84628-168-7. ISBN 978-1-85233-896-1.
- ^ Yule, G. Udny (1911). An Introduction to the Theory of Statistics. Charles Griffin and Company. pp. 147–148.
- ^ Weisstein, Eric W. "Quartile Deviation". MathWorld.
- ^ a b c Bertil., Westergren (1988). Beta [beta] mathematics handbook : concepts, theorems, methods, algorithms, formulas, graphs, tables. Studentlitteratur. p. 348. ISBN 9144250517. OCLC 18454776.
- ^ Tukey, J.W. "Exploratory data analysis". Addison-Wesley, Reading, 1977.
- ^ A Modern Introduction to Probability and Statistics. F.M. Dekking, C. Kraaikamp, H.P. Lopuhaä, L.E. Meester. 2005. pp. 235–237.
외부 링크
Wikimedia Commons의 사분위간 범위와 관련된 미디어