범위(통계)

Range (statistics)

통계학에서 데이터 집합의 범위표본 최대값과 최소값을 뺀 결과인 가장 큰 값과 가장 작은 [1]값 사이의 차이입니다.데이터와 동일한 단위로 표시됩니다.

기술 통계에서 range는 모든 데이터를 포함하는 가장 작은 간격의 크기이며 통계적 산포를 나타냅니다.관측치 중 두 개에만 의존하므로 작은 데이터 [2]집합의 산포를 표현하는 데 가장 유용합니다.

연속형 IID 랜덤 변수의 경우

누적분포함수 G(x)와 확률밀도함수 g(x)를 갖는 n개의 독립적이고 동일분포1 연속 랜덤2 변수 X, Xn, ..., X의 경우, T는 그 범위를 나타내도록 한다. 즉, T1= max2(X, Xn, ..., X)-min2(X, Xn, ..., X)-(X)-(X1, ..., X)-.

분배

범위 T에는 누적 분포[3][4] 함수가 있습니다.

굼벨은 "이 공식의 아름다움일반적으로 G(x + t)를 G(x)로 표현할 수 없다는 사실과 수치 적분이 길고 지루하다는 사실로 인해 완전히 훼손되었다"고 말한다."[3]: 385

i X의 분포가 오른쪽(또는 왼쪽)으로 제한되면 범위의 점근 분포가 가장 큰(가장 작은) 값의 점근 분포와 같습니다.보다 일반적인 분포의 경우 점근 분포는 베셀 [3]함수로 표현될 수 있습니다.

순간

평균 범위는 다음과[5] 같습니다.

여기서 x(G)는 역함수입니다.Xi 표준 정규 분포를 갖는 경우 평균 범위는 다음과 같습니다[6].

연속형 비 IID 랜덤 변수의 경우

누적 분포 함수1 G(x), G2(x), ..., Gn(x), ..., G(x) 및 확률2 밀도 함수 g(x), g(x), ..., gn(x)를1 갖는 n개의 비동일 분포 독립 연속 랜덤 변수1 X, X2, ..., Xn 경우 범위는 누적 분포 함수를 갖는다.

이산 IID 랜덤 변수의 경우

누적분포함수 G(x) 확률질량함수 g(x)를 갖는 독립적이고 동일한 분포의 이산 랜덤1 변수 X, X2, ..., Xn 범위i 분포함수 G(x)를 가진 모집단에서 n 크기의 표본 범위이다.일반성을 잃지 않고Xi 지지는 {1,2,3,N}이며, 여기서 N은 양의 정수 또는 [7][8]무한대라고 가정할 수 있다.

분배

범위에는 확률 질량[7][9][10] 함수가 있습니다.

g(x) = 1/N, 모든 x에 대한 이산 균일분포라고 가정하면 다음과[9][11] 같이 됩니다.

파생

특정 범위 값 t를 가질 확률은 t에 의해 다른 두 표본과 두 극단 사이의 값을 갖는 다른 모든 표본의 확률을 더하여 결정할 수 있습니다.1개의 샘플 값이 x일 확률은 (x ng입니다.다른 값이 x보다 클 확률은 다음과 같습니다.

다른 모든 값이 이 두 극단 사이에 있을 확률은 다음과 같습니다.

이 세 가지를 조합하면 다음과 같은 결과가 나옵니다.

관련 수량

범위는 주문 통계 정보의 구체적인 예입니다.특히, 범위는 순서 통계량의 선형 함수이므로 L-추정의 범위에 포함됩니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ George Woodbury (2001). An Introduction to Statistics. Cengage Learning. p. 74. ISBN 0534377556.
  2. ^ Carin Viljoen (2000). Elementary Statistics: Vol 2. Pearson South Africa. pp. 7–27. ISBN 186891075X.
  3. ^ a b c E. J. Gumbel (1947). "The Distribution of the Range". The Annals of Mathematical Statistics. 18 (3): 384–412. doi:10.1214/aoms/1177730387. JSTOR 2235736.
  4. ^ a b Tsimashenka, I.; Knottenbelt, W.; Harrison, P. (2012). "Controlling Variability in Split-Merge Systems". Analytical and Stochastic Modeling Techniques and Applications (PDF). Lecture Notes in Computer Science. Vol. 7314. p. 165. doi:10.1007/978-3-642-30782-9_12. ISBN 978-3-642-30781-2.
  5. ^ H. O. Hartley; H. A. David (1954). "Universal Bounds for Mean Range and Extreme Observation". The Annals of Mathematical Statistics. 25 (1): 85–99. doi:10.1214/aoms/1177728848. JSTOR 2236514.
  6. ^ L. H. C. Tippett (1925). "On the Extreme Individuals and the Range of Samples Taken from a Normal Population". Biometrika. 17 (3/4): 364–387. doi:10.1093/biomet/17.3-4.364. JSTOR 2332087.
  7. ^ a b Evans, D. L.; Leemis, L. M.; Drew, J. H. (2006). "The Distribution of Order Statistics for Discrete Random Variables with Applications to Bootstrapping". INFORMS Journal on Computing. 18: 19. doi:10.1287/ijoc.1040.0105.
  8. ^ Irving W. Burr (1955). "Calculation of Exact Sampling Distribution of Ranges from a Discrete Population". The Annals of Mathematical Statistics. 26 (3): 530–532. doi:10.1214/aoms/1177728500. JSTOR 2236482.
  9. ^ a b Abdel-Aty, S. H. (1954). "Ordered variables in discontinuous distributions". Statistica Neerlandica. 8 (2): 61–82. doi:10.1111/j.1467-9574.1954.tb00442.x.
  10. ^ Siotani, M. (1956). "Order statistics for discrete case with a numerical application to the binomial distribution". Annals of the Institute of Statistical Mathematics. 8: 95–96. doi:10.1007/BF02863574.
  11. ^ Paul R. Rider (1951). "The Distribution of the Range in Samples from a Discrete Rectangular Population". Journal of the American Statistical Association. 46 (255): 375–378. doi:10.1080/01621459.1951.10500796. JSTOR 2280515.