중심 한계 정리

Central limit theorem

확률론에서, 중심 한계 정리(CLT)는 많은 상황에서, 독립적 랜덤 변수들이 합산될 때, 원래 변수들이 정규 분포를 따르지 않더라도 그들의 적절한 정규화 합계가 정규 분포를 지향하는 경향이 있다는 것을 증명한다.

정리는 정규 분포에 적용되는 확률론적 및 통계적 방법이 다른 유형의 분포와 관련된 많은 문제에 적용될 수 있다는 것을 의미하기 때문에 확률 이론의 핵심 개념이다.

이 정리는 확률론의 공식적인 발전 동안 많은 변화를 보아왔다.이 정리의 이전 버전은 1811년으로 거슬러 올라가지만, 현대의 일반적인 형태에서, 확률 이론의 이 근본적인 [1]결과는 1920년까지 정확하게 언급되었고, 따라서 고전과 현대 확률 이론 사이의 가교 역할을 했습니다.

1, 2, },n},\}가 전체 μ, 유한 분산(\ 모집단에서 무작위로 추출된 샘플인 , X \textstyle \sigma }}(\ {\textstyle })인 경우 n개의 표본을 추출한 다음 분포의 제한 인 Z n ( - ¯ X ){\ Z = \ _ \infty }{\ {\light {\ {\{\bar {\bar {\}}}}}}}, {\climu}}, {\climu}}}}}}ndard 정규 [2]분포

예를 들어, 많은 관측치를 포함하는 표본을 얻고, 각 관측치가 다른 관측치의 값에 의존하지 않는 방식으로 랜덤하게 생성되며, 관측치의 산술 평균이 계산된다고 가정합니다.이 절차를 여러 번 수행하면 중앙 한계 정리는 평균의 확률 분포가 정규 분포에 근접할 것이라고 말합니다.간단한 예로는 동전을 여러 번 던지면 주어진 앞면이 나올 확률이 정규 분포에 근접하며 평균은 총 던지기 횟수의 절반에 해당합니다.무한 플립 횟수의 한계에서는 정규 분포와 동일합니다.

중심 한계 정리는 몇 가지 변형을 가지고 있다.일반적인 형태에서는 랜덤 변수가 동일하게 분포되어야 합니다.변종에서 평균에서 정규 분포로의 수렴은 동일하지 않은 분포 또는 특정 조건을 준수하는 경우 독립적이지 않은 관측치에 대해서도 발생합니다.

정규 분포를 이항 분포에 대한 근사치로 사용할 수 있는 이 정리의 가장 이른 버전은 드 모이브르-라플라스 정리이다.

독립 시퀀스

합계에 의해 "평활화"되는 분포로, 분포의 원래 밀도와 세 개의 후속 합계를 나타냅니다. 자세한 내용은 중심 한계 정리의 그림을 참조하십시오.
모집단 분포의 형태에 관계없이 표본 분포는 가우스 분포를 따르며, 그 분산은 중심 한계 [3]정리에 의해 주어진다.

클래식 CLT

Let be a sequence of random samples — that is, a sequence of independent and identically distributed (i.i.d.) random variables drawn from a distribution of expected value given by and finite variance given by ma 표본 평균에 관심이 있다고 합니다.

숫자의 법칙에 따라 표본 평균은 n \ \ n \ \ μ {\ \} 로 거의 확실하게 수렴된다(따라서 확률적으로 수렴된다).

고전적인 중심 한계 정리는 이 수렴 동안 결정론적 μ(\ 주변의 확률적 변동의 크기와 분포 형태를 설명한다.보다 정확하게는 n n 샘플 Xn { μ textstyle \의 차이 분포가 n{\ n(n -)에 곱한 값이다.style mu은 평균이 0이고 2(\^{정규 분포에 가깝습니다.n이 충분히 클 경우 X n(\n}_})의 분포는 및 분산의 정규 분포에 가깝습니다

이 정리의 유용성은 분포 형태에 관계없이 nn - {\textstyle 분포가 정규에 근접한다는 것이다.정리는 다음과 같이 기술할 수 있다.

린데버그레비 CLT —{X1,…, Xn.}{\textstyle\와 같이{X_{1},\ldots ,X_{n},\ldots)}}은 i.i.d. 확률 변수의 E[X나는])μ{\textstyle \mathbb{E}[X_{나는}]=\mu}과 바르([X나는])σ 2<∞{\textstyle \operatorname{바르}[X_{나는}]=\sigma ^{2}<, \infty}과 시퀀스. 그런 다음 n{\textst.yle n} 무한대에 가까워지면 랜덤 nn - {\ N 2){[4]분포가 수렴됩니다.

경우 σ>0{\textstyle \sigma>0}, 유통의 통합으로는 n(Xn− ¯ μ){\textstyle{\sqrt{n}}({\bar{X}}_{n}-\mu)의 누적 분포 기능}pointwise은 N(0,2σ){\textstyle{{N\mathcal}}(0,\sigma ^{2})의 누적 분포 함수에}ev의 배포: 모인다는 것을 의미한다.ery 레al z \ z

여기서 ( ){z {z에서 평가되는 표준 정규 CDF입니다.컨버전스는 z{\ z 균일합니다.
서 sup [5]세트의 최소 상한(또는 최고)을 나타냅니다.

랴푸노프 CLT

이 정리는 러시아 수학자 알렉산드르 랴푸노프의 이름을 따왔다.이 변종 중심 한계 정리에서는 랜덤 i X_})는 독립적이어야 하지만 반드시 동일한 분포를 보이지는 않습니다.또한 이 정리에서는 Xi}\right 모멘트가(+이어야 하며, 이러한 모멘트의 성장률은 아래에 제시된 랴푸노프 조건에 의해 제한되어야 한다.

Lyapunov CLT[6] : { X , , , { \ { _ { , \, X { , \\ } )는 각각 유한한 i {\ _} 및 분산 {} {i}{된 랜덤 변수입니다

> { \> } 의 경우, Lyapunov 상태는

만족하면 X - i \ { X { } - \ _ { } { s { }}}의 합계가 표준 정규 랜덤 변수로 수렴됩니다( n) 。

실제로는 { textstyle \ 의 랴푸노프의 상태를 확인하는 것이 가장 쉽습니다.

만약 일련의 랜덤 변수가 랴푸노프의 조건을 만족시킨다면, 그것은 린데버그의 조건도 만족시키는 것이다.그러나 그 반대의 의미는 유지되지 않는다.

린데버그 CLT

위와 같은 설정 및 표기법에서는 다음과 같은 약한 조건(1920년 Lindeberg에서)으로 리아푸노프 조건을 대체할 수 있습니다.

> { \ > }마다 다음과 같이 가정합니다.

서 1{ {\1} _\}}은 표시기 함수입니다.그리고 표준화된 합계의 분포는
는 표준 (, )(\textstyle (0, 1을 향해 수렴됩니다.

다차원 CLT

특성 함수를 사용하는 증명은 각 k(\에서 벡터 E [ {xf인 경우로 확장할 수 있다. (벡터의 성분 중) 및 이러한 랜덤 벡터는 독립적이며 균등하게 분포되어 있습니다.이들 벡터의 합계는 성분별로 이루어집니다.다차원 중심 한계 정리는 크기가 조정될 때 합계가 다변량 정규 [7]분포로 수렴된다는 것을 나타냅니다.

허락하다

K자형이다. i\ 굵은 글씨는 랜덤(단변수) 변수가 아닌 랜덤 벡터임을 의미합니다.그러면 랜덤 벡터의 합은
평균은
그렇기 때문에

다변량 중심 한계 정리는 다음과 같이 기술합니다.

여기서 공분산행렬(\style 다음과 같습니다.

컨버전스 속도는 다음 Berry-Esseen 유형 결과에 의해 결정됩니다.

: 1, 평균 0을 갖는 독립된 R 값 랜덤 벡터입니다.S i X { S=\ _}}라고 [ {= \ [ }는 반전이라고 가정합니다.~ ( , { Z \ { { n0 , \ Sigma) beS s s s let let let letlet let let let let \ } ( 0 , \ Sigma )가우스 이라고 .이 모든 볼록 U \

서 C C 보편 상수입니다. i n [ 1/ 3](\\ _ i}^{ \ [ \ \ \ ^ { 1 - / 2 x } _ 2 \ i _ )^{d

d1 d [9]필요한지 여부는 불분명합니다.

일반화 정리

중심 한계 정리는 유한 분산을 갖는 다수의 독립적이고 동일한 분포의 랜덤 변수의 합이 변수의 수가 증가함에 따라 정규 분포를 따르는 경향이 있음을 나타냅니다.Gnedenko과 콜모고로프로 인한 일반화 국가들은 확률 변수의 0&lt을 바로 멱함수 꼬리(Paretian 꼬리)하는 것은 xα − 1{\textstyle{)}^{-\alpha)}− 감소하고}과 숫자였을 것이다;α<>2{0<, \alpha<>2\textstyle}(며 따라서 무한한 분산을)의 액수 sta기 쉬울 것이다.distribblef ( ; 0 f [10][11]α> 2)인 경우, 합계는 안정성 파라미터가 2인 안정적인 분포, 즉 가우스 [12]분포로 수렴됩니다.

종속 프로세스

의존도가 낮은 CLT

독립적이고 동일한 분포의 랜덤 변수 시퀀스의 유용한 일반화는 이산 시간에서의 혼합 랜덤 프로세스입니다. "혼합"은 대략적으로 서로 시간적으로 멀리 떨어져 있는 랜덤 변수가 거의 독립적이라는 것을 의미합니다.에르고드 이론과 확률 이론에는 여러 종류의 혼합이 사용된다.α( ) { )\0 으로 강혼합(α-mixing이라고도 함)을 참조한다. (n ) { ( n )는 이른바 강혼합계수이다.

강한 혼합 하에서의 중심 한계 정리의 간단한 공식은 다음과 같습니다.[13]

— { , n {\{\} {\= ( -) { _ { n ( n -) \ } \{))))))))))) α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α α { \ \ } [ { _ { } ^{ } < \ n 1+ + \ S _ { n } + \ + _ { } 를 나타냅니다.

이 경우 0이면 {)N(01)으로됩니다

실은.

여기서 시리즈가 완전히 수렴됩니다.

n n - - { 에 대해 점근 정규성이 실패하므로 가정 0 { \ 0}을 생략할 수 없다. Y_{은 다른 고정 시퀀스입니다.

그 정리에 대한 뚜렷한 버전:[14]이 E[Xn12]<>∞{\textstyle \mathbb{E}\left[{X_{n}}^{12}\right]<, \infty}E[Xn2+δ]<>로 대체됩니다;∞{\textstyle \mathbb{E}\left[{\left X_{n}\right}^{2+\delta}\right]<, \infty}, 그리고 가정 α n= 있다.O(n− 5 _(는) 다음과 같이 치환됩니다

이러한> 0 { > } 이 존재하면 결론에 도달합니다.혼합 조건에서의 한계 정리에 대한 백과사전적 처리는 (Bradley 2007)을 참조한다.

마티게일 차분 CLT

정리 - n { _ { n} theorem theorem

  • n n[ ( ( - -) 1, , - 1 ] { { { { \ _ { k=}^{ \ { E \ [ \ ( M _ { } - M - 1 } { k - 1 { k - 1 }^2
  • 0 > 1 E[ ( M - k -1) [ - > ] ( \ \} \ _ { }^{ } { \ \{ E } _ { K _ { K - 1} )

(는) NN( n n n[15][16]})으로 수렴합니다.

언급

Classical CLT

중심 한계 정리는 특성 [17]함수를 사용하여 증명합니다.그것은 대수의 법칙을 증명하는 것과 유사하다.

1, , , ... { \ _ {1} , , X _ { , \ 각각 {\ } 및 유한 분산 \ \sigma ^ {의 독립된 동일한 분산 랜덤 변수라고 가정합니다. 1+ + ( \ _ { + \ + _ { )의 이고 은 n 2입니다(\textstyle ^ {2}) 。랜덤 변수를 고려합니다.

여기서 마지막 단계에서 각각 0 평균 및 분산(var ( ) \ {} = \ textstyle \ { } 1 )의 변수 X -μ { 를 정의했습니다. 함수는 다음과 같습니다.
마지막 단계에서는 모든 Y_})가 동일한 분포를 보인다는 사실을 사용했습니다.특징적인 함수는 테일러의 정리에 따르면
o ( /) { o ( {2} }는 t /보다 빨리 으로 가는 { t 일부 함수에 대해 "작은 o 표기법"입니다. 함수( x → n1+ ) e } {x {x }}), 함수는 다음과 같습니다.

모든 고차 항은 n {\ n에서사라집니다. 오른쪽은 정규 N(0 )의 특성 함수입니다. 이는 ZN의 분포가 한다는 Levy의 연속성 정리를 통해 암시합니다., N(0(는) n {\ \ \ to \ } 。따라서 샘플 평균은

그런 것이다
는 중심 한계 정리가 정규 N(0 1) N(0)로 수렴됩니다.

한계값으로의 컨버전

중심 한계 정리는 점근 분포만 제공한다.제한된 수의 관측치에 대한 근사치로서 정규 분포의 정점에 가까울 때만 합리적인 근사치를 제공합니다. 꼬리까지 [citation needed]확장하려면 매우 많은 수의 관측치가 필요합니다.

한계 누적 분포 함수가 연속적이기 때문에 중심 한계 정리의 수렴은 균일합니다.세 번째 중심 Eδ[ ( - ) \ } \ left [ (1} - \} \ right]}가 존재하고 유한하다면 수렴 속도는 적어도 1/ 1 {n 됩니다(정리 참조).스타인의 방법[18] 중심 한계 정리를 증명하는 데 사용될 수 있을 뿐만 아니라 선택된 [19]메트릭에 대한 수렴 비율에 대한 경계를 제공하는 데도 사용될 수 있다.

분포로의 수렴은 단조롭습니다. 즉, Z n 엔트로피가 정규 분포의 [20]엔트로피로 단조롭게 증가한다는 의미입니다.

중심 한계 정리는 특히 독립적이고 균등하게 분포된 이산 랜덤 변수의 합계에 적용됩니다.이산 랜덤 변수의 합은 여전히 이산 랜덤 변수이기 때문에 누적 확률 분포 함수가 연속 변수(즉 정규 분포의 누적 확률 분포 함수)에 대응하는 누적 확률 분포 함수로 수렴하는 이산 랜덤 변수의 시퀀스에 직면한다.즉, n개의 독립적 동일 이산 변수 합계의 실현 히스토그램을 구축하면 히스토그램을 형성하는 직사각형의 윗면 중심을 연결하는 곡선은 n개가 무한대에 가까워짐에 따라 가우스 곡선으로 수렴되며, 이 관계를 de Moivre-Lapace 정리라고 합니다.이항 분포 기사에서는 두 개의 가능한 값만 갖는 이산 변수의 단순한 경우 중심 한계 정리의 적용을 자세히 설명합니다.

대수의 법칙과의 관계

큰 숫자의 법칙과 중심 한계 정리는 일반적인 문제에 대한 부분적인 해법이다: "n이 무한대에 가까워질Sn 한계 행동은 무엇인가?"수학 분석에서, 점근 급수는 그러한 질문에 접근하기 위해 사용되는 가장 인기 있는 도구 중 하나이다.

f( f의 점근팽창이 있다고 가정합니다.

두 부분을 θ1(n)로 나누고 한계를 취하면 팽창에서 가장 높은 차수의 항의 계수인 a가 생성되며1, 이는 선행 항에서 f(n)변화하는 속도를 나타냅니다.

비공식적으로 "f(n)는 대략 a11 grows(n)만큼 커진다"라고 말할 수 있다.f(n)와 그 근사치 사이의 차이를 취하여 확장의 다음 항으로 나누면 f(n)에 대한 보다 상세한 설명에 도달한다.

여기서 함수와 그 근사치의 차이는 대략 22(n)만큼 커진다고 할 수 있다.적절한 정규화 함수로 함수를 나누고 결과의 제한 동작을 보면 원래 함수 자체의 제한 동작에 대해 많은 것을 알 수 있습니다.

비공식적으로, 이러한 선을 따라 무언가가 발생하는 것은 독립적이고 동일한 분포의 랜덤 변수1 X, ..., Xn 합, Sn 고전 확률 [citation needed]이론에서 연구될 때 일어난다.만약 각 자이 많은 수의 법 그때까지 평균 μ, .mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output.sfrac.tion,.mw-parser-output.sfrac .tion{디스플레이:inline-block, vertical-align:-0.5em, font-size:85%;text-align:센터}.mw-parser-output.sfrac .num,.mw-parser-output.sfrac .den{디스플레이:블록, line-height:1em, 마진:00.1em}시스템을 가지고 있다.중앙에 Mw-parser-output.sfrac .den{border-top:1px 고체}.mw-parser-output .sr-only{국경:0;클립:rect(0,0,0,0), 높이:1px, 마진:-1px, 오버 플로: 숨어 있었다. 패딩:0;위치:절대, 너비:1px}Sn/n → μ.[21]만약 외에 각 증명서는 한정된 분산 σ2고 있던 그때 theorem,.

「」는 N(0,")으로2 배포됩니다.이것은 비공식 확장에서 처음 두 상수의 값을 제공한다.

Xi 유한 평균 또는 분산이 없는 경우, 다른 중심 및 스케일링 계수를 사용하여 시프트 및 스케일링 합계의 수렴이 발생할 수 있습니다.

또는 비공식적으로

이와 같이 발생할 수 있는 분포 δ[22]안정 분포라고 합니다.정규 분포는 안정적이지만 평균이나 분산이 정의되지 않은 다른 안정적인 분포(예: 코시 분포)도 있습니다.스케일링 계수n b는 임의의 c 1/2에 대해 nc 비례할 수 있으며, 천천히 변화하는 함수 [12][23]n을 곱할 수도 있다.

반복 로그의 법칙은 큰 수의 법칙과 중심 한계 정리 사이에서 일어나는 일을 명시합니다.구체적으로는 큰 수의 법칙의 n과 중심 한계 정리의 n중간 크기인 정규화 함수 θn log n은 사소한 제한 거동을 제공한다고 한다.

정리에 대한 대체 진술

밀도 함수

개 이상의 독립 변수 합계의 밀도는 밀도(이러한 밀도가 존재하는 경우)의 합성곱입니다.따라서 중심 한계 정리는 컨볼루션 하의 밀도 함수의 특성에 대한 진술로 해석될 수 있습니다. 즉, 다수의 밀도 함수의 컨볼루션은 경계 없이 밀도 함수의 수가 증가함에 따라 정규 밀도로 기울어지는 경향이 있습니다.이러한 정리는 위에 주어진 중심 한계 정리의 형태보다 더 강력한 가설을 요구한다.이런 유형의 정리는 종종 로컬 한계 정리라고 불립니다.독립적이고 균등하게 분포된 랜덤 변수의 합계에 대한 특정 국소 한계 정리는 Petrov를 참조하십시오[24].

특징적인 기능

컨볼루션의 특성 함수는 관련된 밀도의 특성 함수의 곱이기 때문에, 중심 한계 정리는 또 다른 재진술을 가진다: 다수의 밀도 함수의 특성 함수의 곱은 밀도 수 f로서 정규 밀도의 특성 함수에 가까워진다.연산은 위에서 설명한 조건 하에서 제한 없이 증가합니다.특히 특성 함수의 인수에 적절한 스케일 계수를 적용해야 합니다.

특성 함수는 본질적으로 푸리에 변환이기 때문에 푸리에 변환에 대해 동등한 진술을 할 수 있다.

분산 계산

S를 n개의 랜덤 변수의 으로 합니다n.많은 중심 한계 정리에서는 S/secondVar(Sn)가 분포에서 N(0,1)로 수렴하는 조건n n µ로 제공합니다.경우에 따라서는 S/(θnθf(n)) N(0,1)으로 분포에서 수렴하도록 상수n θ2함수 f(n)를 구할 수 있다.

Lemma[25]— X1, X2,…{\displaystyle X_{1},X_{2},\dots}E(X나는)과 엄격하게 정지해 실수를 사용한 확률 변수의 시퀀스 초기 조향 순간 0모든 나는{\displaystyle 나는}에 g((X_{나는})=0},:[0,1]→ R{\displaystyle g:[0,1]\to \mathbb{R}},과 Sn= ∑ 구축

  1. 만약 ∑ 나는 갈1E(X1X1+i){\displaystyle \sum_{i=1}^{\infty}\mathbb{E}(X_{1}X_{1+i})∞}절대적으로∫ 01g())g′())d)<>∞{\displaystyle \left \int_{0}())g'())\,dx\right<>\infty}고, 0은 개체, ∫ 01(g()))2d)<>∞{0<\displaystyle 수렴 있다.;\int _{0}^{1}(G()))^{2}dx<, \infty}n→ ∞{\displaystyle n\to\infty}으로 V를 r(Sn)/(nγ n)→ σ 2{\displaystyle \mathrm{바르}(S_{n})(n\gamma_{n})\to \sigma ^{2}}이γ nx1n∑ 나는 갈1n(g(나의 스녀))2{\displaystyle \gamma_{n}={\frac{1}{n}}\sum _{i=1}^{n}\left(g\left({년.tfr
  2. 만약 추가로 사용하여<>;0{\displaystyle \sigma>0}과 Sn/V는 r(Sn){\displaystyle S_{n}{\sqrt{\mathrm{바르}(S_{n})σ}}}N(0,1){\displaystyle{{N\mathcal}}(0,1)}에 대한 배급에서 n→ ∞{\displaystyle n\to\infty} 다음 Sn/(σ nγ n){\display로 전진.스타일. _n}})도 N( 1) (\ (으로 전달이 수렴됩니다. 값은 n n (\ n \ 입니다.

내선번호

양의 랜덤 변수의 곱

제품의 로그는 단순히 요인의 로그의 합입니다.따라서 양수 값만 취하는 랜덤 변수 곱의 대수가 정규 분포에 근접하면 곱 자체가 로그 정규 분포에 근접합니다.많은 물리량(특히 질량의 문제이며 음수가 될 수 없는 질량 또는 길이)은 서로 다른 변량 인자의 곱이므로 로그 정규 분포를 따릅니다.이 중심 한계 정리의 곱셈 버전은 때때로 지브라트의 법칙이라고 불립니다.

랜덤 변수의 합계에 대한 중심 한계 정리는 유한 분산 조건을 필요로 하는 반면, 곱에 대한 해당 정리는 밀도 함수가 제곱 적분 [26]가능한 해당 조건을 필요로 한다.

종래의 틀을 뛰어넘다

점근 정규성, 즉 적절한 이동 및 재스케일링 후 정규 분포로의 수렴은 위에서 다루어진 전통적인 프레임워크, 즉 독립 랜덤 변수(또는 벡터)의 합보다 훨씬 더 일반적인 현상이다.때때로 새로운 프레임워크가 공개된다.현재로서는 하나의 통일된 프레임워크가 없다.

볼록체

정리 — 다음이 유지되는 시퀀스 θn 0이 존재합니다.n 1 1로 하고, 랜덤1 변수 Xn, ..., X가 로그 오목 접합 밀도 f를 가지도록 하면1, 모든 x, ..., xnn 대해 f(x1, ..., x) = f(x1, ..., xn)모든 k = 1, ..., n에 대해 E(X2
k
)
= 1이다. 그 다음 분포

는 총 변동 [27]거리에서는 N(0,1)에n 근접합니다.

이들 2개의 γ-밀착n 분포는 밀도(실제로 로그 오목부 밀도)를 가지며, 따라서 이들 사이의 총 분산 거리는 밀도 차이의 절대값의 적분이다.총 변동의 수렴은 약한 수렴보다 강합니다.

로그-오목 밀도의 중요한 예는 주어진 볼록체 내부에서 함수 상수이며, 볼록체에서의 균일한 분포에 해당하며, 이는 "볼록체에 대한 중심 한계 정리"라는 용어를 설명한다.

또 다른 로는 f(x1, ..., xn) = const · exp(x1 + δ + xn β) > 1이다. β = 1이면 f1(xn, ..., x)는1 x, ..., xnn 독립적이라는 것을 의미한다1.그러나 일반적으로 이들은 의존적입니다.

조건 f(x1, ..., xnn) = f(x1, ..., x )는1 X, ..., Xn 0의 평균이며 [citation needed]상관 관계가 없음을 보증합니다. 그러나 이들은 독립적이거나 쌍으로 [citation needed]독립적일 필요는 없습니다.덧붙여서, 쌍별 독립성은 고전적인 중심 한계 [28]정리에서의 독립성을 대체할 수 없다.

다음은 Berry-Esseen 유형 결과입니다.

정리 - X, ..., Xn 이전 정리의 가정을 만족시키도록 하자1.

모든 a < b에 대해서, 여기서 C는 범용(절대) 상수입니다.또한, c + δ2
n
+ c = 1인2
1
모든1n c, ..., c δ R에 대해,

X + δ + Xn/δn분포1 거의 정규 분포를 따를 필요는 없습니다(실제로 [30]균일할 수 있습니다).그러나 cX11 + δ + cXnn 분포는 구 c2
1
+ δ + c2
n
= 1의 균일한 분포에 따라 대부분의 벡터(c1, ..., cn)에서 N(0,1)에 가깝다.

라쿠나리 삼각 급수

정리 (Salem-Zygmund) : U를 (0,2µ)k X = rk cos (nUk + ak)에 균일하게 분포하는 랜덤 변수라고 하자.

  • nk lacunarity 조건을 충족합니다.q > 1존재하여 모든 k에 대해 n qnk 존재하며k + 1,
  • rk 다음과 같다.
  • 0 µk a < 2 µ

그럼[31][32].

는, N(0, 1/2)에 전달을 컨버전스 합니다.

가우스 폴리토피스

정리 - A, ..., An 평면2 R 상의 각각 2차원 표준 정규 분포를 갖는 독립적인 랜덤 점이라고 가정합니다1.K를 이 점들의 볼록 선체라고 하고n X를 Kn[33] 면적이라고 하자n.

는 n이 무한대 경향이 있기 때문 분포가 N(0,1)로 수렴됩니다.

2보다 큰 모든 차원에서도 동일하게 유지됩니다.

폴리토프n K는 가우스 랜덤 폴리토프라고 불립니다.

(가우스 폴리토프의) 꼭지점 수, 에지 수, 그리고 실제로 모든 [34]치수의 면에도 유사한 결과가 유지됩니다.

직교 행렬의 선형 함수

행렬 M의 선형 함수는 주어진 계수를 가진 요소의 선형 조합이며, 여기서 A는 계수의 행렬이다. 추적(선형 대수)#을 참조하십시오.이너 제품.

랜덤 직교 행렬은 분포가 직교 그룹 O(n,R)에 대한 정규화된 Haar 측정값인 경우 균일하게 분포된다고 합니다. 회전 행렬 #불균일한 랜덤 회전 행렬을 참조하십시오.

정리 — M을 랜덤 직교 n × n 행렬로 균등하게 분포하고 A tr(AA*) = n으로 하여 X = tr(AM)로 한다. 그러면[35] X의 분포는 최대 2µ3[clarification needed]/n - 1까지 N(0,1)에 가깝다.

후속 사항

정리 — 임의 변수1 X, X2, ... l2 L(δ)이 L(δ)에서2 X → 0 약하게, L
n
(δ)에서1 X → 1 약하게 되도록n 합니다.
그런 다음 다음과 같은1 정수 n2 < n < >가 존재합니다.

k가 [36]무한대 경향을 보이므로 분포가 N(0,1)로 수렴됩니다.

크리스털 격자 위를 무작위로 걷다

중심 한계 정리는 결정 격자(유한 그래프 위의 무한 접힘 아벨 피복 그래프) 상의 단순한 랜덤 워크를 위해 확립될 수 있으며 결정 [37][38]구조의 설계에 사용된다.

응용 프로그램 및 예시

간단한 예

이 그림은 중심 한계 정리를 보여줍니다.표본 평균은 균일한 확률 분포에서 0과 100 사이의 숫자를 추출하는 난수 생성기를 사용하여 생성됩니다.표본 크기를 늘리면 측정된 표본 500개가 모집단 평균(이 경우 50개)에 더 가깝게 분포된다는 것을 나타냅니다.또한 관측된 분포를 정규화된 가우스 분포에 대해 예상되는 분포와 비교하고 적합도를 정량화하는 카이 제곱 값을 표시합니다(축소된 카이 제곱 값이 1보다 작거나 거의 같은 경우 적합치가 좋습니다).정규화된 가우스 함수에 대한 입력은 표본 평균(~50)과 표본 크기의 제곱근(~28.87/µn)으로 나눈 표본 표준 편차를 평균의 표준 편차라고 합니다(표본 평균의 산포를 의미하므로).

중심 한계 정리의 간단한 예는 많은 동일하고 편향되지 않은 주사위를 굴리는 것입니다.압연된 숫자의 합(또는 평균)의 분포는 정규 분포로 근사됩니다.실제 수량은 종종 관측되지 않은 많은 무작위 사건의 균형합이기 때문에, 중심 한계 정리는 정규 확률 분포의 유병률에 대한 부분적인 설명을 제공한다.또한 제어된 실험에서 정규 분포에 대한 큰 표본 통계량의 근사치를 정당화합니다.

n개의 균등 6면 다이스의 합에 대한 확률밀도함수의 비교 **p(k)는 중심한계정리에 따라 n이 증가하는 정규분포로의 수렴을 나타낸다.오른쪽 아래 그래프에서 이전 그래프의 평활화된 프로파일은 크기가 조정되고 중첩되며 정규 분포(검은색 곡선)와 비교됩니다.
이항 분포를 사용한 또 다른 시뮬레이션입니다.랜덤 0과 1이 생성된 다음 표본 크기가 1에서 512 사이일 때 평균이 계산되었습니다.표본 크기가 커지면 꼬리가 얇아지고 분포가 평균 주위에 더 집중됩니다.

실제 응용 프로그램

출판된 문헌에는 중심 한계 [39]정리와 관련된 많은 유용하고 흥미로운 예와 응용이 포함되어 있다.1[40] 개의 소스에서는, 다음의 예를 나타냅니다.

  • 랜덤 보행(편향 또는 비편향)에 포함되는 총 거리에 대한 확률 분포는 정규 분포를 따릅니다.
  • 동전을 많이 던지면 총 앞면 수(또는 이와 동등한 총 꼬리 수)에 대한 정규 분포가 생성됩니다.

다른 관점에서 중심 한계 정리는 실제 데이터에 적용되는 밀도 추정에서 "벨 곡선"의 일반적인 모습을 설명한다.전자 소음, 검사 등급 등의 경우 단일 측정값을 많은 작은 효과의 가중 평균으로 간주할 수 있습니다.중심 한계 정리의 일반화를 사용하면, 이것이 종종 (항상 그렇지는 않지만) 거의 정규 분포를 산출한다는 것을 알 수 있다.

일반적으로 측정값이 결과에 동일한 영향을 미치는 독립 변수의 합과 같을수록 더 많은 정규성을 나타냅니다.는 선형 모형과 같은 모형에서 관측되지 않은 변수의 효과를 나타내기 위해 이 분포를 일반적으로 사용하는 것을 정당화합니다.

회귀

회귀 분석 및 특히 일반 최소 제곱은 종속 변수가 하나 이상의 독립 변수에 따라 가법 오차 항과 함께 일부 함수에 따라 달라지는 것을 지정합니다.회귀 분석에 대한 다양한 유형의 통계적 추론은 오차항이 정규 분포를 따른다고 가정합니다.이러한 가정은 오차항이 실제로 많은 독립적인 오차항의 합이라고 가정함으로써 정당화될 수 있다. 개별 오차항이 정규 분포를 따르지 않더라도 중심 한계 정리에 의해 그 합이 정규 분포를 통해 근사될 수 있다.

기타 일러스트

통계의 중요성을 고려할 때, 중심 한계 [41]정리와 관련된 수렴을 보여주는 많은 논문과 컴퓨터 패키지를 이용할 수 있다.

역사

네덜란드 수학자 Henk Tijms는 다음과 같이 [42]쓰고 있습니다.

중심 한계 정리는 흥미로운 역사를 가지고 있다.이 정리의 첫 번째 버전은 프랑스 태생의 수학자 아브라함모이브르가 1733년에 발표한 주목할 만한 기사에서, 많은 동전 던지기로부터 생기는 앞면 수의 분포를 근사화하기 위해 정규 분포를 사용했다고 가정했습니다.이 발견은 시대를 훨씬 앞선 것이었고, 유명한 프랑스 수학자 피에르-시몽 라플라스가 1812년에 출판된 그의 기념비적인 작품인 Téori analytique des probabilités에서 그것을 무명으로부터 구할 때까지 거의 잊혀졌다.Laplace는 정규 분포를 사용하여 이항 분포를 근사함으로써 De Moivre의 발견을 확장했습니다.그러나 De Moivre와 마찬가지로, Laplace의 발견은 그의 시대에는 거의 주목을 받지 못했다.1901년 러시아 수학자 알렉산드르 랴푸노프가 이를 일반적인 용어로 정의하고 수학적으로 어떻게 작용하는지 정확하게 증명했을 때 중심 한계 정리의 중요성이 인식된 것은 19세기가 끝나기 전이었다.오늘날 중심 한계 정리는 확률론의 비공식 주권자로 여겨진다.

Francis Galton 경은 중심 한계 정리를 다음과 [43]같이 설명했습니다.

"오류 빈도의 법칙"에 의해 표현된 우주 질서의 멋진 형태만큼 상상력을 자극하기 쉬운 것은 거의 없다.그리스인들이 알았더라면 법은 의인화되었고 신격화 되었을 것이다.그것은 가장 혼란스러운 가운데 평온하고 완전한 자기 이완으로 군림한다.폭도들이 열광할수록, 그리고 명백한 무정부 상태가 클수록, 폭도들의 지배력은 더욱 완벽해진다.그것은 불합리한 최고의 법칙이다.무질서한 원소의 많은 표본을 손에 들고 그 크기 순서대로 정리할 때마다, 예상치 못한 가장 아름다운 형태의 규칙성이 내내 숨어 있었음이 증명됩니다.

"중심 한계 정리" (독일어로 "zentraler Grenzwertsatz")는 1920년 조지 폴랴에 의해 [44][45]논문 제목으로 처음 사용되었다.폴랴는 확률론의 중요성 때문에 이 정리를 "중심"이라고 불렀다.Le Cam에 따르면, 프랑스 확률학파는 "central"이라는 단어를 [45]"central"이라는 의미로 해석한다.1920년 폴랴에[44] 의한 확률의 미적분과 모멘트의 문제에 관한 논문의 요약은 다음과 같다.

반복 실험, 측정 오류, 확산 과정 등에서 매우 많고 매우 작은 기본 오류의 조합을 초래하는 가우스 확률 밀도 1 = ex2 발생은 잘 알려진 바와 같이 확률 계산의 중심 역할을 하는 매우 동일한 한계 정리에 의해 설명될 수 있다.이 한계정리의 실제 발견자는 라플라스라고 이름 붙일 것이다.그 엄밀한 증명은 Tschebyschef에 의해 처음 주어졌을 가능성이 높으며, 내가 아는 한, Liapounoff의 기사에서 가장 날카로운 공식을 찾을 수 있다.

홀드는 [46]라플라스의 기초 연구뿐만 아니라 코시, 베셀, 푸아송의 공헌에 대한 자세한 정리 역사를 제공한다.한스 피셔는 [47]라플라스에서 코시까지의 발전을 다룬 두 개의 역사적 설명과 1920년대 폰 미제, 폴랴, 린데베르크, 레비, 크라메르공헌을 다룬 두 번째 기록들을 제공한다.르캄은 1935년 [45]경의 시기를 묘사한다.베른슈타인은[48] 일반적인 상황에서 CLT의 첫 번째 증거를 이끈 파프누티 체비셰프와 그의 제자 안드레이 마르코프, 알렉산드르 랴푸노프의 연구에 초점을 맞춘 역사적 논의를 제시한다.

중앙 한계 정리의 역사에 대한 호기심 있는 각주는 1922년 린데버그 CLT와 유사한 결과의 증명은 케임브리지 대학의 1934년 알란 튜링의 킹스 칼리지 펠로우십 논문의 주제였다는 것입니다.그 작품을 제출한 후에야 튜링은 그것이 이미 증명되었다는 것을 알았다.그 결과 튜링의 논문은 [49]발표되지 않았다.

「 」를 참조해 주세요.

메모들

  1. ^ Fischer, Hans. "A history of the central limit theorem" (PDF). Springer New York Dordrecht Heidelberg London. Retrieved 29 April 2021.
  2. ^ Montgomery, Douglas C.; Runger, George C. (2014). Applied Statistics and Probability for Engineers (6th ed.). Wiley. p. 241. ISBN 9781118539712.
  3. ^ Rouaud, Mathieu (2013). Probability, Statistics and Estimation (PDF). p. 10.
  4. ^ 빌링슬리 (1995년, 페이지 357년)
  5. ^ 바우어(2001, 정리 30.13, 페이지 199)
  6. ^ 빌링슬리(1995년, 페이지 362년)
  7. ^ van der Vaart, A.W. (1998). Asymptotic statistics. New York, NY: Cambridge University Press. ISBN 978-0-521-49603-2. LCCN 98015176.{{cite book}}: CS1 maint: ref 복제 기본값(링크)
  8. ^ O’Donnell, Ryan (2014). "Theorem 5.38". Archived from the original on 2019-04-08. Retrieved 2017-10-18.
  9. ^ Bentkus, V. (2005). "A Lyapunov-type bound in ". Theory Probab. Appl. 49 (2): 311–323. doi:10.1137/S0040585X97981123.
  10. ^ Voit, Johannes (2003). "Section f5.4.3". The Statistical Mechanics of Financial Markets. Texts and Monographs in Physics. Springer-Verlag. ISBN 3-540-00978-7.
  11. ^ Gnedenko, B.V.; Kolmogorov, A.N. (1954). Limit distributions for sums of independent random variables. Cambridge: Addison-Wesley.
  12. ^ a b Uchaikin, Vladimir V.; Zolotarev, V.M. (1999). Chance and Stability: Stable distributions and their applications. VSP. pp. 61–62. ISBN 90-6764-301-7.
  13. ^ 빌링슬리(1995, 정리 27.5)
  14. ^ Durrett (2004년, 제7.7장(c), 정리 7.8)
  15. ^ 듀렛 (2004년, 7.7장, 정리 7.4)
  16. ^ 빌링슬리(1995, 정리 35.12)
  17. ^ "An Introduction to Stochastic Processes in Physics". jhupbooks.press.jhu.edu. Retrieved 2016-08-11.
  18. ^ Stein, C. (1972). "A bound for the error in the normal approximation to the distribution of a sum of dependent random variables". Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability. 6 (2): 583–602. MR 0402873. Zbl 0278.60026.
  19. ^ Chen, L. H. Y.; Goldstein, L.; Shao, Q. M. (2011). Normal approximation by Stein's method. Springer. ISBN 978-3-642-15006-7.
  20. ^ Artstein, S.; Ball, K.; Barthe, F.; Naor, A. (2004), "Solution of Shannon's Problem on the Monotonicity of Entropy", Journal of the American Mathematical Society, 17 (4): 975–982, doi:10.1090/S0894-0347-04-00459-X
  21. ^ Rosenthal, Jeffrey Seth (2000). A First Look at Rigorous Probability Theory. World Scientific. Theorem 5.3.4, p. 47. ISBN 981-02-4322-7.
  22. ^ Johnson, Oliver Thomas (2004). Information Theory and the Central Limit Theorem. Imperial College Press. p. 88. ISBN 1-86094-473-6.
  23. ^ Borodin, A. N.; Ibragimov, I. A.; Sudakov, V. N. (1995). Limit Theorems for Functionals of Random Walks. AMS Bookstore. Theorem 1.1, p. 8. ISBN 0-8218-0438-3.
  24. ^ Petrov, V. V. (1976). Sums of Independent Random Variables. New York-Heidelberg: Springer-Verlag. ch. 7. ISBN 9783642658099.
  25. ^ Hew, Patrick Chisan (2017). "Asymptotic distribution of rewards accumulated by alternating renewal processes". Statistics and Probability Letters. 129: 355–359. doi:10.1016/j.spl.2017.06.027.
  26. ^ Rempala, G.; Wesolowski, J. (2002). "Asymptotics of products of sums and U-statistics" (PDF). Electronic Communications in Probability. 7: 47–54. doi:10.1214/ecp.v7-1046.
  27. ^ 클라르타그 (2007, 정리 1.2)
  28. ^ Durrett (2004, 섹션 2.4, 예 4.5)
  29. ^ 클라르타그 (2008년, 정리 1)
  30. ^ 클라르타그 (2007, 정리 1.1)
  31. ^ Zygmund, Antoni (2003) [1959]. Trigonometric Series. Cambridge University Press. vol. II, sect. XVI.5, Theorem 5-5. ISBN 0-521-89053-5.
  32. ^ 가포슈킨(1966년, 정리 2.1.13)
  33. ^ 바라니와 뷔 (2007, 정리 1.1)
  34. ^ 바라니와 뷔 (2007, 정리 1.2)
  35. ^ Meckes, Elizabeth (2008). "Linear functions on the classical matrix groups". Transactions of the American Mathematical Society. 360 (10): 5355–5366. arXiv:math/0509441. doi:10.1090/S0002-9947-08-04444-9. S2CID 11981408.
  36. ^ 가포슈킨(1966년, 1.5장)
  37. ^ Kotani, M.; Sunada, Toshikazu (2003). Spectral geometry of crystal lattices. Vol. 338. Contemporary Math. pp. 271–305. ISBN 978-0-8218-4269-0.
  38. ^ Sunada, Toshikazu (2012). Topological Crystallography – With a View Towards Discrete Geometric Analysis. Surveys and Tutorials in the Applied Mathematical Sciences. Vol. 6. Springer. ISBN 978-4-431-54177-6.
  39. ^ Dinov, Christou & Santchez (2008)
  40. ^ "SOCR EduMaterials Activities GCLT Applications - Socr". Wiki.stat.ucla.edu. 2010-05-24. Retrieved 2017-01-23.
  41. ^ Marasinghe, M.; Meeker, W.; Cook, D.; Shin, T. S. (Aug 1994). "Using graphics and simulation to teach statistical concepts". Paper presented at the Annual meeting of the American Statistician Association, Toronto, Canada. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  42. ^ Henk, Tijms (2004). Understanding Probability: Chance Rules in Everyday Life. Cambridge: Cambridge University Press. p. 169. ISBN 0-521-54036-4.
  43. ^ Galton, F. (1889). Natural Inheritance. p. 66.
  44. ^ a b Pólya, George (1920). "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem" [On the central limit theorem of probability calculation and the problem of moments]. Mathematische Zeitschrift (in German). 8 (3–4): 171–181. doi:10.1007/BF01206525. S2CID 123063388.
  45. ^ a b c Le Cam, Lucien (1986). "The central limit theorem around 1935". Statistical Science. 1 (1): 78–91. doi:10.1214/ss/1177013818.
  46. ^ Hald, Andreas (22 April 1998). A History of Mathematical Statistics from 1750 to 1930 (PDF). Gbv.de. chapter 17. ISBN 978-0471179122.
  47. ^ Fischer, Hans (2011). A History of the Central Limit Theorem: From Classical to Modern Probability Theory. Sources and Studies in the History of Mathematics and Physical Sciences. New York: Springer. doi:10.1007/978-0-387-87857-7. ISBN 978-0-387-87856-0. MR 2743162. Zbl 1226.60004. (제2장: 라플라스에서 코시까지의 중심 한계 정리:확률적 목적과 분석방법의 변화, 제5.2장: 20년대 중심한계정리
  48. ^ Bernstein, S. N. (1945). "On the work of P. L. Chebyshev in Probability Theory". In Bernstein., S. N. (ed.). Nauchnoe Nasledie P. L. Chebysheva. Vypusk Pervyi: Matematika [The Scientific Legacy of P. L. Chebyshev. Part I: Mathematics] (in Russian). Moscow & Leningrad: Academiya Nauk SSSR. p. 174.
  49. ^ Zabell, S. L. (1995). "Alan Turing and the Central Limit Theorem". American Mathematical Monthly. 102 (6): 483–494. doi:10.1080/00029890.1995.12004608.
  50. ^ Jørgensen, Bent (1997). The Theory of Dispersion Models. Chapman & Hall. ISBN 978-0412997112.

레퍼런스

외부 링크