이 기사는 통계학의 극값 정리에 관한 것입니다. 미적분학의 결과는 극값 정리 를 참조하십시오. 통계학에서 피셔-티펫-그네덴코 정리( Fisher-Tippett-Gnedenko theorem, 또는 극값 정리 )는 극한값 이론 에서 극한값 통계의 점근적 분포에 관한 일반적인 결과입니다. 적절한 재규격화 후 iid 랜덤 변수 표본의 최대치는 Gumbel 분포 , Fréchet 분포 또는 Weibull 분포 의 세 가지 가능한 분포 계열 중 하나에만 분포적 으로 수렴할 수 있습니다. 극값 정리와 그 수렴 세부 사항에 대한 공은 Fréchet ([1] 1927), Fisher and Tippett (1928),[2] Mises (1936) [3] [4] 및 Gnedenko (1943)에게 주어집니다.[5]
최대에 대한 극한 유형 정리의 역할은 평균에 대한 중심 극한 정리 와 유사하지만, 중심 극한 정리는 유한 분산을 갖는 모든 분포의 표본의 평균에 적용되는 반면, 피셔-티펫-그네덴코 정리는 정규화된 최대의 분포가 수렴 하면, 한계 는 분포의 특정 클래스 중 하나여야 합니다. 정규화된 최대값의 분포가 수렴한다는 것을 명시하지 않았습니다.
진술 X 1 , X 2, … , X n {\ displaystyle \ X_{1}, X_{2},\ldots, X_{n}\ } 를 각각의 누적 분포 함수 가 F. {\displaystyle \ F~ 라고 가정 합니다.} 실수 a > 0 {\displaystyle \ a_{n}> 0\} 와 b ∈ R {\displaystyle \ b_{n }\in \mathbb {R} \}에 두 개의 수열이 존재한다고 가정하면, 다음과 같은 한계가 비퇴적 분포 함수로 수렴됩니다.
임의 n → ∞ P { 맥스. { X 1 , … , X n } − b n a n ≤ x } = G ( x ) , {\displaystyle \lim _{n\to \infty }{\boldsymbol {\mathcal {P}}}\left\{{\frac {\ \max\{X_{1},\dots ,X_{n}\}-b_{n}\ }{a_{n}}}\leq x\ \right\}=G(x)\ ,} 또는 이와 동등한 경우:
임의 n → ∞ ( F ( a n x + b n ) ) n = G ( x ) . {\displaystyle \lim_{n\to \infty}{\Bigl(})\F\left(\a_{n}\x+b_{n}\\right){\ Bigr )}^{n}=G(x)~.} 이러한 상황에서 제한 분포 G {\ displaystyle \ G\} 는 Gumbel , Fréchet 또는 Weibull 분포 계열 에 속합니다 .[6]
즉, 위 한계가 수렴하면 좌표 G (x ) {\displaystyle G(x)} 의 선형 변화까지 다음 형태 중 하나를 가정합니다 .[7]
G γ ( x ) = exp ( - ( 1 + γ x ) ( - γ ) ) {\displaystyle G_{\gamma }(x)=\exp \left(-{\Bigl(}1+\ gamma \x{\Bigr )}^{\le ft ({\tfrac {-1\;}{\g amma }\right)\ quad }에 대 해 γ ≠ 0, {\displaystyle \quad \n gamma \neq 0\,} with the non-zero parameter γ {\displaystyle \ \gamma \ } also satisfying 1 + γ x > 0 {\displaystyle \ 1+\gamma \ x>0\ } for every x {\displaystyle \ x\ } value supported by F {\displaystyle \ F\ } (for all values x {\displaystyle \ x\ } for which F ( x ) ≠ 0 {\displaystyle \ F(x)\n eq 0\ } ). 그렇지 않으면 다음과 같은 형식을 갖습니다.
γ = 0에 대한 G 0( x ) = exp ( - exp ( - x ) {\displaystyle G_{0 }(x)=\exp {\bigl(}\ -\e xp (-x)}\ quad }. {\displaystyle \quad \ga mma =0~} 이는 극값 지수 γ을 갖는 일반화된 극값 분포(GEV)의 누적 분포 함수입니다. {\ displaystyle \gamma ~.\ } GEV 분포는 Gumbel, Fréchet 및 Weibull 분포를 단일 합성 형태로 그룹화합니다.
수렴조건 피셔-티펫-그네덴코 정리는 위의 한계 분포 G( x ), {\displaystyle \ G(x)\,} 의 수렴에 대한 진술입니다. G {\ displaystyle \ G\} 를 일반화된 극값 분포의 특정 경우에 수렴하기 위한 조건에 대한 연구는 Mises(1936)[3] [5] [4] 에서 시작되었으며 Gnedenko(1943)에 의해 더욱 발전되었습니다.[5]
F {\ displaystyle \ F\} 를 X, {\displaystyle \ X\,} 및 X 1 , …, X n {\ displaystyle \ X_{1},\dots, X_{n} 의 분포 함수라고 하자. 또한 x m x {\ displaystyle \ x_{\mathsf {max}}\ }를 모집단 최대로 설정합니다. x m x ≡ sup { x ∣ F (x ) < 1}. {\displaystyle \ x_ {\mathsf {max}\equiv \sup \{\ x\ mid \ F(x)< 1\}~.\ } 위의 G {\displaystyle G} 에 의해 주어진 정규화된 샘플 최대값의 제한 분포는 다음과 같습니다.[7]
프레셰트 분포 ( γ > 0 ) {\displaystyle \ \left(\ \gamma >0\ \right)} 엄밀하게 양의 γ > 0인 경우, {\displaystyle \gamma > 0\,} 제한 분포가 수렴하는 경우 및 경우에만 x m a x = ∞ {\displaystyle \ x_{\mathsf {max}}=\infty \ } 그리고. lim → ∞ 1 - F (단위) 1 - F (t ) = u ( - γ) {\displaystyle \lim _{t\rightarrow \infty}{\frac {\1-F(u\t)\}{1-F (t)}} =u^{\left({\tfrac {-1~}{ \gamma }\right)}\ } 모든 u > 0에 대해 {\displaystyle \ u > 0.} 이 경우, 정리 조건을 만족시킬 수 있는 가능한 수열은 b n = 0 {\displaystyle b_{n}=0} 그리고. a n = F − 1 ( 1 − 1 n ) . {\displaystyle \a_{n}={F^{-1}}\! \!\left(1-{\tfrac {1}{\ n\ }}\right)~.} 엄밀하게 양의 γ {\displaystyle \gamma \} 는 무거운 꼬리 분포라고 불리는 것에 해당합니다.
검벨분포 ( γ = 0 ) {\displaystyle \ \left(\ \gamma =0\ \right)} 자명한 γ = 0, {\displaystyle \ gamma =0\,}이고 x max {\displaystyle \ x_{\mathsf {max}}\}인 경우 유한하거나 무한한 경우에만 제한 분포가 수렴합니다. lim t → x m a x 1 − F ( t + u g ~ ( t ) ) 1 − F ( t ) = e − u {\displaystyle \ \lim _{t\rightarrow x_{\mathsf {max}}}{\frac {\ 1-F{\bigl (}\ t+u\ {\tilde {g}}(t)\ {\bigr )}\ }{1-F(t)}}=e^{-u}\ } for all u > 0 {\displaystyle \ u>0\ } 와 함께 g ~ ( t ) ≡ ∫ t x m a x ( 1 − F ( s ) ) d s 1 − F ( t ) . {\displaystyle \ {\tilde {g}}(t)\equiv {\frac {\int_{t}^{x_{\mathsf {max}}{\Bigr}}\\Bigrm {d}\s\{1-F(t)}~.} 여기서 가능한 시퀀스는 b n = F − 1 ( 1 − 1 n ) {\displaystyle \b_{n}={F^{-1}}\! \!\left(\ 1-{\tfrac {1}{\ n\ }}\ \right)\ } 그리고. a n = g ~ ( F − 1 ( 1 − 1 n ) ) . {\displaystyle \a_{n}={\tilde {g}}{\Bigl(}\;{F^{-1}}\! \!\left(\ 1-{\tfrac {1}{\ n\ }}\ \right)\;{\Bigr )}~.}
웨이불 분포 ( γ < 0 ) {\displaystyle \ \left(\ \gamma <0\ \right)} 엄밀하게 음의 γ < 0 {\displaystyle \gamma <0\}의 경우 제한 분포는 다음과 같은 경우에만 수렴합니다. x max < ∞ {\displaystyle \ x_{\mathsf {max }}\ <\ infty \quad } (유한) 그리고. lim t → 0 + 1 − F ( x m a x − u t ) 1 − F ( x m a x − t ) = u ( − 1 γ ) {\displaystyle \ \lim _{t\rightarrow 0^{+}}{\frac {\ 1-F\! \left(\ x_{\mathsf {max}-u\ t\ \right)\}{1-F(\ x_{\mathsf {max}-t\ )}}= u ^{\left ({ \tfrac {-1~}{\ \gamma \}\right)}\ } 모든 u > 0에 대해 {\displaystyle \ u>0~} 이 경우 지수항 - 1 γ {\displaystyle \ {\tfrac {-1~}{\ \gamma \}}\}는 γ {\ displaystyle \ gamma \ }가 엄밀하게 음수 이므로 엄밀하게 양수입니다. 여기서 가능한 시퀀스는 b n = x m a x {\displaystyle \ b_{n}=x_{\mathsf {max}}\ } 그리고. a n = x m a x − F − 1 ( 1 − 1 n ) . {\displaystyle \a_{n}=x_{\mathsf {max}}-{F^{-1}}\! \!\left(\1-{\frac {1}{\n\}}\ \right)~.} 두 번째 공식(검벨 분포)은 γ {\ displaystyle \gamma \ }가 0이 될 때 첫 번째(프레셰 분포)의 한계입니다.
예 프레셰트 분포 코시 분포 의 밀도 함수는 다음과 같습니다.
f ( x ) = 1 π 2 + x 2 , {\displaystyle f(x)={\frac {1}{\ \pi ^{2}+x^{2 }\ }}\ ,} 그리고 누적 분포 함수는 다음과 같습니다.
F ( x ) = 1 2 + 1 π 아크탄 ( x π ) . {\displaystyle F(x)={\frac {\1\}{2}}+{\frac {1}{\pi \}}\arctan \left ({\frac {x}{\pi \}}\right)~.} 약간의 미적분학은 오른쪽 꼬리의 누적 분포 1 - F ( x ) {\ displaystyle \ 1-F (x)\} 가 1 x , {\displaystyle \ {\frac {1}{\ x\}\,} 또는
ln F ( x ) → − 1 x a s x → ∞ , {\displaystyle \ln F(x)\rightarrow {\frac {-1~}{\x\}}\quad {\mathsf {~as~}}\quad x\rightarrow \infty \,} 그래서 저희가.
ln ( F ( x ) n ) = n ln F ( x ) ∼ − − n x . {\displaystyle \ln \left(\ F(x)^{n}\right)=n\\ln F(x)\sim -{\frac {-n~}{\x\}}~.} 그래서 우리는
F ( x ) n ≈ 익스포트 ( − n x ) {\displaystyle F(x)^{n}\approx \exp \left({\frac {-n~}{\x\}}\right)} 그리고 x n - 1 {\displaystyle \u\equiv {\frac {x}{\n\}}- 1\}(그리고 일부 설명은 생략합니다)를 ≡합니다.
임의 n → ∞ ( F ( n u + n ) n ) = 익스포트 ( − 1 1 + u ) = G 1 ( u ) {\displaystyle \lim_{n\to \infty}{\Bigl(})\F(n\u+n)^{n}\{\Bigr)}=\exp \left ({\tfrac {-1~}{\1+u\}}\right)= G_{1}(u)\ } 임의 의 u에 대하여. {\displaystyle \u~.} 따라서 기대되는 최대값은 n 에 따라 선형적으로 증가합니다.
검벨분포 누적 분포 함수를 사용 하여 정규 분포를 취하겠습니다.
F ( x ) = 1 2 erfc ( − x 2 ) . {\displaystyle F(x)={\frac {1}{2}}\operatorname {erfc} \left ({\frac {-x~}{\\\sqrt {2\}}\}\}\right)~.} 우리는 가지고 있다.
ln F ( x ) → − 익스포트 ( − 1 2 x 2 ) 2 π x a s x → ∞ {\displaystyle \ln F(x)\rightarrow -{\frac {\tfrac {1}{2}}x^{2}\right)\}{\sqrt {2\pi \}\x}}\quad {\mathsf {~as~}}\quad x\rightarrow \infty} 그리하여
ln ( F ( x ) n ) = n ln F ( x ) → − n 익스포트 ( − 1 2 x 2 ) 2 π x a s x → ∞ . {\displaystyle \ln \left(\F(x)^{n}\right)=n\ln F(x)\rightarrow -{\frac {\n\exp \left (-{\tfrac {1}{2}}{2}}x^{2}\right)\}{\sqrt {2\pi \}}\x}}\quad {\mathsf {~as~}\quad x\rightarrow \infty ~} 그래서 우리는
F ( x ) n ≈ 익스포트 ( − n 익스포트 ( − 1 2 x 2 ) 2 π x ) . {\displaystyle F(x)^{n}\approx \exp \left(-\\frac {\n\ \exp \left(-{\tfrac {1}{2}}x^{2}\right)\}{\sqrt {2\pi \}\x\}\right)~.} c {\ displaystyle \c_{n}\} 를 정확하게 만족시키는 값으로 정의하면
n 익스포트 ( − 1 2 c n 2 ) 2 π c n = 1 , {\displaystyle {\frac {\ n\exp \left(-\ {\tfrac {1}{2}}c_{n}^{2}\right)\ }{\ {\sqrt {2\pi \ }}\ c_{n}\ }}=1\ ,} 그런 다음 x = c {\displaystyle \ x = c_{n}\ } 즈음에
n 익스포트 ( − 1 2 x 2 ) 2 π x ≈ 익스포트 ( c n ( c n − x ) ) . {\displaystyle {\frac {\n\ \exp \left (-\{\tfrac {1}{2}}x^{2}\right)\}{\sqrt {2\pi \}}\x}}\approx \exp \left(\c_{n}\(c_{n}-x)\\right)~.} n {\displaystyle \ n\ } 이 증가함에 따라 이것은 c (c n - x ) {\displaystyle \ c_{n}\ (c_{n}-x)\} 의 더 넓고 넓은 범위 의 c 에 대한 좋은 근사치가 되므로 c (c n - x ) {\displaystyle \ u\equiv c_{n}\ (c_{ n}-x)\ }를 ≡하면 다음과 같습니다.
임의 n → ∞ ( F ( u c n + c n ) n ) = 익스포트 ( − 익스포트 ( − u ) ) = G 0 ( u ) . {\displaystyle \lim_{n\to \infty}{\biggl(})\F\left({\tfrac {u}{~c_{n}\}}+c_{n}\right) ^{n}\ {\biggr )}=\exp \!{\ Bigl (}-\exp(-u){\Bigr )}=G_{0}(u)~.} 그에 상응하는,
임의 n → ∞ P ( 맥스. { X 1 , … , X n } − c n ( u c n ) ≤ u ) = 익스포트 ( − 익스포트 ( − u ) ) = G 0 ( u ) . {\displaystyle \lim_{n\to \infty}{\boldsymbol {\mathcal {P}}\{\Biggl(}{\frac{\\max\{X_{1}}\\ldots,\X_{n}\c_{n}\}-{}-{n}\}{\left ({\frac {u}{~c_{n}\}\right)}\lequ{\Biggr}}=\exp \!\\\ Bigl (}-\exp(-u){\Bigr )}=G_{0}(u)~.} 이 결과로, 우리 는 ln ≈ c ln ln ln 2 n 2 {\displaystyle \ln c_{n}\ 근사 {\frac {\\ln \ln n\}{2}\} 다음이 필요하다는 것을 소급하여 봅니다.
c n ≈ 2 ln n , {\displaystyle c_{n}\approx {\sqrt {2\ln\}}\,} 따라서 최대는 무한대를 향해 더 천천히 올라갈 것으로 예상됩니다.
웨이불 분포 가장 간단한 예를 들어 0 과 1 사이의 균일한 분포와 누적 분포 함수를 사용할 수 있습니다.
0에서 1 사이의 임의의 x 값에 대해 F ( x ) = x {\ displaystyle F( x) = x\ }. x → 1 {\displaystyle \ x\ \ rightarrow \ 1\ } 의 값의 경우
ln ( F ( x ) n ) = n ln F ( x ) → n ( 1 − x ) . {\displaystyle \ln {\Bigl(}\F(x)^{n}\{\Bigr )} = n\ \ln F(x)\ \rightarrow \ n\ (\1-x\ )~.} 따라서 x ≈ 1 {\displaystyle \ x\approx 1\}의 경우
F ( x ) n ≈ 익스포트 ( n x − n ) . {\displaystyle \ F(x)^{n}\approx \exp(\n\ x-n\ )~.} 1 + n (1 - x ) {\displaystyle \u\equiv 1+n\ (\ 1 - x\ )\ }을 ≡하고, 다음을 구합니다.
임의 n → ∞ ( F ( u n + 1 − 1 n ) ) n = 익스포트 ( − ( 1 − u ) ) = G − 1 ( u ) . {\displaystyle \lim_{n\to \infty}{\Bigl(}\F\! \left({\tfrac {\ u\ }{n}}+1-{\tfrac {\ 1\ }{n}}\right)\ {\Bigr )}^{n}=\exp \!{\bigl (}\ -(1-u)\ {\bigr )}=G_{-1}(u)~.} 이 한계를 자세히 조사하면 기대되는 최대값이 n에 반비례하여 1에 가까워짐을 알 수 있습니다.
참고 항목
참고문헌 ^ Fréchet, M. (1927). "Sur la loi de probabilité de l'écart maximum". Annales de la Société Polonaise de Mathématique . 6 (1): 93–116. ^ Fisher, R.A.; Tippett, L.H.C. (1928). "Limiting forms of the frequency distribution of the largest and smallest member of a sample". Proc. Camb. Phil. Soc . 24 (2): 180–190. Bibcode :1928PCPS...24..180F . doi :10.1017/s0305004100015681 . S2CID 123125823 . ^ a b von Mises, R. (1936). "La distribution de la plus grande de n valeurs" [The distribution of the largest of n values]. Rev. Math. Union Interbalcanique . 1 (in French): 141–160. ^ a b Falk, Michael; Marohn, Frank (1993). "von Mises conditions revisited". The Annals of Probability : 1310–1328. ^ a b c Gnedenko, B.V. (1943). "Sur la distribution limite du terme maximum d'une serie aleatoire". Annals of Mathematics . 44 (3): 423–453. doi :10.2307/1968974 . JSTOR 1968974 . ^ Mood, A.M. (1950). "5. Order Statistics". Introduction to the theory of statistics . New York, NY: McGraw-Hill. pp. 251–270. ^ a b Haan, Laurens; Ferreira, Ana (2007). Extreme Value Theory: An introduction . Springer. 더보기