수학적 증명
스타인의 예는 다음과 같이 말할 수 있는 의사결정 이론의 중요한 결과물이다.
- 다변량 가우스 분포의 평균 추정에 대한 일반적인 결정 규칙은 최소 3차원에서의 평균 제곱 오차 위험에서는 허용되지 않는다.
다음은 그 증거의 개요다.[1]독자는 더 많은 정보를 얻기 위해 주요 기사를 참조한다.
스케치된 교정쇄
의사결정 규칙 )= 의 위험 함수는 다음과
같다
![{\displaystyle R(\theta ,d)=\operatorname {E} _{\theta }[|\mathbf {\theta -X} |^{2}]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e0eacb869ae5613edd603aea8a9035c70cca91f6)


이제 결정 규칙을 고려하십시오.

여기서 = -
이(가) 보다 더 나은 결정 규칙임을
보여줄 것이다
위험 함수는
![{\displaystyle R(\theta ,d')=\operatorname {E} _{\theta }\left[\left|\mathbf {\theta -X} +{\frac {\alpha }{|\mathbf {X} |^{2}}}\mathbf {X} \right|^{2}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53af2890b7cd27b63bffa5f567c3e16c7debcedc)
![{\displaystyle =\operatorname {E} _{\theta }\left[|\mathbf {\theta -X} |^{2}+2(\mathbf {\theta -X} )^{T}{\frac {\alpha }{|\mathbf {X} |^{2}}}\mathbf {X} +{\frac {\alpha ^{2}}{|\mathbf {X} |^{4}}}|\mathbf {X} |^{2}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d0d6bd94fd2a04861cc3855cc30155458f20913a)
![{\displaystyle =\operatorname {E} _{\theta }\left[|\mathbf {\theta -X} |^{2}\right]+2\alpha \operatorname {E} _{\theta }\left[{\frac {\mathbf {(\theta -X)^{T}X} }{|\mathbf {X} |^{2}}}\right]+\alpha ^{2}\operatorname {E} _{\theta }\left[{\frac {1}{|\mathbf {X} |^{2}}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b3c2b23e5eec4f665d7b3988b45f4851203ccce5)
}의 2차
우리는 일반적인 "well-beh"( ) : ( )∈ R{\ h를 고려하고
부품별 통합을 사용하여 중기를 단순화할 수 있다. {\ i
큰 x displaystyle h에 충분히 성장하는 모든 연속적인
h h}에 대해 다음을 하십시오.
![{\displaystyle \operatorname {E} _{\theta }[(\theta _{i}-X_{i})h(\mathbf {X} )|X_{j}=x_{j}(j\neq i)]=\int (\theta _{i}-x_{i})h(\mathbf {x} )\left({\frac {1}{2\pi }}\right)^{n/2}e^{-(1/2)\mathbf {(x-\theta )} ^{T}\mathbf {(x-\theta )} }m(dx_{i})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/abf79080d2c2797d6eb3a2cd63bca3836a690c31)
![=\left[h({\mathbf {x}})\left({\frac {1}{2\pi }}\right)^{{n/2}}e^{{-(1/2){\mathbf {(x-\theta )}}^{T}{\mathbf {(x-\theta )}}}}\right]_{{x_{i}=-\infty }}^{\infty }-\int {\frac {\partial h}{\partial x_{i}}}({\mathbf {x}})\left({\frac {1}{2\pi }}\right)^{{n/2}}e^{{-(1/2){\mathbf {(x-\theta )}}^{T}{\mathbf {(x-\theta )}}}}m(dx_{i})](https://wikimedia.org/api/rest_v1/media/math/render/svg/1290a9810a80bc9ed39483971d798fbdbc0bf94b)
![{\displaystyle =-\operatorname {E} _{\theta }\left[{\frac {\partial h}{\partial x_{i}}}(\mathbf {X} )|X_{j}=x_{j}(j\neq i)\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/805aad9850010a67778135aed1a70395f316d20d)
그러므로
![{\displaystyle \operatorname {E} _{\theta }[(\theta _{i}-X_{i})h(\mathbf {X} )]=-\operatorname {E} _{\theta }\left[{\frac {\partial h}{\partial x_{i}}}(\mathbf {X} )\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cb61a83c56c891d9e294b55bea3335aeb8367e08)
(이 결과는 스타인의 보조정리라고 알려져 있다.)
이제 우리는 선택한다.

이(가) "잘 처신된" 조건(그렇지 않지만 이는 교정할 수 있음—아래 참조)을
충족하면 다음과 같은 결과를 얻을 수 있을 것이다.

등등
![{\displaystyle \operatorname {E} _{\theta }\left[{\frac {\mathbf {(\theta -X)^{T}X} }{|\mathbf {X} |^{2}}}\right]=\sum _{i=1}^{n}\operatorname {E} _{\theta }\left[(\theta _{i}-X_{i}){\frac {X_{i}}{|\mathbf {X} |^{2}}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/02e2ec1d5947960d3006c776b41ed078a119d78a)
![{\displaystyle =-\sum _{i=1}^{n}\operatorname {E} _{\theta }\left[{\frac {1}{|\mathbf {X} |^{2}}}-{\frac {2X_{i}^{2}}{|\mathbf {X} |^{4}}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c03a081bb181a5391ce9f473d3bc091e3ca1fc24)
![{\displaystyle =-(n-2)\operatorname {E} _{\theta }\left[{\frac {1}{|\mathbf {X} |^{2}}}\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e4d9f21e647c8da339e4f087293ffd9ac32e6b12)
다음 d 의 위험 함수로 돌아가십시오
![{\displaystyle R(\theta ,d')=n-2\alpha (n-2)\operatorname {E} _{\theta }\left[{\frac {1}{|\mathbf {X} |^{2}}}\right]+\alpha ^{2}\operatorname {E} _{\theta }\left[{\frac {1}{|\mathbf {X} |^{2}}}\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3a406c5b50929abb1cffbf67a86c448e2340c5a5)
의 이차치는 다음에서 최소화된다
.

부여
![{\displaystyle R(\theta ,d')=R(\theta ,d)-(n-2)^{2}\operatorname {E} _{\theta }\left[{\frac {1}{|\mathbf {X} |^{2}}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/36aef6769e6264751d25a514511de5c4d6de1b77)
물론 어느 것이 만족스러운 것

을(를) 허용할
수 없는 결정 규칙으로 만드는 것.
의 사용을 정당화할 수 있는 것은 남아 있다.

이 함수는 = 0 에서 단수이기 때문에 계속 다를 수 없지만
함수는

계속 다를 수 있으며, 대수학을 따라가서 → 0 을(를) 통과시킨 후에 동일한 결과를 얻는다
참조