불변 추정기
Invariant estimator![]() |
통계에서 불변 추정기라는 개념은 동일한 수량에 대해 서로 다른 추정기의 특성을 비교하는 데 사용할 수 있는 기준이다.그것은 추정자가 직관적으로 호소력 있는 특정한 자질을 가져야 한다는 생각을 공식화하는 방법이다.엄밀히 말하면 "불변량"은 측정값과 모수가 모두 호환되는 방식으로 변환될 때 추정치 자체가 변경되지 않는다는 것을 의미하지만, 그러한 변환과 함께 적절한 방식으로 추정치가 변경될 수 있도록 의미가 확장되었다.[1]등가 추정기라는 용어는 데이터 집합과 매개변수화에 대한 변경에 대응하여 추정기가 변화하는 방식의 관계에 대한 정확한 설명을 포함하는 형식적인 수학적 맥락에서 사용된다. 이는 보다 일반적인 수학에서 "등가성"을 사용하는 것과 일치한다.
일반설정
배경
통계적 추론에서 추정 이론에는 그러한 접근법에 따라 어떤 추정기를 사용해야 하는지를 즉시 결정하는 데 사용할 수 있는 몇 가지 접근법이 있다.예를 들어, 베이지안 추론에서 나온 아이디어는 베이지안 추정자들에게 직접 연결될 것이다.마찬가지로 고전적 통계적 추론 이론은 때때로 어떤 추정기를 사용해야 하는지에 대한 강한 결론을 이끌어낼 수 있다.그러나 이러한 이론의 유용성은 완전히 규정된 통계적 모델을 갖는 것에 달려 있으며 추정자를 결정하는 관련 손실 함수를 갖는 것에 달려 있을 수도 있다.따라서 베이지안 분석이 수행되어 관련 매개변수에 대한 후방 분포를 초래할 수 있지만 특정 효용 또는 손실 함수의 사용은 불분명할 수 있다.이후 불변의 아이디어는 후분포를 요약하는 과제에 적용될 수 있다.다른 경우에 통계적 분석은 완전히 정의된 통계적 모델 없이 수행되거나 고려되는 모델군이 그러한 취급에 순응할 수 없기 때문에 통계적 추론의 고전적 이론을 쉽게 적용할 수 없다.일반적인 이론이 추정기를 규정하지 않는 이러한 경우에 더하여, 추정기의 적용의 단순성을 위해서 또는 추정자가 강건하게 되도록 대체 형태의 추정자를 구할 때 추정기의 불변성 개념을 적용할 수 있다.
불변성의 개념은 때때로 추정자 사이의 선택 방법으로서 그 자체로 이용되기도 하지만, 이것이 반드시 결정적인 것은 아니다.예를 들어, 불변성의 요구사항은 추정자를 평균 편중시키지 않는다는 요구사항과 양립할 수 없을 수 있다. 반면에, 중위 편중성의 기준은 추정자의 표본 추출 분포 관점에서 정의되므로 많은 변환에서 불변한다.
불변성 개념의 한 가지 용도는 추정자의 계급 또는 집단이 제안되고 이들 중에서 특정 제형을 선택해야 하는 경우다.한 가지 절차는 관련 불변성 특성을 부여한 다음 이 세분류 내에서 최상의 성질을 가진 제형을 찾아 최적의 불변성 추정기라고 하는 것을 유도하는 것이다.
불변 추정기의 일부 클래스
불변 추정기를 다룰 때 유용하게 고려되는 변환에는 몇 가지 유형이 있다.각각은 그러한 특정 유형의 변환에 불변하는 추정기 클래스를 생성한다.
- 이동 불변도:개념적으로 위치 모수의 추정치는 데이터 값의 단순한 이동에 불변해야 한다.모든 데이터 값이 지정된 양만큼 증가하면 동일한 양만큼 추정치가 변경되어야 한다.가중 평균을 사용한 추정을 고려할 때, 이 불변 요건은 즉시 가중치가 1로 합해져야 한다는 것을 의미한다.동일한 결과가 종종 편향되지 않은 요구조건에서 도출되지만, "불균형"을 사용하면 평균값이 존재할 필요가 없으며 확률분포를 전혀 사용하지 않는다.
- 척도 불변도:추정기 척도 모수의 비침습성에 대한 이 항목은 집계 속성(물리학)에서 시스템의 동작에 대한 보다 일반적인 척도 비침습과 혼동되지 않아야 한다는 점에 유의하십시오.
- 매개 변수 변환 침입도:여기서 변환은 파라미터에만 적용된다.여기서의 개념은 모형이 매개변수 data을 사용한 경우처럼 본질적으로 동일한 추론을 동일한 데이터 및 매개변수 θ을 포함하는 모델에서 해야 한다는 것이다. 여기서 φ은 θ, φ=h(θ)의 일대일 변환이다.이러한 유형의 불변성에 따라 변형-불변성 추정기의 결과도 φ=h(θ)에 의해 연관되어야 한다.변환이 단조로울 때 최대우도 추정기는 이 속성을 갖는다.추정기의 점근 성질은 불변할 수 있지만, 작은 표본 성질은 다를 수 있으므로 특정 분포를 도출해야 한다.[2]
- 순열 불변도:데이터 값 집합이 독립적이고 동일한 분포의 랜덤 변수의 결과라는 통계적 모델로 나타낼 수 있는 경우, 공통 분포의 모든 속성에 대한 추정자는 순열-변수(특히 펑티오)여야 한다는 요구사항을 부과하는 것이 합리적이다.데이터 집합의 n은 데이터 항목이 데이터 집합 내에서 교환되는 경우 변경되지 않아야 한다.
가중 평균을 사용하여 독립적이고 동일한 분포의 데이터 집합에서 위치 매개변수를 추정하기 위한 순열 불변도와 위치 불변도의 조합은 가중치가 같아야 하고 가중치가 1이어야 함을 의미한다.물론 가중 평균 이외의 추정기가 더 좋을 수 있다.
최적 불변 추정기
이 설정에 따라 알 수 없는 매개 변수 에 대한 정보가 포함된 x x가 제공되며 측정 x 는 f ) f(\ta 휘)를 갖는 벡터 랜덤 변수로 모델링된다.ch는 매개 변수 벡터 에 따라 달라진다
는 x \theta}을(를 x x로 추정하는 것이다이(가 나타내는 추정치는 측정값의 함수로서 A 에 속한다The quality of the result is defined by a loss function which determines a risk function .한 x x 및 의 값 집합은 각각 및 A 로 표시된다
구분에
통계 분류에서 새로운 데이터에 클래스를 할당하는 규칙은 특별한 유형의 추정기로 간주될 수 있다.패턴 인식을 위한 사전 지식을 형성할 때 많은 비침해성 유형의 고려사항을 포함할 수 있다.
수학적 설정
정의
불변 추정기는 다음 두 가지 규칙을 준수하는 추정치다.[citation needed]
- 합리적 침해의 원리:의사결정 문제에서 취한 조치는 사용된 측정에 따른 변형에 의존해서는 안 된다.
- 침입 원리:두 결정 문제가 동일한 형식 구조를 가지고 X {\X , (및 각 문제에 동일한 결정 규칙을 사용해야 한다.
불변 또는 등가 추정기를 공식적으로 정의하려면 먼저 변환 그룹과 관련된 일부 정의가 필요하다. 이(가) 가능한 데이터 샘플 집합을 나타내도록 하십시오. 이가)나타내는 X {\의 변환 그룹은 (측정 가능한) 1:1의 집합이며X {\을 (를) 그 자체로 변환하는 집합으로, 과 같은 조건을 만족한다.
- 및 g 인 경우 2 G
- 인 경우 - g 서 - ()= x .. g즉, 각 변환은 그룹 내에서 역행한다.
- 즉, ID 변환 ( )=
G 에 대해 1= ( ) 인 경우 집합 }=g 등가 모두 동등 클래스를 형성한다.그러한 동등성 등급을 궤도( 라고 한다.The orbit, , is the set . If consists of a single orbit then is said to be transitive.
A family of densities is said to be invariant under the group if, for every and there exists a unique such that 은 (는) f ^{*}. 은(는) g {\g)로 표시된다
If is invariant under the group then the loss function is said to be invariant under if for every and there exists an such that for all . The transformed value will be denoted by .
In the above, is a group of transformations from to itself and is a group of transformations from to i3자신의
위에서 정의한 바와 G G ~ {\ GG},{\ 세 개의 그룹이 있는 경우 에 따라 추정 문제는 불변(등변)이다.
에서 불변하는 추정 문제의 경우 추정기 ) 은 (는) ∈ X 및 G에서 불변 추정기입니다
특성.
- The risk function of an invariant estimator, , is constant on orbits of . Equivalently for all and
- 전이성 이(가) 있는 불변 추정기의 위험 기능은 일정하다.
주어진 문제에서 위험이 가장 낮은 불변 추정기를 "최상의 불변 추정기"라고 부른다.최고의 불변 추정기를 항상 달성할 수는 없다.이를 달성할 수 있는 특별한 경우는 이(가) 전이적인 경우다.
예: 위치 매개변수
Suppose is a location parameter if the density of is of the form . For and , the problem is invariant under = ~={ : (x)= x+ c }g(x)=이 경우 불변 추정기는 충족해야 한다.
thus it is of the form (). is transitive on so the risk does not vary with : that is, = R최고의 불변 추정기는 위험 을 최소로 가져오는 것이다.
L이 )= - [X = . X =인 경우
핏만 추정기
The estimation problem is that has density , where θ is a parameter to be estimated, and where the loss function is .이 문제는 다음과 같은 (가법적) 변환 그룹에 불변한다.
최고의 불변 추정기 ( x) 은 (는) 최소화하는 것이다.
피트만의 추정가(1939년) 입니다.
제곱 오류 손실 사례의 경우, 결과는
~ , I) N즉, 독립적인 단위-분산 성분이 있는 다변량 정규 분포)인 경우
~ ( , )인 경우,{\x\ C스케일 파라미터가 σ인 Cauchy 분포를 갖는 독립 구성 요소) 이후 p 그러나 결과는 다음과 같다.
와 함께
참조
- Berger, James O. (1985). Statistical decision theory and Bayesian Analysis (2nd ed.). New York: Springer-Verlag. ISBN 0-387-96098-8. MR 0804611.[페이지 필요]
- Freue, Gabriela V. Cohen (2007). "The Pitman estimator of the Cauchy location parameter". Journal of Statistical Planning and Inference. 137: 1900–1913. doi:10.1016/j.jspi.2006.05.002.
- Pitman, E.J.G. (1939). "The estimation of the location and scale parameters of a continuous population of any given form". Biometrika. 30 (3/4): 391–421. doi:10.1093/biomet/30.3-4.391. JSTOR 2332656.
- Pitman, E.J.G. (1939). "Tests of Hypotheses Concerning Location and Scale Parameters". Biometrika. 31 (1/2): 200–215. doi:10.1093/biomet/31.1-2.200. JSTOR 2334983.