식별 가능성

Identifiability

통계에서 식별가능성모형정확한 추론이 가능하려면 충족해야 하는 속성이다. 모델은 모델로부터 무한한 수의 관측치를 얻은 후 이론적으로 이 모델의 기본 매개변수의 참 값을 학습할 수 있다면 식별할 수 있다. 수학적으로 이것은 모수의 다른 값이 관측 가능한 변수의 다른 확률 분포를 생성해야 한다고 말하는 것과 같다. 일반적으로 모델은 특정 기술적 제한 하에서만 식별할 수 있으며, 이 경우 이러한 요건의 집합을 식별 조건이라고 한다.

식별할 수 없는 모델은 식별 불가능하거나 식별 불가능한 것으로 알려져 있다. 즉, 두 개 이상의 파라메트리징이 관찰적으로 동일하다. 모형이 식별 불가능한 경우에도 모형 매개변수의 특정 부분 집합의 참 값을 배울 수 있다. 이 경우에 우리는 모델이 부분적으로 식별될 수 있다고 말한다. 다른 경우에는 매개변수 공간의 특정 유한 영역까지 참 매개변수의 위치를 학습할 수 있으며, 이 경우 모델을 식별할 수 있도록 설정할 수 있다.

모델 속성에 대한 엄격한 이론적 탐구 외에도, 식별 가능성 분석을 사용하여 실험 데이터 세트로 모델을 시험할 때 더 넓은 범위에서 식별 가능성을 언급할 수 있다.[1]

정의

Let ={ : } } {\ {p\}}은 매개 변수 공간 이(가) 유한 또는 무한 차원인 통계 모델이다. 매핑 Pdisplaystyle {\은(는) one P 이(가) 일대일 경우 }이(가) 식별할 수 있다고 한다.[2]

이 정의는 θ의 구별되는 값이 구별되는 확률 분포에 대응해야 한다는 것을 의미한다: θ1θ2 경우, Pθ1Pθ2 이에 해당한다.[3] 만약 그 분포는 확률 밀도 기능의 관점에서 정의되어 있는 경우에만 0이 아닌 조치의 집합을 다르≤ 1만 한 지점에서 차이가 있으므로(pdfs)들은 두 pdfs 뚜렷한(예를 들어 두가지 기능을 ƒ1())=10≤)<>1과 ƒ2()))10≤))=1및 따라서 경멸하다로 간주될 수 없조치 0—의 집합 — 고려되어야 한다.착색한 pdfs cm이다.

의 부정성 관점에서 모델의 식별가능성은 모델을 무한정 관찰할 수 있는 경우 모델의 참 파라미터를 학습할 수 있는 것과 동등하다. 실제로 {Xt} ⊆ S가 모델로부터 관측의 순서라면, 그렇다면 대수의 강한 법칙에 의해,

모든 측정 가능한 세트 AS에 대해 (여기서 1{...} 표시기 기능이다). 따라서 무한히 많은 관측치를 통해 모델에서 실제 확률0 분포 P를 찾을 수 있을 것이며, 위의 식별 가능성 조건에서는 지도 을(를) 변환할 수 있어야 하기 때문에 주어진 파라미터의 실제 값도 찾을 수 있을 것이다. 유통0 P.

예 1

을(를) 일반적 위치 척도 패밀리로 설정:

그러면

이 식은 모든 계수가 0일 때만 거의 모든 x에 대해 0과 같으며, 이는 σ1 = μ2, μ1 = μ2 때만 가능하다. 스케일 파라미터 in에서 in은 0보다 크도록 제한되기 때문에 모델을 식별할 수 있다고 결론짓는다: ƒθ1 = ƒθ2 θ1 = θ2 = =.

예 2

을(를) 표준 선형 회귀 모형으로 설정:

(여기서 ′은 전치 행렬을 나타낸다.) 그런 다음 매개 변수 β는 매트릭스 [ x {을(를) 변환할 수 없는 경우에만 식별할 수 있다. 따라서, 이것은 모델에서 식별 조건이다.

예 3

이(가) 일반 오류-변수 선형 모형이라고 가정하십시오.

여기서 (수치, η,x*)는 기대치가 0이고 분산이 알 수 없는 공동 정규의 독립 랜덤 변수로서 변수(x,y)만 관측된다. 그러면 이 모델은 식별할 수 없으며,[4] 제품 βσ²만 존재한다(여기서 σ²는 잠재적 역류기 x*의 분산이다). 이것은 또한 일련의 식별 가능한 모델의 예로서, 비록 β의 정확한 값은 학습할 수 없지만, 우리는 βyx x에 대한 y의 OLS 회귀에서 계수이고, βxy x에 대한 x에 대한 OLS 회귀에서 계수인 간격(βyx, 1÷βxy)의 어딘가에 있어야 한다고 보장할 수 있다.[5]

만일 우리가 정규성 가정을 포기하고 x*가 정상적으로 분포되지 않고 독립성 조건 ε η η x*만 유지되도록 요구한다면, 모델은 식별 가능해진다.[4]

소프트웨어

부분적으로 관측된 동적 시스템에서 매개변수 추정의 경우, 프로파일 우도는 구조 및 실제 식별 가능성 분석에도 사용될 수 있다.[6] [1]의 구현은 MATLAB 툴박스 도터에서 이용할 수 있다.바퀴.

참고 항목

참조

인용구

  1. ^ Raue, A.; Kreutz, C.; Maiwald, T.; Bachmann, J.; Schilling, M.; Klingmuller, U.; Timmer, J. (2009-08-01). "Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood". Bioinformatics. 25 (15): 1923–1929. doi:10.1093/bioinformatics/btp358. PMID 19505944.
  2. ^ Lehmann & Casella 1998, Definition 1.5.2
  3. ^ 반 데르 바르트 1998, 페이지 62
  4. ^ a b 1950년 레이어절
  5. ^ Casella & Berger 2001, 페이지 583 (
  6. ^ Raue, A; Kreutz, C; Maiwald, T; Bachmann, J; Schilling, M; Klingmüller, U; Timmer, J (2009), "Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood", Bioinformatics, 25 (15): 1923–9, doi:10.1093/bioinformatics/btp358, PMID 19505944, archived from the original on 2013-01-13.

원천

추가 읽기

  • Walter, É.; Pronzato, L. (1997), Identification of Parametric Models from Experimental Data, Springer

계량학