백피팅 알고리즘

Backfitting algorithm

통계에서 백피팅 알고리즘일반화된 가법 모형을 적합시키는 데 사용되는 간단한 반복 절차다.1985년 레오 브레이만, 제롬 프리드먼이 일반화된 첨가제 모델과 함께 선보였다.대부분의 경우 백피팅 알고리즘은 방정식의 특정 선형 시스템을 해결하기 위한 가우스-세이델 방법 알고리즘과 동일하다.

알고리즘.

가법 모형은 다음과 같은 형태의 비모수 회귀 모형의 일종이다.

여기서 각 , , {\ 의 p{\ X -차원 예측 변수 Y이 우리의 결과 변수다. 은(는) 평균 0을 갖는 것으로 가정되는 우리의 고유 오류를 나타낸다. 는 단일 X 의 지정되지 않은 부드러운 기능을 나타낸다 의 유연성을 감안할 때 우리는 일반적으로 고유한 솔루션을 가지고 있지 않다: {\ 어떤 상수도 추가될 수 있기 때문에 식별할 수 없다. (를α {\displaystyle }에서 이 값을 뺀 후 이를 구속하여 수정하는 것이 일반적이다.

= 1 ( )= 모든 j 에 대해

떠나는

필시

백피팅 알고리즘은 다음과 같다.

Initialize , Do until  converge:For each predictor j:            (a)  (backfitting step)            (b)      -  /   =   f j (  i )  {{j좌측 추정 함수 중심)})

여기서 (는) 스무딩 연산자 입니다.이는 일반적으로 입방 스플라인 평활기로 선택되지만 다음과 같은 다른 적절한 장착 작업이 될 수 있다.

이론적으로 함수 추정치는 합이 0으로 제한되므로 알고리즘의 단계(b)는 필요하지 않다.그러나 수치상의 문제로 인해 이것은 실제로 문제가 될 수 있다.[1]

동기

예상되는 제곱 오차를 최소화하는 문제를 고려할 경우:

다음과 같이 주어지는 투영 이론에 의한 독특한 해법이 존재한다.

i = 1, 2, ..., p.

이를 통해 다음과 같은 행렬을 해석할 수 있다.

where . In this context we can imagine a smoother matrix, , which approximates our and gives an estimate, , of

또는 축약된 형태로

이것의 정확한 용액은 큰 np에 대해 계산하는 것이 불가능하므로, 백피팅의 반복적 기법을 사용한다.초기 추측 f ( ) 을(를) 취하여 j ( }^{(를) 차례로 업데이트하여 다른 모든 잔차에 대한 평활 핏이 되도록 한다.

축약된 형태를 보면 선형 평활 연산자 S에 대한 가우스-세이델 방법과 동등한 백피팅 알고리즘을 쉽게 볼 수 있다.

2차원에 대한 명시적 파생

다음에,[2] 우리는 2차원 케이스에 대한 백피팅 알고리즘을 명시적으로 공식화할 수 있다.다음이 있음:

ih 업데이트 단계에서 () 을(를) }의 추정치로 나타낸다면, 백피팅 단계는 다음과 같다.

유도에 의해 우리는 얻는다.

그리고

( )= (를) 설정하면

( 에서 f 2= - 를 직접 연결함으로써 해결했다

만약‖ S1S2‖<>우리는;1}. 이 경우, f, f^ 2(나는)→ f^ 1(∞), f^ 2(∞){\displaystyle{\hat{f}}_{1}^{(나는)},{\hat{f}}_{2}^{(나는)}{\xrightarrow{}}{\hat{f}}_{1}^{(\infty)},{\hat{f}}_{2}^{(\in 1(나는)^게 수렴 1{\displaystyle)S_{1}S_{2}\<>고 있다.fty)}:

We can check this is a solution to the problem, i.e. that and converge to and correspondingly, by plugging these expressions into the or이그날 방정식

문제들

알고리즘을 언제 중지할 것인지에 대한 선택은 임의적이며 특정 수렴 임계값에 도달하는 데 얼마나 시간이 걸릴지 선험적으로 알기는 어렵다.또한 최종 모형은 예측 변수 X 가 적합되는 순서에 따라 달라진다.

또한, 뒷부분 피팅 절차에서 찾은 해결책은 독특하지 않다.If is a vector such that from above, then if is a solution then so is is also a solution for any . A modifiS의 Eigenspace에 대한 투영을 포함하는 백 피팅 알고리즘의 cation은 이 문제를 해결할 수 있다.

수정 알고리즘

우리는 독특한 솔루션을 제공하는 것이 더 쉽도록 백피팅 알고리즘을 수정할 수 있다. ( ) 을 고유값 1에 해당하는 Si 모든 고유 벡터에 의해 확장되는 공간이 되도록 한다.Then any b satisfying has and Now if we take to be a matrix that projects orthogonally onto , we get the following modified backfitting algorithm:

Initialize ,,  Do f   수렴 시까지:Regress  onto the space , setting  For each predictor j:            App스무딩 연산자-  i   를 사용하여(-  에 대한 리백피팅 업데이트   {에 대한 새로운 추정치 제시

참조

  1. ^ 헤스티, 트레버, 로버트 티비시라니, 제롬 프리드먼(2001) 등이 출연했다.통계적 학습의 요소: 데이터 마이닝, 추론 예측.스프링거, ISBN0-387-95284-5.
  2. ^ Herdle, Wolfgang; 외 (2004년 6월 9일)"뒤집기"2015-05-10년 원본에서 보관.2015-08-19년 회수
  • Breiman, L. & Friedman, J. H. (1985). "Estimating optimal transformations for multiple regression and correlations (with discussion)". Journal of the American Statistical Association. 80 (391): 580–619. doi:10.2307/2288473. JSTOR 2288473.
  • Hastie, T. J. & Tibshirani, R. J. (1990). "Generalized Additive Models". Monographs on Statistics and Applied Probability. 43.
  • Härdle, Wolfgang; et al. (June 9, 2004). "Backfitting". Archived from the original on 2015-05-10. Retrieved 2015-08-19.

외부 링크