커널 회귀 분석

Kernel regression

통계에서 커널 회귀 분석은 랜덤 변수조건부 기대치를 추정하기 위한 비모수 기법이다. 목적은 한 의 랜덤 변수 X와 Y 사이의 비선형 관계를 찾는 것이다.

모든 비모수 회귀 분석에서 변수 () 관련된변수 Y {\ Y}의 조건부 기대값은 다음과 같이 기록할 수 있다.

여기서 (는) 알 수 없는 함수다.

나다라야-왓슨 커널 회귀 분석

NadarayaWatson은 둘 다 1964년에 커널을 가중 함수로 사용하여 을(를) 국부 가중 평균으로 추정할 것을 제안했다.[1][2][3] 나다라야-Watson 추정치는 다음과 같다.

여기서 는 대역폭 을(를) 가진 커널이다

파생

커널 K에 대한 공동 분포 f(x,y)f(x)에 대한 커널 밀도 추정치를 사용하여,


( x)= i= h( - ) }^{n ,

우리는 얻는다.

나다라야-왓슨 추정기.

프리스틀리-차오 커널 추정기

여기서 대역폭(또는 평활 파라미터)이다.

가저-뮐러 커널 추정기

여기서 = x - + x

추정된 회귀 함수.

이 예는 1971년 캐나다 인구 조사 공공 사용 테이프에서 추출한 공통 교육을 받은 남성(13급)을 대상으로 한 무작위 표본으로 구성된 캐나다 횡단 임금 데이터에 기초한다. 모두 205개의 관측치가 있다.

오른쪽 그림은 2차 가우스 커널을 사용한 추정된 회귀 함수와 점근성 가변성 한계를 보여준다.

스크립트 예

R 프로그래밍 언어의 다음 명령은 npreg() 최적의 평활을 제공하고 위에 제시된 수치를 생성하는 기능. 이러한 명령은 커트 및 붙여넣기를 통해 명령 프롬프트에서 입력할 수 있다.

install.properties("np") 도서관(np) # 비 파라메트릭 라이브러리 자료(cps71) 붙이다(cps71)  m <- npreg(벌목 임금~나이를 먹다)  음모를 꾸미다(m, plot.properties.properties.clot.="비흡수적",      plot.csv.style.style="밴드",      이림=c(11, 15.2))  포인트(나이를 먹다, 벌목 임금, 열매를 맺다=.25) 

관련

데이비드 살스버그에 따르면, 커널 회귀에 사용된 알고리즘은 독립적으로 개발되어 퍼지 시스템에서 사용되었다: "거의 컴퓨터 알고리즘과 거의 정확하게 동일한 퍼지 시스템과 커널 밀도 기반 퇴행은 서로 완전히 독립적으로 개발된 것으로 보인다."[4]

통계적 구현

참고 항목

참조

  1. ^ Nadaraya, E. A. (1964). "On Estimating Regression". Theory of Probability and Its Applications. 9 (1): 141–2. doi:10.1137/1109020.
  2. ^ Watson, G. S. (1964). "Smooth regression analysis". Sankhyā: The Indian Journal of Statistics, Series A. 26 (4): 359–372. JSTOR 25049340.
  3. ^ Bierens, Herman J. (1994). "The Nadaraya–Watson kernel regression function estimator". Topics in Advanced Econometrics. New York: Cambridge University Press. pp. 212–247. ISBN 0-521-41900-X.
  4. ^ Salsburg, D. (2002). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. W.H. Freeman. pp. 290–91. ISBN 0-8050-7134-2.
  5. ^ Horová, I.; Koláček, J.; Zelinka, J. (2012). Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing. Singapore: World Scientific Publishing. ISBN 978-981-4405-48-5.
  6. ^ np: 혼합 데이터 유형에 대한 비모수 커널 평활 방법
  7. ^ Kloke, John; McKean, Joseph W. (2014). Nonparametric Statistical Methods Using R. CRC Press. pp. 98–106. ISBN 978-1-4398-7343-4.

추가 읽기

외부 링크