커널 회귀 분석
Kernel regression통계에서 커널 회귀 분석은 랜덤 변수의 조건부 기대치를 추정하기 위한 비모수 기법이다. 목적은 한 쌍의 랜덤 변수 X와 Y 사이의 비선형 관계를 찾는 것이다.
모든 비모수 회귀 분석에서 변수 과 () 관련된변수 Y {\ Y}의 조건부 기대값은 다음과 같이 기록할 수 있다.
여기서 은 (는) 알 수 없는 함수다.
나다라야-왓슨 커널 회귀 분석
Nadaraya와 Watson은 둘 다 1964년에 커널을 가중 함수로 사용하여 을(를) 국부 가중 평균으로 추정할 것을 제안했다.[1][2][3] 나다라야-Watson 추정치는 다음과 같다.
여기서 는 대역폭 을(를) 가진 커널이다
파생
커널 K에 대한 공동 분포 f(x,y) 및 f(x)에 대한 커널 밀도 추정치를 사용하여,
( x)= i= h( - ) }^{n ,
우리는 얻는다.
나다라야-왓슨 추정기.
프리스틀리-차오 커널 추정기
여기서 은 대역폭(또는 평활 파라미터)이다.
가저-뮐러 커널 추정기
여기서 = x - + x
예
이 예는 1971년 캐나다 인구 조사 공공 사용 테이프에서 추출한 공통 교육을 받은 남성(13급)을 대상으로 한 무작위 표본으로 구성된 캐나다 횡단 임금 데이터에 기초한다. 모두 205개의 관측치가 있다.
오른쪽 그림은 2차 가우스 커널을 사용한 추정된 회귀 함수와 점근성 가변성 한계를 보여준다.
스크립트 예
R 프로그래밍 언어의 다음 명령은 npreg()
최적의 평활을 제공하고 위에 제시된 수치를 생성하는 기능. 이러한 명령은 커트 및 붙여넣기를 통해 명령 프롬프트에서 입력할 수 있다.
install.properties("np") 도서관(np) # 비 파라메트릭 라이브러리 자료(cps71) 붙이다(cps71) m <- npreg(벌목 임금~나이를 먹다) 음모를 꾸미다(m, plot.properties.properties.clot.="비흡수적", plot.csv.style.style="밴드", 이림=c(11, 15.2)) 포인트(나이를 먹다, 벌목 임금, 열매를 맺다=.25)
관련
데이비드 살스버그에 따르면, 커널 회귀에 사용된 알고리즘은 독립적으로 개발되어 퍼지 시스템에서 사용되었다: "거의 컴퓨터 알고리즘과 거의 정확하게 동일한 퍼지 시스템과 커널 밀도 기반 퇴행은 서로 완전히 독립적으로 개발된 것으로 보인다."[4]
통계적 구현
- GNU 옥타브 수학 프로그램 패키지
- 줄리아: 커널에스티메이터.jl
- MATLAB: 커널 회귀 분석, 커널 밀도 추정, 위험 함수의 커널 추정 등의 구현이 포함된 무료 MATLAB 도구 상자(이 도구 상자는 책의 일부임)
- 파이톤: 더
KernelReg
의 혼합 데이터 유형에 대한 클래스statsmodels.nonparametric
하위 프로세서(다른 커널 밀도 관련 클래스 포함), sklearn의 확장 기능으로 패키지 커널_message(메모리 측면에서, 소규모 데이터셋에만 유용) - R: 함수
npreg
np 패키지의 커널 회귀 분석을 수행할 수 있다.[6][7] - 통계분석: nprefrase, kernreg2
참고 항목
참조
- ^ Nadaraya, E. A. (1964). "On Estimating Regression". Theory of Probability and Its Applications. 9 (1): 141–2. doi:10.1137/1109020.
- ^ Watson, G. S. (1964). "Smooth regression analysis". Sankhyā: The Indian Journal of Statistics, Series A. 26 (4): 359–372. JSTOR 25049340.
- ^ Bierens, Herman J. (1994). "The Nadaraya–Watson kernel regression function estimator". Topics in Advanced Econometrics. New York: Cambridge University Press. pp. 212–247. ISBN 0-521-41900-X.
- ^ Salsburg, D. (2002). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. W.H. Freeman. pp. 290–91. ISBN 0-8050-7134-2.
- ^ Horová, I.; Koláček, J.; Zelinka, J. (2012). Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing. Singapore: World Scientific Publishing. ISBN 978-981-4405-48-5.
- ^ np: 혼합 데이터 유형에 대한 비모수 커널 평활 방법
- ^ Kloke, John; McKean, Joseph W. (2014). Nonparametric Statistical Methods Using R. CRC Press. pp. 98–106. ISBN 978-1-4398-7343-4.
추가 읽기
- Henderson, Daniel J.; Parmeter, Christopher F. (2015). Applied Nonparametric Econometrics. Cambridge University Press. ISBN 978-1-107-01025-3.
- Li, Qi; Racine, Jeffrey S. (2007). Nonparametric Econometrics: Theory and Practice. Princeton University Press. ISBN 0-691-12161-3.
- Pagan, A.; Ullah, A. (1999). Nonparametric Econometrics. Cambridge University Press. ISBN 0-521-35564-8.
- Simonoff, Jeffrey S. (1996). Smoothing Methods in Statistics. Springer. ISBN 0-387-94716-7.
외부 링크
- 스케일 적응형 커널 회귀 분석(Matlab 소프트웨어 포함)
- 스프레드시트를 사용한 커널 회귀 분석 자습서(Microsoft Excel 포함)
- 온라인 커널 회귀 분석 시연 필요.NET 3.0 이상.
- 자동 대역폭 선택을 통한 커널 회귀 분석(Python 포함)