베이지안 선형 회귀

Bayesian linear regression

베이지안 선형 회귀는 한 변수의 평균이 다른 변수의 선형 조합에 의해 설명되는 조건부 모델링의 한 유형으로, 회귀 계수의 사후 확률을 얻고 궁극적으로 표본 외 분포를 허용하는 것을 목표로 한다.regressand( y로 표시됨)의 ple 예측은 regressor(X\displaystyle X의 관측값에 따라 결정됩니다.이 모델의 가장 단순하고 널리 사용되는 버전은 정규 선형 모델이며, X y {\ y 가우스 분포입니다.이 모델에서, 그리고 매개 변수에 대한 사전 확률의 특정 선택(이른바 공역 우선) 하에서, 후방을 분석적으로 찾을 수 있다.더 임의로 선택된 이전 항목에서는 일반적으로 후부를 근사해야 합니다.

모델 셋업

i , {\ 대해 k× {\ k1} xi :의 분포 평균을 지정하는 표준 선형 회귀 문제를 고려합니다.

β(\ 1)는 ×(\ k1) 이며 displaystyle})는 독립적이고 동일정규 분포를 따르는 랜덤 변수입니다.

이는 다음 우도 함수에 해당합니다.

무어-펜로즈 유사 역수를 사용하여 계수 벡터를 추정하는 데 일반 최소 제곱 솔루션이 사용됩니다.

서 X{ n×(\n k 설계 매트릭스이며, 각 행은 예측 xT(\ \i})^{\{T이고(\y 입니다\;

는 빈도론적인 접근법이며 의미 있는 것을 말할 수 있는 충분한 측정치가 있다고 가정한다. 베이지안 접근법에서는 데이터가 사전 확률 분포의 형태로 추가 정보로 보충된다.파라미터에 대한 이전의 믿음은 Bayes 정리에 따른 데이터의 우도 함수와 결합되어 β(\(\에 대한 사후적 믿음을 얻을 수 있습니다.앞의 믿음은 도메인 및 정보에 따라 다른 기능 형태를 취할 수 있습니다.는 priori로 이용할 수 있습니다.

데이터는 yX(\ 로 구성되므로 X 으로 y에만 초점을 맞춥니다.실제로 "풀" 베이지안 분석에는( β 2, \ \{\ \^{ \ 공동우도 합니다는 X 의 파라미터를 나타냅니다.접합우도는 (약한) 외부성을 전제로 하는 경우에만 ( X , , 2 로 인수할 수 있습니다 \( \ mathbf ) \ mid {} { \ my}[1] 보통 후자는 분리된 파라미터 세트를 가정하여 무시됩니다보다 일반적인 가정 하에서 X: 설계 실험에서 X\ 선택된 것으로 간주되며,[2] 따라서 매개 변수 없이 알려진 확률을 갖는다.

켤레 전과가 있는 경우

켤레 사전분포

임의 사전 분포의 경우 사후 분포에 대한 분석 솔루션이 없을 수 있습니다.이 섹션에서는 후분포를 분석적으로 도출할 수 있는 이른바 켤레에 대해 검토한다.

앞의^{ }) 및(\displaystyle\ 한 기능 형태를 가진 경우 이 우도 함수에 해당됩니다. 로그 우도는 (-) { {정규가 되도록 고쳐 씁니다.

현재 가능성은 다음과 같이 재작성됩니다.

어디에
서 kk는 회귀 계수의 수입니다.

이는 앞의 형식을 제안합니다.

( 2 displaystyle \( \ style ^ {} )는 역수 분포입니다.

역감마 분포 기사에서 소개된 표기법에서 이것은 ( 0 0의 밀도입니다.\ style {} 0 2 {= {0} } = { } {{0} } = v0 v2 inv 0 0 = tfrfreclash {0} {0} {0} {0} {0} {0} { 0 } } \ v \스케일카이 제곱 분포 (v , 0 ) .{ { \ text { Scale - - } \} ( v _ , _ { 0 }^{} )로도 설명할 수 있습니다.

또한 조건부 2){ \^{ 정규 분포이다.

정규 분포 표기법에서 조건부 사전 분포는 N 0 2 0-)입니다{\ {^}

후방 분포

이전을 지정하면, 후방 분포는 다음과 같이 표현될 수 있다.

몇몇 re-arrangement,[3]β{\displaystyle{\boldsymbol{\beta}}}은 최소한의 조건에서 평가자β ^{\displaystyle{\hat{\boldsymbol{\beta}}}사각형 틀을 표현할 수 있도록 posterior}매개 변수 벡터의μ n{\displaystyle{\boldsymbol{\mu}}_{n}말은 posterior}과 다시 씌여 찔 수 있다.pr, 0 정밀도 매트릭스 0 스타일 {\으로 표시된 앞의 강도를 의미합니다.

{{\}}이 실제로 후방 평균임을 정당화하기 위해 지수의 2차 항을β - {\{\[4]2차 형식으로 정렬할 수 있습니다.

이제 후부는 정규 분포 x 역감마 분포로 표현될 수 있습니다.

따라서 후분포는 다음과 같이 모수화할 수 있다.

여기서 두 인자는 N n 2 n - 1의 밀도에 대응합니다n}},\}{\{{-오른쪽 대응합니다.개의 분포와 이들 파라미터는 다음과 같습니다.

이는 다음 방정식에 따라 매개변수가 업데이트되는 베이지안 학습으로 해석될 수 있습니다.

모델 증거

모델 p m)(\ p \ m m(\ m에 주어진 데이터의 확률이다.한계 우도 및 사전 예측 밀도라고도 합니다.여기서 모델은 p β, { p \ {\ 모수(의 이전 에 의해 정의됩니다모형 증거는 이러한 모형이 관측치를 얼마나 잘 설명하는지 단일 번호로 포착합니다.이 절에서 제시된 베이지안 선형 회귀 모델의 모델 증거는 베이지안 모델 비교에 의해 경쟁하는 선형 모델을 비교하는 데 사용될 수 있다.이러한 모형은 예측 변수의 수와 값뿐만 아니라 모형 모수에 대한 우선 순위도 다를 수 있습니다.모델 복잡도는 모델 증거에 의해 이미 고려되고 있다. 왜냐하면 모델 복잡도는β의 가능한 값에 대해 pβ, β Xp(\{y {\ 으로써 하기 때문이다 입니다.

이 적분은 해석적으로 계산할 수 있으며, 해답은 다음 [5]방정식으로 제공됩니다.

여기서(\ 감마 함수를 나타냅니다.먼저 켤레를 선택했으므로, β(\의 값에 대해 다음과 같은 동등성을 평가하여 한계우도를 쉽게 계산할 수 있습니다.

이 방정식은 베이즈 정리를 다시 배열하는 것에 불과하다는 것을 유념하십시오.선행, 우도, 후방에 대한 공식을 삽입하고 결과 표현을 단순화하면 위에 제시된 분석 표현으로 이어집니다.

기타 케이스

일반적으로 후방 분포를 분석적으로 도출하는 것이 불가능하거나 비실용적일 수 있다.그러나 몬테카를로[6] 샘플링 또는 변동 베이즈같은 근사 베이지안 추론 방법에 의해 후방을 근사할 수 있다.

특수 0 0 0 {\{\{0}}= 능선 회귀라고 합니다.

다변량 회귀 분석의 일반적인 경우 유사한 분석을 수행할 수 있으며, 이 분석의 일부는 공분산 행렬의 베이지안 추정을 제공합니다. 베이지안 다변량 선형 회귀를 참조하십시오.

「 」를 참조해 주세요.

메모들

  1. ^ 잭맨(2009), 페이지 101 참조.
  2. ^ Gelman et al. (2013), 페이지 354를 참조한다.
  3. ^ 이 계산의 중간 단계는 선형 모델에 대한 장 첫머리의 O'Hagan(1994)에서 찾을 수 있다.
  4. ^ 중간 단계는 Fahrmeir 등입니다.(2009년) (188페이지.
  5. ^ 이 계산의 중간 단계는 257페이지의 O'Hagan(1994)에서 찾을 수 있다.
  6. ^ 칼린과 루이스(2008)와 겔만 등.(2003)는 베이지안 선형 회귀를 위한 샘플링 방법을 설명한다.

레퍼런스

  • Box, G. E. P.; Tiao, G. C. (1973). Bayesian Inference in Statistical Analysis. Wiley. ISBN 0-471-57428-7.
  • Carlin, Bradley P.; Louis, Thomas A. (2008). Bayesian Methods for Data Analysis (Third ed.). Boca Raton, FL: Chapman and Hall/CRC. ISBN 1-58488-697-8.
  • Fahrmeir, L.; Kneib, T.; Lang, S. (2009). Regression. Modelle, Methoden und Anwendungen (Second ed.). Heidelberg: Springer. doi:10.1007/978-3-642-01837-4. ISBN 978-3-642-01836-7.
  • Gelman, Andrew; et al. (2013). "Introduction to regression models". Bayesian Data Analysis (Third ed.). Boca Raton, FL: Chapman and Hall/CRC. pp. 353–380. ISBN 978-1-4398-4095-5.
  • Jackman, Simon (2009). "Regression models". Bayesian Analysis for the Social Sciences. Wiley. pp. 99–124. ISBN 978-0-470-01154-6.
  • Rossi, Peter E.; Allenby, Greg M.; McCulloch, Robert (2006). Bayesian Statistics and Marketing. John Wiley & Sons. ISBN 0470863676.
  • O'Hagan, Anthony (1994). Bayesian Inference. Kendall's Advanced Theory of Statistics. Vol. 2B (First ed.). Halsted. ISBN 0-340-52922-9.

외부 링크