베이지안 다변량 선형 회귀 분석

Bayesian multivariate linear regression

통계에서 베이지안 다변량 선형 회귀 분석은 다변량 선형 회귀, 즉 예측 결과가 단일 스칼라 랜덤 변수가 아닌 상관 랜덤 변수의 벡터인 선형 회귀에 대한 베이지안 접근법이다. 이 접근방식에 대한 보다 일반적인 처리는 MMSE 추정기 기사에서 찾을 수 있다.

세부 사항

예측될 종속 변수가 단일 실제 스칼라가 아니라 상관된 실제 숫자의 m-길이 벡터인 회귀 문제를 고려하십시오. 표준 회귀 설정에서와 같이, 각 관측치 i가 길이 k의 벡터 x _{i로 그룹화된 k-1 설명 변수구성된 관측치가 n개 있다. 이는 각 관측치 i:에 대한 m 관련 회귀 문제의 집합으로 볼 수 있다.

여기서 오류 집합{ i, ,… , i, 모두 상관 관계가 있다. 동등하게, 결과는 다음과 같이 행 벡터 (가) 있고 회귀 계수 벡터가 서로 옆에 쌓여 있는 단일 회귀 문제로 볼 수 있다.

계수 행렬 B m 행렬로, 계수 벡터 , β m 각 회귀 문제마다 으로 쌓인다.

관측치에 소음 벡터 i{\}}은(는) 공동으로 정상이므로 주어진 관측치에 대한 결과가 상관관계가 있다.

전체 회귀 문제를 행렬 형태로 다음과 같이 쓸 수 있다.

여기서 YE 행렬이다. 설계 행렬 X는 표준 선형 회귀 설정에서와 관측치가 수직으로 쌓인 k 행렬이다.

고전적이고 빈번한 선형 최소 제곱법은 단순히 Moore-Penrose 유사분포스를 사용하여 회귀 계수 의 행렬을 추정하는 것이다.

= (X X)- X Y

베이지안 솔루션을 얻으려면 조건부 우도를 지정한 다음 적절한 결합을 먼저 찾아야 한다. 선형 베이지안 회귀 분석의 일변량 사례와 마찬가지로, 우리는 (척도에 따라 달라지는) 자연 조건부 결합 전을 지정할 수 있다는 것을 발견할 것이다.

우리의 조건부 가능성을 다음과[1] 같이 쓰자.

, , 라는 오류 수율.

우리는 자연적인 결합 전 — 공동 밀도 (, 구한다. 가능성은 에서 2차이므로 - ) -기존 샘플 추정치와의 편차)에서 정규성을 갖도록 우도를 다시 쓴다

베이지안 선형 회귀 분석과 동일한 기법을 사용하여 제곱합 기법의 행렬 형식을 사용하여 지수 항을 분해한다. 그러나 여기서는 매트릭스 미적분학(Kronecker product and vectorization transformation)도 사용할 필요가 있을 것이다.

첫째, 제곱합 합계를 적용하여 다음 가능성에 대한 새로운 식을 얻으십시오.

우리는 전례를 위한 조건부 양식을 개발하고 싶다.

where is an inverse-Wishart distribution and is some form of normal distribution in the matrix . This is accomplished using the vectorization transformation, which converts the likelihood from a function of the matrices to a function of the vectors

쓰다

내버려두다

where denotes the Kronecker product of matrices A and B, a generalization of the outer product which multiplies an matrix by a matrix to generate an matrix, 두 행렬의 원소들의 모든 조합으로 구성된다.

그러면

경우( -β ) {\에서 정상일 가능성이 발생한다

좀 더 다루기 쉬운 형태의 가능성으로, 우리는 이제 자연적인 (조건적인) 결합을 먼저 찾을 수 있다.

결합 선행분포

벡터화 변수 을(를) 사용하기 전의 자연 결합은 다음과 같은 형식이다.[1]

,

어디에

그리고

후분포

위의 선행 및 우도를 이용하여 후분포를 다음과 같이 표현할 수 있다.[1]

여기서 )= 포함하는 용어는 다음을 사용하여 그룹화할 수 있다({\{U

,

와 함께

.

이것은 이제 더 유용한 형태로 후문을 쓸 수 있게 해준다.

값은 행렬 정규 분포역위산 분포의 시간을 곱하는 형식을 취한다.

그리고

.

이 후방의 매개변수는 다음과 같이 주어진다.

참고 항목

참조

  1. ^ a b c 피터 E. 로시, 그레그 M 앨런비, 롭 맥컬로치 베이시안 통계와 마케팅. 존 와일리 & 선즈, 2012, 32페이지.
  • Box, G. E. P.; Tiao, G. C. (1973). "8". Bayesian Inference in Statistical Analysis. Wiley. ISBN 0-471-57428-7.
  • Geisser, S. (1965). "Bayesian Estimation in Multivariate Analysis". The Annals of Mathematical Statistics. 36 (1): 150–159. JSTOR 2238083.
  • Tiao, G. C.; Zellner, A. (1964). "On the Bayesian Estimation of Multivariate Regression". Journal of the Royal Statistical Society. Series B (Methodological). 26 (2): 277–285. JSTOR 2984424.