일반 선형 모형

General linear model

일반 선형 모형 또는 일반 다변량 회귀 모형은 여러 의 다중 선형 회귀 모형을 동시에 작성하는 소형 방법입니다.그런 의미에서 그것은 별도의 통계 선형 모델이 아니다.다양한 다중 선형 회귀 모형은 다음과 같이 간략하게 작성될[1] 수 있습니다.

여기서 Y는 일련의 다변량 측정값이 포함된 행렬( 열은 종속 변수 중 하나에 대한 측정값 집합), X설계 행렬일 수 있는 독립 변수에 대한 관측치 행렬( 열은 독립 변수 중 하나에 대한 관측치 집합), B는 다음과 같은 모수를 포함하는 행렬입니다.추정할 동맹이며 U는 오차(잡음)를 포함하는 행렬입니다.일반적으로 오차는 측정값 간에 상관 관계가 없으며 다변량 정규 분포를 따르는 것으로 가정합니다.오차가 다변량 정규 분포를 따르지 않으면 일반화 선형 모형을 사용하여 Y와 U에 대한 가정을 완화할 수 있습니다.

일반 선형 모형에는 분산 분석, ANCOVA, 다변량 분산 분석, MANCOVA, 일반 선형 회귀 분석, t-검정F-검정여러 가지 통계 모형이 포함되어 있습니다.일반 선형 모형은 종속 변수가 두 개 이상인 경우에 다중 선형 회귀를 일반화한 것입니다.Y, B U가 열 벡터인 경우 위의 행렬 방정식은 다중 선형 회귀 분석을 나타냅니다.

일반 선형 모형을 사용한 가설 검정은 다변량 검정 또는 몇 가지 독립적인 일변량 검정이라는 두 가지 방법으로 수행할 수 있습니다.다변량 검정의 경우 Y 을 함께 검정하는 반면, 일변량 검정의 경우 Y 을 독립적으로 검정합니다. 즉, 설계 행렬이 동일한 다중 일변량 검정입니다.

다중 선형 회귀 분석과의 비교

다중 선형 회귀는 둘 이상의 독립 변수의 경우 단순 선형 회귀를 일반화하며, 종속 변수가 하나만 있는 일반 선형 모형의 특수한 경우입니다.다중 선형 회귀 분석의 기본 모형은 다음과 같습니다.

관측치에 대해 i = 1, ..., n.

위의 공식에서는 하나의 종속 변수와 p 독립 변수에 대한 n개의 관측치를 고려합니다.따라서ij, Y는 종속 변수th i 관측치이고ij, Xth j 독립 변수th i 관측치이고, j = 1, 2, ..., p. 값 β는 추정해야 할 모수를 나타내며, βi i 독립th 동일 분포 정규 오차이다.

보다 일반적인 다변량 선형 회귀 분석에서는 동일한 설명 변수 집합을 공유하여 서로 동시에 추정하는 m > 1 종속 변수 각각에 대해 위의 형식의 방정식이 하나 있습니다.

i = 1, ... , n으로 지수화된 모든 관측치와 j = 1, ... , m으로 지수화된 모든 종속 변수에 대해.

각 종속 변수에는 적합시킬 자체 회귀 모수 집합이 있으므로 계산적 관점에서 일반 다변량 회귀는 동일한 설명 변수를 사용하는 일련의 표준 다중 선형 회귀 분석일 뿐입니다.

일반화 선형 모형과의 비교

일반 선형 모형과 일반 선형 모형(GLM)[2][3]은 연속형 및/또는 범주형 예측 변수를 단일 결과 변수에 연관시키는 데 일반적으로 사용되는 두 가지 통계 방법 집합입니다.

두 접근법의 주된 차이점은 일반 선형 모형은 잔차조건부 정규 [4]분포를 따를 것이라고 엄격하게 가정하는 반면 GLM은 이러한 가정을 느슨하게 하고 [2]잔차에 대한 지수 계열의 다양한 다른 분포를 허용한다는 것입니다.일반 선형 모형은 잔차의 분포가 조건부 정규 분포를 따르는 GLM의 특수한 경우입니다.

잔차의 분포는 결과 변수의 유형 및 분포에 따라 크게 달라지며, 결과 변수의 유형이 다르면 GLM 제품군 내 모형이 다양해집니다.GLM 제품군에서 일반적으로 사용되는 모형에는 이항 또는 이분법 결과에 대한 이항 로지스틱[5] 회귀 분석, 카운트 결과에 대한 포아송 회귀[6] 분석 및 연속적이고 정규 분포된 결과에 대한 선형 회귀 분석이 포함됩니다.즉, GLM은 일반적인 통계 모델 패밀리 또는 특정 결과 유형의 특정 모델로 언급될 수 있다.

일반 선형 모형 일반화 선형 모형
전형적인 추정법 최소 제곱, 최량 선형 불편 예측 최대우또는 베이지안
분산 분석, ANCOVA, 선형 회귀 분석 선형 회귀 분석, 로지스틱 회귀 분석, 포아송 회귀 분석, 감마 회귀 분석,[7] 일반 선형 모형
확장 및 관련 방식 다변량 분산 분석, 다변량 분산 분석, 선형 혼합 모형 일반화 선형혼합모델(GLMM), 일반화 추정식(GE)
R 패키지 및 기능 stats 패키지(베이스 R)의 lm() stats 패키지(베이스 R)의 glm()
매트랩 함수 mvregress() glmfit()
SAS 절차 PROC GLM, PROC Reg PROC GENMOD, PROC 로지스틱 (2진수 및 순서 없는 범주형 결과용)
Stata 명령어 퇴보하다 glm
SPSS 명령어 회귀, glm genlin, 로지스틱
Wolfram Language & Mathematica 함수 선형 모델 적합[][8] Generalized Linear Model Fit [ [9]]
EViews 명령어 이요[10] glm[11]

적용들

일반적인 선형 모델의 적용은 과학 실험에서 다중스캔의 분석에 나타납니다.Y뇌 스캐너의 데이터를 포함하고 있습니다X에는 실험 설계 변수와 교란이 포함되어 있습니다.일반적으로 일변량 방식(일반적으로 이 설정에서는 질량-일변량이라고 함)으로 검정되며, 종종 통계 [12]모수 매핑이라고 합니다.

「 」를 참조해 주세요.

메모들

  1. ^ K. V. Mardia, J. T. Kent and J. M. Bibby (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5.
  2. ^ a b McCullagh, P.; Nelder, J. A. (1989), "An outline of generalized linear models", Generalized Linear Models, Springer US, pp. 21–47, doi:10.1007/978-1-4899-3242-6_2, ISBN 9780412317606
  3. ^ 폭스, J. (2015년)회귀 분석일반화 선형 모형 적용.세이지 출판사
  4. ^ Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003)행동과학에 대해 다중 회귀/상관 분석 적용.
  5. ^ Hosmer Jr, D. W., Lemeshow, S. 및 Sturdivant, R. X. (2013)로지스틱 회귀 분석 적용(398권).John Wiley & Sons.
  6. ^ Gardner, W.; Mulvey, E. P.; Shaw, E. C. (1995). "Regression analyses of counts and rates: Poisson, overdispersed Poisson, and negative binomial models". Psychological Bulletin. 118 (3): 392–404. doi:10.1037/0033-2909.118.3.392. PMID 7501743.
  7. ^ McCullagh, Peter; Nelder, John (1989). Generalized Linear Models, Second Edition. Boca Raton: Chapman and Hall/CRC. ISBN 978-0-412-31760-6.
  8. ^ Linear Model Fit, Wolfram Language Documentation Center.
  9. ^ Generalized Linear Model Fit, Wolfram 언어 문서 센터.
  10. ^ ls, EViews 도움말.
  11. ^ glm, EViews 도움말
  12. ^ K.J. Friston; A.P. Holmes; K.J. Worsley; J.-B. Poline; C.D. Frith; R.S.J. Frackowiak (1995). "Statistical Parametric Maps in functional imaging: A general linear approach". Human Brain Mapping. 2 (4): 189–210. doi:10.1002/hbm.460020402. S2CID 9898609.

레퍼런스

  • Christensen, Ronald (2020). Plane Answers to Complex Questions: The Theory of Linear Models (Fifth ed.). New York: Springer. ISBN 978-3-030-32096-6.
  • Wichura, Michael J. (2006). The coordinate-free approach to linear models. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge: Cambridge University Press. pp. xiv+199. ISBN 978-0-521-86842-6. MR 2283455.
  • Rawlings, John O.; Pantula, Sastry G.; Dickey, David A., eds. (1998). Applied Regression Analysis. Springer Texts in Statistics. doi:10.1007/b98890. ISBN 0-387-98454-2.