일반화 추정식
Generalized estimating equation통계에서 일반화 추정 방정식(GEE)을 사용하여 결과 간의 상관 관계를 알 수 없는 일반화 선형 모형의 모수를 추정한다.[1][2]null
GEE의 모수 추정치는 공분산 구조가 잘못 지정되어 있는 경우에도 온화한 정규성 조건에서 일관된다.GEE의 초점은 특정 개인에 대한 하나 이상의 공변량 변경 효과를 예측할 수 있는 회귀 모수보다는 모집단에 대한 평균 반응("인구 평균 효과")을 추정하는 데 있다.GEE는 일반적으로 Huber-White 표준 오차 추정치와 함께 사용되며, "로봇 표준 오차" 또는 "샌드위치 분산" 추정으로도 알려져 있다.작동하는 독립성 분산 구조를 가진 선형 모형의 경우, 이를 "계통성 일관성 표준 오차" 추정기로 알려져 있다.실제로 GEE는 이러한 표준 오차 추정기의 몇 가지 독립적인 공식들을 일반 프레임워크로 통합하였다.null
GEE는 처음 두 순간의 규격에 의존하기 때문에 반파라미터라고 불리는 회귀 기법의 종류에 속한다.그것들은 분산 구조 규격에 더 민감한 우도 기반 일반화된 선형 혼합 모델에 대한 일반적인 대안이다.[3]그것들은 일반적으로 큰 역학 연구, 특히 다중 사이트 코호트 연구에 사용된다. 왜냐하면 그들은 예후들 사이의 측정되지 않은 의존성의 많은 유형을 처리할 수 있기 때문이다.null
공식화
매개변수 i} 및 j{\ i과와 분산 구조에 따라 달라지는 평균 i {\ 에 대해 과 같은 방법으로 추정 방정식을 형성한다[4]
매개변수 는 U ()= 0}을를) 풀어서 추정되며 일반적으로 뉴턴-Raphson 알고리즘을 통해 얻는다.분산 구조는 모수 추정치의 효율성을 개선하기 위해 선택된다.매개변수 공간에 있는 GEE에 대한 용액의 Hesian을 사용하여 강력한 표준 오차 추정치를 계산할 수 있다.용어 "분산 구조"는 표본에서 결과 Y 사이의 공분산 행렬의 대수적 형태를 말한다.분산 구조 규격의 예로는 독립성, 교환성, 자기 회귀성, 고정 m 의존성 및 비정형화가 있다.GEE 회귀 모수에 대한 가장 일반적인 추론 형식은 순진하거나 강력한 표준 오차를 사용한 월드 시험이지만, 점수 시험 역시 대립 가설 하에서 정보의 추정치를 얻기 어려울 때 유효하고 선호된다.추정 방정식이 반드시 우도 방정식이 아니므로 우도 비율 검정은 이 설정에서 유효하지 않다.모델 선택은 독립 모델 기준(QIC)에 따른 콰실리크 우도인 AIC(Akaike Information Criteria, AIC)와 동등한 GEE로 수행할 수 있다.[5]
일반화 모멘트법과의 관계
일반화된 추정 방정식은 일반화된 모멘트 방법(GMM)의 특별한 경우다.[6] 점수 함수가 다음 등식을 만족해야 한다는 요건에서 바로 이러한 관계가 명백하다.
연산
MATLAB,[7] SAS(proc genmod[8]), SPSS(gee procedure[9]), Stata(xtgee 명령[10]), R(package gee,[11] geepack[12], multgee[13]), Python(package statsmodels[14])에서 일반화된 추정 방정식을 해결하기 위한 소프트웨어를 이용할 수 있다.null
GEE를 통한 이진 상관 데이터 및 순서[15][16] 상관 데이터의 분석을[17] 위한 소프트웨어 패키지 간의 비교를 이용할 수 있다.null
참고 항목
참조
- ^ Kung-Yee Liang and Scott Zeger (1986). "Longitudinal data analysis using generalized linear models". Biometrika. 73 (1): 13–22. doi:10.1093/biomet/73.1.13.
{{cite journal}}
: CS1 maint: 작성자 매개변수 사용(링크) - ^ Hardin, James; Hilbe, Joseph (2003). Generalized Estimating Equations. London: Chapman and Hall/CRC. ISBN 978-1-58488-307-4.
- ^ Fong, Y; Rue, H; Wakefield, J (2010). "Bayesian inference for generalized linear mixed models". Biostatistics. 11 (3): 397–412. doi:10.1093/biostatistics/kxp053. PMC 2883299. PMID 19966070.
- ^ Diggle, Peter J.; Patrick Heagerty; Kung-Yee Liang; Scott L. Zeger (2002). Analysis of Longitudinal Data. Oxford Statistical Science Series. ISBN 978-0-19-852484-7.
- ^ Pan, W. (2001), "Akaike's information criterion in generalized estimating equations", Biometrics, 57 (1): 120–125, doi:10.1111/j.0006-341X.2001.00120.x, PMID 11252586.
- ^ Breitung, Jörg; Chaganty, N. Rao; Daniel, Rhian M.; Kenward, Michael G.; Lechner, Michael; Martus, Peter; Sabo, Roy T.; Wang, You-Gan; Zorn, Christopher (2010). "Discussion of 'Generalized Estimating Equations: Notes on the Choice of the Working Correlation Matrix'". Methods of Information in Medicine. 49 (5): 426–432. doi:10.1055/s-0038-1625133. S2CID 3213776.
- ^ Sarah J. Ratcliffe and Justine Shults (2008). "GEEQBOX: A MATLAB Toolbox for Generalized Estimating Equations and Quasi-Least Squares". Journal of Statistical Software. 25 (14): 1–14.
{{cite journal}}
: CS1 maint: 작성자 매개변수 사용(링크) - ^ "The GENMOD Procedure". The SAS Institute.
- ^ "IBM SPSS Advanced Statistics". IBM SPSS website.
- ^ "Stata's implementation of GEE" (PDF). Stata website.
- ^ "gee: Generalized Estimation Equation solver". CRAN. 7 November 2019.
- ^ geepack: Generalized Estimating Equation Package, CRAN, 18 December 2020
- ^ multgee: GEE solver for correlated nominal or ordinal multinomial responses using a local odds ratios parameterization, CRAN, 13 May 2021
- ^ "Generalized Estimating Equations — statsmodels".
- ^ Andreas Ziegler and Ulrike Grömping (1998). "The generalised estimating equations: a comparison of procedures available in commercial statistical software packages". Biometrical Journal. 40 (3): 245–260. doi:10.1002/(sici)1521-4036(199807)40:3<245::aid-bimj245>3.0.co;2-n.
{{cite journal}}
: CS1 maint: 작성자 매개변수 사용(링크) - ^ Nicholas J. HORTON and Stuart R. LIPSITZ (1999). "Review of software to fit generalized estimating equation regression models". The American Statistician. 53 (2): 160–169. CiteSeerX 10.1.1.22.9325. doi:10.1080/00031305.1999.10474451.
{{cite journal}}
: CS1 maint: 작성자 매개변수 사용(링크) - ^ Nazanin Nooraee, Geert Molenberghs, and Edwin R. van den Heuvel (2014). "GEE for longitudinal ordinal data: Comparing R-geepack, R-multgee, R-repolr, SAS-GENMOD, SPSS-GENLIN" (PDF). Computational Statistics & Data Analysis. 77: 70–83. doi:10.1016/j.csda.2014.03.009.
{{cite journal}}
: CS1 maint: 작성자 매개변수 사용(링크)
추가 읽기
- Hardin, James; Hilbe, Joseph (2003). Generalized Estimating Equations. London: Chapman and Hall/CRC. ISBN 978-1-58488-307-4.
- Ziegler, A. (2011). Generalized Estimating Equations. Springer. ISBN 978-1-4614-0498-9.