이항 회귀 분석
Binary regression| 다음에 대한 시리즈 일부 |
| 회귀분석 |
|---|
| 모델 |
| 추정 |
| 배경 |
통계, 특히 회귀 분석에서 이항 회귀 분석은 하나 이상의 설명 변수와 단일 출력 이항 변수 사이의 관계를 추정한다. 일반적으로 선형 회귀 분석에서처럼 단일 값을 단순히 출력하는 대신 두 가지 대안의 확률을 모델링한다.
이항 회귀 분석은 보통 이항 회귀의 특별한 경우로서 분석되는데, 단일 결과(= 1 와 "성공"으로 간주되고 1로 코딩되는 두 가지 대안 중 하나: 값은 0 또는 1의 1 실험에서의 성공 횟수다. 가장 일반적인 이항 회귀 분석 모형은 로짓 모형(로지스틱 회귀 분석)과 프로빗 모형(프로빗 회귀 분석)이다.
적용들
이항 회귀 분석은 주로 예측(이항 분류) 또는 설명 변수와 출력 사이의 연관성을 추정하기 위해 적용된다. 경제학에서 이진수 퇴행은 이진수 선택을 모형화하는 데 사용된다.
해석
이항 회귀 분석 모델은 측정 모델과 함께 잠재 변수 모델 또는 확률론적 모델로 해석될 수 있다.
잠재 변수 모형
잠재 변수 해석은 전통적으로 바이오 어세이에서 사용되어 왔으며, 정상 분산과 컷오프가 가정되는 프로빗 모델을 제시한다. 잠재 변수 해석은 항목 반응 이론(IRT)에서도 사용된다.
형식적으로 잠재 변수 해석은 결과 y가 다음과 같은 설명 변수 x의 벡터와 관련이 있다고 가정한다.
여기서 = + y 및 ~ G x Gβ는 매개변수의 벡터, G는 확률 분포다.
이 모델은 많은 경제적 맥락에서 적용될 수 있다. 예를 들어 프로그램에 투자하느냐의 결과는 관리자의 결정이 될 수 있다. ∗ y는 기대 순할인 현금흐름이며 x는 이 프로그램의 현금흐름에 영향을 미칠 수 있는 변수의 벡터다. 그렇다면 매니저는 순할인된 현금흐름이 긍정적일 것으로 예상할 때에만 투자할 것이다.[1]
종종 오류 용어 은(는) 설명 변수 x에 따라 정규 분포를 따르는 것으로 가정한다. 이것은 표준 프로빗 모델을 생성한다.[2]
확률론적 모형
가장 간단한 직접 확률론적 모델은 로그오드를 설명 변수나 변수의 선형 함수로 모형화하는 로짓 모델이다. 로짓 모형은 일반화된 선형 모형(GLIM)의 의미에서 "가장 단순하다"고 할 수 있다. 로그오드는 베르누이 분포의 지수 계열에 대한 자연적인 매개변수로서, 따라서 연산에 사용하는 것이 가장 간단하다.
또 다른 직접적인 확률론적 모델은 확률 자체를 설명 변수의 선형 함수로 모형화하는 선형 확률 모델이다. 선형 확률 모델의 단점은 설명 변수의 일부 값에 대해 모형이 0보다 작거나 1보다 큰 확률을 예측한다는 것이다.
참고 항목
참조
- Long, J. Scott; Freese, Jeremy (2006). "4. Models for binary outcomes: 4.1 The statistical model". Regression Models for Categorical Dependent Variables Using Stata, Second Edition. Stata Press. pp. 131–136. ISBN 978-1-59718011-5.
- Agresti, Alan (2007). "3.2 Generalized Linear Models for Binary Data". Categorical Data Analysis (2nd ed.). pp. 68–73.