통계적 모델 명세

Statistical model specification

통계에서 모델 명세통계적 모델을 구축하는 과정의 일부분이다. 명세서는 모델에 적합한 기능적 형태를 선택하고 포함할 변수를 선택하는 것으로 구성된다.예를 들어 개인소득 (와) 수년간의 교육과정 s} 현장경험 x (를) 함께 고려할 때 기능관계 = f를 다음과 같이 지정할 수 있다.[1]

여기서 독립적이고 동일한 분포가우스 변수를 구성하도록 되어 있는 설명되지 않은 오차항이다.

통계학자 데이비드 콕스 경은 "주체-물질 문제에서 통계적 모델로의 변환이 어떻게 이루어지는지가 종종 분석에서 가장 중요한 부분"이라고 말했다.[2]

사양오차 및 치우침

규격 오류는 기능적 형태나 독립적 변수의 선택이 진정한 데이터 생성 프로세스의 관련성을 제대로 나타내지 못할 때 발생한다.특히 독립 변수가 기초 프로세스에 내재된 오류와 상관관계가 있을 경우 치우침(추정된 모수와 참된 기초값의 차이의 기대값)이 발생한다.사양 오류에는 몇 가지 가능한 원인이 있으며, 일부는 아래에 열거되어 있다.

  • 부적절한 기능적 형식을 사용할 수 있다.
  • 모형에서 생략된 변수는 종속 변수 및 하나 이상의 독립 변수(누락된 변수 치우침 발생)와 모두 관계를 가질 수 있다.[3]
  • 상관없는 변수가 모형에 포함될 수 있다(편향을 일으키지는 않지만 과도한 피팅을 수반하므로 예측 성능이 저하될 수 있음).
  • 종속 변수는 동시 방정식 시스템의 일부일 수 있다(동시성 편향을 부여).

또한 측정 오류는 독립 변수에 영향을 미칠 수 있다. 이는 규격 오차는 아니지만 통계적 편향을 일으킬 수 있다.

모든 모델에는 일부 사양 오류가 발생한다는 점에 유의하십시오.사실, 통계학에서는 "모든 모델은 틀렸다"는 일반적인 격언이 있다.Burnham & Anderson의 말에 따르면, "모델링은 과학일 뿐만 아니라 예술이며 통계적 추론의 기초로서 좋은 근사치 모델을 찾는 것을 지향한다"고 한다.[4]

오규격 검출

Ramsey RESET 테스트회귀 분석에서 사양 오류를 테스트하는 데 도움이 될 수 있다.

위에 제시된 예에서 개인소득과 학교 및 직업 경험에 관련된 모형의 가정이 올바르면, 모수 최소 제곱 추정치는 효율적이고 편향되지 않을 것이다.따라서 규격 진단은 대개 잔차의 첫 번째에서 네 번째 모멘트를 테스트하는 것을 포함한다.[5]

모델 빌딩

모델을 구축하려면 데이터를 생성하는 프로세스를 나타내는 일련의 관계를 찾아야 한다.이를 위해서는 위에서 언급한 오타입의 원천을 모두 피해야 한다.

한 가지 접근방식은 데이터 생성 프로세스에 대한 이론적 이해에 의존하는 일반적인 형태의 모델부터 시작하는 것이다.그런 다음 모델을 데이터에 적합시키고 통계적 모델 유효성 검사라는 작업에서 다양한 오규격 출처를 확인할 수 있다.그런 다음 이론적 이해는 오규격의 근원을 제거하면서 이론적 타당성을 유지하는 방법으로 모델의 수정을 안내할 수 있다.그러나 데이터에 맞는 이론적으로 수용할 수 있는 규격을 찾는 것이 불가능하다고 입증되면 이론적 모형을 기각하고 다른 규격으로 대체해야 할 수도 있다.

Karl Popper의 인용구는 여기에서 언급된다: "어떤 이론이 당신에게 유일한 이론으로 나타날 때마다, 당신이 이론이나 그것이 해결하고자 했던 문제를 이해하지 못했다는 표시로 받아들이라."[6]

모델 구축에 대한 또 다른 접근방식은 여러 가지 다른 모델을 후보 모델로 지정하고, 그 후보 모델을 서로 비교하는 것이다.비교의 목적은 통계적 추론에 가장 적합한 후보 모델을 결정하는 것이다.모형을 비교하는 일반적인 기준은 R2, 베이지 인자우도-비율 검정일반화 상대우도와 함께 다음과 같다.이 항목에 대한 자세한 내용은 통계적 모델 선택을 참조하십시오.

참고 항목

메모들

  1. ^ 이 특별한 예는 Mincer engagement라고 알려져 있다.
  2. ^ Cox, D. R. (2006), Principles of Statistical Inference, Cambridge University Press, p. 197.
  3. ^ 윌리엄 & 메리 대학 "양적 방법 II: 계량학"
  4. ^ Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference: A practical information-theoretic approach (2nd ed.), Springer-Verlag, §1.1.
  5. ^ Long, J. Scott; Trivedi, Pravin K. (1993). "Some specification tests for the linear regression model". In Bollen, Kenneth A.; Long, J. Scott (eds.). Testing Structural Equation Models. SAGE Publishing. pp. 66–110.
  6. ^ Popper, Karl (1972), Objective Knowledge: An evolutionary approach, Oxford University Press.

추가 읽기