가중 최소 제곱이라고 하는 일반화 최소 제곱의 특별한 경우는 Ω(잔차의 상관 행렬)의 모든 대각선 입력이 null일 때 발생한다. 관측치의 분산(공분산 행렬 대각선)은 여전히 동일하지 않을 수 있다(열병성).
데이터 포인트에 대한 모델의 적합성은 종속 변수의 측정 값 i 와 모델에 의해 예측된 f ,의 차이로되는 i{\에 의해 측정된다
오차가 상관 관계가 없고 분산이 동일하면 함수
( )= i ) 2
)= partial {\beta
가우스-마코프 정리를 보면, 이럴 때 이(가) 최고의 선형 불편 추정기(BLUE)임을 알 수 있다. 그러나 측정치가 상관관계가 없지만 불확실성이 상이한 경우에는 변경된 접근법을 채택할 수 있다. Aitken은 가중치 있는 잔차 제곱합이 최소화된 경우 이(가) 측정 분산의 역수와 같으면 파란색임을 보여주었다.
이 제곱합에 대한 구배 방정식은
선형 최소 제곱 시스템에서 수정된 정규 방정식을 제공하며
관측오차가 상관관계가 없고 중량행렬인 W가 대각선인 경우 다음과 같이 기재할 수 있다.
오차가 상관된 경우 가중치 행렬이 관측치의 분산-공분산 행렬의 역행렬과 같으면 결과 추정기는 파란색이다.
오차가 상관관계가 없을 때는 w = 로 가중치 매트릭스를 고려하는 계산을 단순화하는 것이 편리하다 그런 다음 정규 방정식을 일반 최소 제곱과 동일한 형태로 작성할 수 있다.
가중치는 이상적으로 측정 분산의 역수와 같아야 한다.(이는 관측치가 상관관계가 없음을 의미한다. 관측치가 상관 관계가 있는 경우 = w k r 이(가) 적용된다. 이 경우 체중 행렬은 이상적으로 관측치의 분산-공분산 행렬의 역행렬과 같아야 한다.[3] 정규 방정식은 다음과 같다.
분모인 = - 은자유도 수입니다. 상관된 관측치의 경우 일반화에 대한 유효 자유도를 참조하십시오.
In all cases, the variance of the parameter estimate is given by and the covariance between the parameter estimates and 은(는) 에 의해 부여된다 The standard deviation is the square root of variance, , and the correlation coefficient is given by . 이러한 오차 추정치는 측정에서 랜덤 오차만 반영한다. 매개변수의 참 불확실성은 체계적 오류가 존재하기 때문에 더 크며, 정의상으로는 계량화할 수 없다. 관측치가 상관 관계가 없을 수 있지만 모수는 일반적으로 상관 관계가 있다는 점에 유의하십시오.
구체적인 증거가 필요하지만 중앙 한계 정리(정상분포#발생 및 적용 참조)에 호소하는 경우가 많다. 각 관측치의 오차는 평균이 0이고 표준 편차가 인 정규 분포에 속한다고 종종 가정한다 그러한 가정 하에서 다음과 같은 확률s는 추정된 표준 오차 }}}의 관점에서 단일 스칼라 모수 추정치에 대해 도출할 수 있다(여기서 제공).
68% 구간 ± s 이(가) 참 계수 값을 포함한다는 것
95% 간격 ± e {\{\이(가) 참 계수 값을 포함함
99% 간격 ±. 2.5se_이(가) 참 계수 값을 포함한다고 함
이 가정은 m >> n을 사용할 때 불합리하지 않다. 실험 오류가 정상적으로 분포된 경우 매개변수는 m - n자유도를 가진 학생의 t 분포에 속할 것이다. m ≫n 학생의 t 분포가 정규 분포에 근접한 경우. 그러나 이러한 신뢰 한계는 체계적인 오류를 고려할 수 없다는 점에 유의한다. 또한, 매개변수 오류는 표본오차의 영향을 받기 때문에 하나의 유의한 수치에만 인용되어야 한다.[4]
관측치의 수가 상대적으로 작을 때, 실험 오차 분포에 대한 가정과 무관하게 Chebychev의 불평등은 확률 상한을 위해 사용될 수 있다: 모수가 기대값에서 100%, 25%, 11%의 표준 편차를 초과할 확률이다.망연히
가중 잔차 값의 합계는 모형 함수에 상수 항이 포함될 때마다 0과 같다. XTW를T 기준으로 잔차 식을 왼쪽 다중값으로 표시:
예를 들어 모델의 첫 번째 항이 상수이므로 모든 i에 대해= 라고 가정하십시오. 그 경우에는 다음과 같다.
따라서 위의 동기적 예에서 잔차 값의 합이 0과 같다는 사실은 우연이 아니라 모형에 상수 항인 α가 존재한 결과물이다.
실험 오차가 정규 분포를 따르는 경우 잔차와 관측치 사이의 선형 관계 때문에 잔차도 그래야만 하지만 관측치는 가능한 모든 관측치 모집단의 표본일 뿐이므로 잔차는 학생의 t-분포에 속해야 한다.[5]학생화된 잔차는 특정 잔차가 지나치게 큰 것으로 나타날 때 특이치에 대한 통계적 검정을 할 때 유용하다.
^ abStrutz, T. (2016). Data Fitting and Uncertainty (A practical introduction to weighted least squares and beyond). Springer Vieweg. ISBN978-3-658-11455-8., 3장
^Mandel, John (1964). The Statistical Analysis of Experimental Data. New York: Interscience.
^Mardia, K. V.; Kent, J. T.; Bibby, J. M. (1979). Multivariate analysis. New York: Academic Press. ISBN0-12-471250-9.