잘라내기(통계정보)
Truncation (statistics)통계에서 잘리면 값보다 크거나 작아서 표본이 [1]잘립니다.임의의 변수는 y{이\displaystyle}어떤 임계값 c{\displaystyle c}에, 그건{이\displaystyle}을 정확한 값은 모든 경우에 을 y 알려진 아래에서 잘리고 모든 경우에 c{\displaystyle y>, 요리},지만 미지의 것≤ c{y\leq c\displaystyle}y. 위에서 마찬가지로, 절단으로 알려졌다.이고 t한 값은 y< c\ y<>의 경우 알려져 있지만 y < \ \ c[2]의 경우 알 수 없습니다.
절단은 통계 관측 중단의 개념과 유사하지만 구별됩니다.잘린 표본은 경계 밖의 모든 값이 완전히 생략된 기본 표본과 동등하며, 누락된 표본의 카운트조차 유지되지 않는 것으로 간주할 수 있습니다.통계적 관측 중단의 경우, 어떤 한계(상하)가 초과되었는지와 그 한계 값을 기록한 노트가 기록될 것이다.잘린 샘플링을 사용하면 메모가 기록되지 않습니다.
적용들
일반적으로 보험 사정인이 받는 값은 왼쪽 잘라내기, 오른쪽 잘라내기 또는 둘 다입니다.예를 들어 보험계약자가 보험한도 u를 적용받는 경우 u는 보험회사가 지급한 금액이기 때문에 실제로 u를 초과하는 손실금액은 보험회사에 정확히 u로 보고됩니다.보험사는 실제 손실이 당신보다 크다는 것을 알고 있지만, 그들은 그것이 무엇인지 모른다.한편, 좌측 절단은 보험계약자가 공제 대상이 되는 경우에 발생합니다.보험가입자가 공제받을 수 있는 d를 적용받는 경우 d보다 작은 손실금액은 보험사에 보고조차 되지 않습니다.보험 한도액 u, 공제액 d에 대한 청구가 있는 경우, u \u - d a a a a a a a a a a a that that that that that that that that that that that to to to to to to to to to to to to to to to to to to to따라서 보험계약자가 청구를 하지 않기 때문에 손해보험회사가 손해보험금 d보다 낮은 값이 있는지 알 수 없기 때문에 보험손실 데이터는 좌절단된다.보험사가 가장 많이 지급하기 때문에 손실이 u보다 크면 보험 손실도 우측 검열이 됩니다.따라서 고객님의 클레임이 u보다 크다는 것만 알 뿐 정확한 클레임 금액은 알 수 없습니다.
확률 분포
절단은 모든 확률 분포에 적용할 수 있습니다.이것은 보통 같은 패밀리의 분포가 아닌 새로운 분포로 이어집니다.따라서 랜덤 변수 X가 F(x)를 분포 함수로 갖는 경우, X의 분포를 세미 오픈 구간(a, b)으로 잘린 것으로 정의된 새로운 랜덤 변수 Y는 분포 함수를 갖는다.
(a, b) 간격의 y에 대해, 그 이외의 경우는 0 또는 1에 대해 지정합니다.절단이 닫힌 간격[a, b]에 해당할 경우 분포 함수는 다음과 같습니다.
[a, b] 간격의 y에 대해, 그 이외의 경우는 0 또는 1에 대해 지정합니다.
데이터 분석
관측치가 표준 분포의 잘린 버전에서 나온 것으로 간주되는 데이터의 분석은 가능성이 잘린 분포의 분포 또는 밀도에서 도출되는 최대우도를 사용하여 수행할 수 있습니다.여기에는 원래 분포의 모수에 따라 달라지는 수정 밀도 함수에서 F() - (a) { ( ) - ( )} 를 고려해야 합니다.
실제로 잘린 분율이 매우 작을 경우 데이터를 분석할 때 잘린 효과가 무시될 수 있습니다.예를 들어, 값이 양의 값만 될 수 있지만 값의 일반적인 범위가 0에서 훨씬 멀리 떨어져 있는 데이터를 모형화하기 위해 정규 분포를 사용하는 것이 일반적입니다.이러한 경우 정규 분포의 잘리거나 관측 중단된 버전이 공식적으로 선호될 수 있습니다(대안이 있을 수 있지만). 더 복잡한 분석의 결과에는 변화가 거의 없습니다.그러나 잘린 [3]데이터에 대해 회귀 모형과 같이 다소 복잡한 모델의 최대우도 추정을 위해 소프트웨어를 쉽게 사용할 수 있습니다.
계량 경제학에서 잘린 종속 변수는 특정 범위의 [4]특정 값에 대해 관측치를 만들 수 없는 변수입니다.이러한 종속 변수가 있는 회귀 모형에서는 변수의 잘린 특성을 올바르게 인식할 수 있도록 특별히 주의해야 합니다.이러한 잘린 회귀 모델의 추정은 [5][6][7]모수 또는 반모수 [8][9]및 비모수 프레임워크에서 수행할 수 있다.
「 」를 참조해 주세요.
레퍼런스
- ^ Dodge, Y. (2003) 옥스퍼드 통계 용어 사전.OUP ISBN0-19-920613-9
- ^ Breen, Richard (1996). Regression Models : Censored, Sample Selected, or Truncated Data. Quantitative Applications in the Social Sciences. Vol. 111. Thousand Oaks: Sage. pp. 2–4. ISBN 0-8039-5710-6.
- ^ Wolynetz, M. S. (1979). "Maximum Likelihood Estimation in a Linear Model from Confined and Censored Normal Data". Journal of the Royal Statistical Society. Series C. 28 (2): 195–206. doi:10.2307/2346749. JSTOR 2346749.
- ^ "Truncated Dependent Variables". About.com. Retrieved 2008-03-22.
- ^ Amemiya, T. (1973). "Regression Analysis When the Dependent Variable is Truncated Normal". Econometrica. 41 (6): 997–1016. doi:10.2307/1914031. JSTOR 1914031.
- ^ Heckman, James (1976). "The Common Structure of Statistical Models of Truncation, Sample Selection and Limited Dependent Variables and a Simple Estimator for Such Models". Annals of Economic and Social Measurement. 5 (4): 475–492.
- ^ Vancak, V.; Goldberg, Y.; Bar-Lev, S. K.; Boukai, B. (2015). "Continuous statistical models: With or without truncation parameters?". Mathematical Methods of Statistics. 24 (1): 55–73. doi:10.3103/S1066530715010044.
{{cite journal}}
: CS1 maint: 여러 이름: 작성자 목록(링크) - ^ Lewbel, A.; Linton, O. (2002). "Nonparametric Censored and Truncated Regression". Econometrica. 70 (2): 765–779. doi:10.1111/1468-0262.00304. JSTOR 2692291.
- ^ Park, B. U.; Simar, L.; Zelenyuk, V. (2008). "Local Likelihood Estimation of Truncated Regression and its Partial Derivatives: Theory and Application" (PDF). Journal of Econometrics. 146 (1): 185–198. doi:10.1016/j.jeconom.2008.08.007.