빈도주의 추론
Frequentist inference통계 정보 |
---|
![]() |
빈도주의 추론은 빈도주의 확률에 기초한 통계적 추론의 한 유형으로, "확률"을 "빈도"로 간주하고 데이터의 빈도 또는 소견의 비율을 강조하여 표본 데이터에서 결론을 도출한다.빈도주의-추론은 통계 가설 테스트와 신뢰 구간의 확립된 방법론이 확립된 빈도주의 통계의 기초가 된다.
빈도 통계의 역사
빈도주의 통계학의 역사는 지배적인 철학적 라이벌인 베이지안 통계학보다 더 최근의 것이다.빈도주의 통계는 주로 20세기 초에 개발되었고, 최근 추리 통계의 지배적인 패러다임이 되도록 발전하였고, 베이지안 통계는 19세기에 발명되었다.이러한 우세에도 불구하고, 통계 추론을 연구하는 소수의 전문가들이 빈도주의 추론이 내부적으로 일관성이 없다고 비난하면서, 빈도주의가 베이지안 통계보다 나은지에 대한 합의가 없다.이 기사의 목적상, 빈도론적인 방법론은 가능한 한 요약적으로 논의될 것이지만, 이 주제는 오늘날까지도 논란이 되고 있다는 것을 주목할 필요가 있다.
빈도론의 일차적 공식은 통계가 확률론적 빈도로 인식될 수 있다는 가정으로부터 비롯된다.이 견해는 주로 Ronald Fisher와 Jerzy Neyman과 Egon Pearson 팀에 의해 개발되었습니다.로널드 피셔는 가설과 비교할 때 통계 측정의 중요성에 대한 연구인 "중요도 검정"의 빈도주의 개념을 개발함으로써 빈도주의 통계에 기여했다.Neyman-Pearson은 두 가설 사이의 차이를 극대화할 때 가설의 확률 비율이 주어진 p-값을 최대화하는 것으로 이어지고 또한 타입 I과 타입 II 오류의 기초를 제공한다고 추측함으로써 피셔의 아이디어를 다중 가설로 확장했다.자세한 내용은 통계 페이지의 기초를 참조하십시오.
정의.
통계적 추론을 위해 우리가 추론하고자 하는 관련 통계는 Y yY이다. 여기서 랜덤 Y(\Y는 알 수 없는 의 함수이다 (\는 displaystyle \theta 로 더욱 분할된다. \psi , \} ) 。서 \」는 대상 파라미터이며 「\\displayda」는 purtency 파라미터입니다.구체적으로는 1개 영역의 { \ }는 모집단 { \ \ mu pursent 파라미터 { \}는 모집단 평균 { \[1]의 표준편차가 됩니다.
따라서 통계적 추론은 랜덤 Y(\ Y의 E( E; ) Y; ) dy(\ E;\)=\의 기대와 관련이 있다.
빈도수 추론의 불확실성 영역을 구성하기 위해, 불확실성 추정을 위한 간격을 제공하기 위해§(\\psi의 영역을 정의하는 피벗을 사용한다.피벗은 함수인 p p의 p가 T \ t T에서 엄밀하게 증가할 확률입니다.이것에 의해, 0< { c}< 1 에 P { ( , ") p c}} { \ { ( , \)\ p { 를 정의할 수 있습니다.이것은 피벗 함수가 제대로 정의된 값보다 적을 가능성이 있습니다.이는 P{ P를 합니다.서q( t, q (t , c )는- ( \ display ( t ,c ) - c 및 그는 \에 대한 양면 제한입니다(\) 이는 통계적 추론을 할 수 있는 결과의 범위인 신뢰 구간을 엄격하게 정의한다.
Fisherian reduation 및 Neyman-Pearson 운영 기준
빈도주의 추론의 두 가지 보완적 개념은 피셔 감소와 네이먼-피어슨 운영 기준이다.이들 개념은 의한계를 정의하는 빈도 간격 방법을 보여줍니다. Fisherian reduction은의 실제 이 존재할 수 있는 간격을 결정하는 방법이며, Neyman-Pearson 운영 기준은 mak에 대한 결정 규칙입니다.선험적 확률 가정에 근거합니다.
Fisherian 감소는 다음과 같이 정의됩니다.
- 우도 함수를 결정합니다(보통 데이터를 수집하는 것입니다).
- 와 동일한 치수의 충분한 S S로 축소한다.
- 에만 따라 분포가 있는 S S의 를 구한다.
- 해당 분포를 반전하여(이는 누적 분포 함수 또는 CDF를 생성함) 확률 수준의 임의 에서§(\에 대한 한계를 구합니다.
- 제제의 [2]적정성을 평가하기 위해 S \ Sdisplaystyle S=s에 데이터의 조건부 분포를 비공식 또는 공식적으로 사용한다.
기본적으로 Fisherian reduction은can의 잠재적 값을 정의하는 확률 분포에서 {\이 발생할 수 있는 결과의 범위를 결정하기 위해 충분한 통계량을 사용할 수 있는 곳을 찾기 위한 것이다. 이는 신뢰 구간을 공식화하기 위해 필요하다.가 장기적으로 발생할 가능성이 높은 결과의 범위를 찾는다.
Neyman-Pearon 운영 기준은 관련 가 장기적으로 발생한다고 말할 수 있는 결과의 범위에 대한 보다 구체적인 이해이다.Neyman-Pearson 운영 기준은 해당 범위가 실제로 적절하거나 적절하지 않을 가능성을 정의합니다.Neyman-Pearson 기준은 이 범위에 존재하는 가 여전히 실제 모집단 통계량보다 낮은 확률 분포의 범위를 정의합니다.예를 들어, 피셔 감소의 분포가 우리가 선험적으로 신뢰할 수 없다고 간주하는 임계값을 초과하는 경우, 그 분포에 대한 네이만-피어슨 감소의 평가는 피셔 감소의 분포를 순수하게 살펴보는 것이 우리에게 부정확한 결과를 줄 수 있는 곳을 추론하는 데 사용될 수 있다.따라서 Neyman-Pearson 감소는 유형 I 및 유형 II [3]오류의 확률을 찾기 위해 사용됩니다.참고로, 베이지안 통계에서 이를 보완하는 것은 최소 베이즈 위험 기준이다.
기준은§\가 발생할 가능성이 높은 결과의 범위를 찾는 능력에 의존하기 때문에 Neyman-Pearson 접근은 Fisherian 감소를 [4]달성할 수 있는 경우에만 가능하다.
실험 설계 및 방법론
빈도주의 추론은 실험 설계 및 해석에 대한 응용 빈도주의 확률, 특히 주어진 실험이 각각 통계적으로 독립적인 [5]결과를 도출할 수 있는 동일한 실험의 가능한 반복의 무한 시퀀스 중 하나로 간주될 수 있다는 관점과 관련이 있다.이러한 관점에서, 데이터에서 결론을 도출하는 빈도주의 추론 접근법은 이러한 개념적 반복들 중에서 주어진 (높은) 확률로 정확한 결론을 도출해야 한다는 것을 효과적으로 요구한다.
그러나 정확히 동일한 절차를 미묘하게 다른 공식으로 개발할 수 있다.이것은 사전 실험의 관점을 취하는 것이다.실험 설계는 실험을 수행하기 전에 아직 확보되지 않은 데이터에서 결론을 도출하기 위해 정확히 어떤 단계를 취할 것인지에 대한 결정을 포함해야 한다고 주장할 수 있다.이러한 단계는 과학자에 의해 명시될 수 있으므로, 이 경우, 확률이 아직 발생하지 않은 무작위 사건의 집합과 관련되므로 확률의 빈도 해석에 의존하지 않는 정확한 결정에 도달할 가능성이 높다.이 공식은 네이만 [6]등에 의해 논의되었다.이것은 특히 빈도 검정의 중요성은 우도 원칙을 위반하는 모델 선택 하에서 달라질 수 있기 때문에 관련이 있다.
빈발주의 통계철학
빈도론은 결과가 일정 기간 동안 주어진 빈도로 발생하거나 반복 표본 추출을 통해 발생한다는 가정 하에 확률에 대한 연구입니다.따라서, 빈도 분석은 분석하려는 문제 빈도주의 시도의 가정을 고려하여 공식화되어야 한다.이를 위해서는 당면한 질문이 통계의 다양성을 이해하는 것과 관련이 있는지 또는 통계의 진정한 가치를 찾는 것과 관련이 있는지를 조사해야 한다.이러한 가정의 차이는 가설 검정을 해석하는 데 매우 중요합니다.다음 단락에서는 이에 대해 자세히 설명합니다.
통계적 추론에는 크게 인식론적 접근법과 역학 접근법의 두 가지 진영이 있다.인식론적 접근법은 변동성에 대한 연구이다. 즉, 통계가 관찰된 값에서 얼마나 자주 벗어날 것으로 예상하는가이다.역학적 접근방식은 불확실성의 연구와 관련이 있다. 이 접근방식에서는 통계의 값은 고정되어 있지만,[7] 해당 통계에 대한 우리의 이해는 불완전하다.구체적으로는 주식 시장 시세를 측정하려고 하는 경우와 자산 가격을 평가하려고 하는 경우를 상상해 보십시오.주식시장은 너무 심하게 변동하기 때문에 주가가 정확히 어디에 있을지를 찾는 것은 유용하지 않다: 주식시장은 우리가 그것의 변덕스러운 움직임을 수량화하려고 노력할 수 있는 인식론적 접근법을 사용하여 더 잘 이해된다.반대로 자산의 가격은 매일 그렇게 많이 변하지 않을 수 있다. 즉, 가격 범위를 찾는 것보다 자산의 진정한 가치를 찾는 것이 더 낫기 때문에 역학적인 접근법이 더 낫다.이러한 접근법 사이의 차이는 추론의 목적상 중요하지 않다.
인식론적 접근방식의 경우, 우리는 가설을 확률로 돌리려는 것처럼 문제를 공식화한다.불행하게도, 이러한 접근법은 (매우 엄격한 이유로) 베이지안 통계로 가장 잘 대답된다. 베이지안 통계는 전체 표본 공간에 조건부인 반면, 빈도론 데이터는 본질적으로 관측되지 않고 정량화할 수 없는 데이터에 조건부이기 때문에 확률의 해석이 간단하다.그 이유는 빈번한 디자인에 내재되어 있습니다.빈발 통계량은 불행히도 데이터뿐만 아니라 실험 [8]설계에도 따라 조정됩니다.빈도 통계에서 빈도 발생을 이해하기 위한 컷오프는 실험 설계에 사용된 모임 분포에서 파생됩니다.예를 들어, 이항 분포와 음의 이항 분포를 사용하여 정확히 동일한 데이터를 분석할 수 있지만, 꼬리 끝이 다르기 때문에 빈도 분석에서는 서로 다른 확률 분포를 가정하는 동일한 데이터에 대해 서로 다른 수준의 통계적 유의성을 실현할 수 있습니다.이 차이는 베이지안 추론에서는 발생하지 않는다.자세한 내용은 빈도 통계량이 본질적으로 [9]위반하는 우도 원칙을 참조하십시오.
역학적 접근방식을 위해, 빈도 통계의 배후에 있는 중심 아이디어를 논의해야 한다.빈도주의 통계는 장기적으로 통계의 빈도를 이해하고 장기적으로 통계의 실제 평균 범위를 추론할 수 있도록 설계된다.이는 위에서 설명한 피셔 감소와 네이만-피어슨 운영 기준으로 이어집니다.통계의 피셔 감소와 네이먼-피어슨 운영 기준을 정의할 때, 이러한 저자에 따르면, 표본 추출 [8]방법의 반복 횟수를 가정하여 주어진 결과 범위 내에서 통계의 실제 값이 발생할 가능성을 평가하고 있다.이를 통해 장기적으로는 95% 신뢰 구간이 문자 그대로 95% 신뢰 구간을 의미하지만 평균이 95% 확실성을 가진 특정 신뢰 구간에 있다는 것을 의미하도록 다중 빈도 추론의 결합 결과를 정의할 수 있다.이것은 일반적인 오해이다.
매우 일반적으로 인식론적 관점과 역학적 관점은 상호 변환 가능한 것으로 간주된다.이것은 명백한 거짓이다.첫째, 인식론적 관점은 단일 실험에서 귀무 인 H 00에 대한 귀납적 증거를 제공하도록 설계된 피셔 유의성 테스트를 중심으로 하며 피셔 p-값에 의해 정의된다.반대로 Neyman-Pearson 가설 테스트와 함께 수행된 역학 관점은 장기적으로 작동하는 오류 최소화를 제공함으로써 장기적으로 유형 II 잘못된 수용 오류를 최소화하도록 설계되었다.인식론적 관점은 통계적으로 유의한 하나의 값을 찾을 수 있는 조건을 강조하기 때문에 둘 사이의 차이는 중요하다. 한편, 역학 관점은 장기 결과가 유효한 결과를 제시하는 조건을 정의한다.일회성 인식론적 결론은 장기 오류에 영향을 주지 않으며, 장기 오류는 일회성 실험이 합리적인지 여부를 인증하는 데 사용할 수 없기 때문에 이러한 추론은 매우 다르다.장기 발생에 대한 일회성 실험의 가정은 잘못된 귀속이며, 개별 실험에 대한 장기 경향의 가정은 생태학적 [10]오류의 한 예이다.
다른 접근법과의 관계
빈도주의 추론은 베이지안 추론과 기준 추론과 같은 다른 유형의 통계 추론과 대조적이다."베이지안 추론"은 때때로 최적의 의사결정을 이끌어내는 추론에 대한 접근을 포함하도록 유지되지만, 여기서는 단순성을 위해 보다 제한적인 견해가 취해진다.
베이지안 추론
베이지안 추론은 "확실성"을 "확실성"과 동등하다고 간주하는 베이지안 확률에 기초하고, 따라서 빈도론 추론과 베이지안 추론의 본질적인 차이는 "확실성"이 의미하는 두 해석 사이의 차이와 동일하다.그러나, 적절한 경우, 베이지안 추론(이 경우 베이지안 정리의 적용)은 주파수 확률을 사용하는 것에 의해 사용된다.
확률 해석에 대한 위의 고려사항에 포함되지 않은 추론에 대한 빈도론 및 베이지안 접근법에는 두 가지 주요 차이가 있다.
- 추론에 대한 빈번한 접근법에서, 알려지지 않은 매개변수는 종종 고정적이지만 어떤 의미에서도 무작위 변동으로 취급될 수 없는 알려지지 않은 값을 가진 것으로 취급된다. 따라서 확률이 그것들과 연관될 수 있는 방법은 없다.반대로, 추론에 대한 베이지안 접근방식은 확률을 알려지지 않은 파라미터와 연관시킬 수 있으며, 이 경우 이러한 확률은 때때로 베이지안 확률 해석뿐만 아니라 주파수 확률 해석도 가질 수 있다.베이지안 접근방식은 주어진 매개변수 값이 참이라는 과학자의 믿음을 나타내는 것으로 이러한 확률을 해석할 수 있게 한다. (베이지안 확률 - 개인 확률 및 선행 사항 구축을 위한 객관적 방법 참조)
- "확률"은 추론에 대한 두 가지 접근법에 모두 포함되지만, 확률은 다른 유형의 것과 관련이 있다.베이지안 접근법의 결과는 실험 또는 연구 결과에 주어진 매개변수에 대해 알려진 것에 대한 확률 분포가 될 수 있다.빈도론적인 접근법의 결과는 유의성 테스트의 "참 또는 거짓" 결론이거나 주어진 표본에서 파생된 신뢰 구간이 참 값을 포함하는 형태의 결론이다. 이러한 결론 중 하나는 주어진 정확 확률을 가지며, 이 확률은 빈도 해석 또는 p를 갖는다.해석을 재실험하다
「 」를 참조해 주세요.
레퍼런스
- ^ Cox (2006), 페이지 1-2.
- ^ Cox (2006), 페이지 24, 47.
- ^ "OpenStax CNX". cnx.org. Retrieved 2021-09-14.
- ^ Cox (2006), 페이지 24.
- ^ Everitt(2002년).
- ^ Jerzy(1937), 페이지 236, 333–380.
- ^ Romeijn, Jan-Willem (2017), Zalta, Edward N. (ed.), "Philosophy of Statistics", The Stanford Encyclopedia of Philosophy (Spring 2017 ed.), Metaphysics Research Lab, Stanford University, retrieved 2021-09-14
- ^ a b Wagenmakers 등 (2008년).
- ^ Vidakovic, Brani. "The Likelihood Principle" (PDF).
{{cite web}}
: CS1 maint :url-status (링크) - ^ Hubbard, R.; Bayarri, M.J. (2003). "Confusion over measures of evidence (p's) versus errors (α's) in classical statistical testing" (PDF). The American Statistician. 57: 171–182.
참고 문헌
- Cox, D. R. (2006-08-01). Principles of Statistical Inference.
- Everitt, B.S. (2002). The Cambridge Dictionary of Statistics. Cambridge University Press. ISBN 0-521-81099-X.
- Jerzy, Neyman (1937). "Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability". Philosophical Transactions of the Royal Society of London A: 236, 333–380.
- Wagenmakers, Eric-Jan; Lee, Michael; Lodewyckx, Tom; Iverson, Geoffrey J. (2008), Hoijtink, Herbert; Klugkist, Irene; Boelen, Paul A. (eds.), "Bayesian Versus Frequentist Inference", Bayesian Evaluation of Informative Hypotheses, Statistics for Social and Behavioral Sciences, New York, NY: Springer, pp. 181–207, doi:10.1007/978-0-387-09612-4_9, ISBN 978-0-387-09612-4