통계의 기초

Foundations of statistics

통계의 기초는 데이터로부터 귀납적 추론을 수행하는 방법에 대한 통계인식론적 논쟁과 관련이 있다.통계적 추론에서 고려된 쟁점들 에는 베이지안 추론빈도주의 추론의 문제, 피셔의 "중요도 테스트"와 네이먼-피어슨 "하이포테시스 테스트" 사이의 차이, 그리고 우도 원칙을 따라야 하는지 여부 등이 있다.이러한 문제들 중 일부는 해결 [1]없이 200년 동안 논의되어 왔다.

Bandyopadhyay & Forster는[2] (i) 고전 통계 또는 오류 통계, (ii) 베이지안 통계, (ii) 우도 기반 통계, (iv) 아카이킨 정보 기준 기반 통계의 네 가지 통계 패러다임을 설명한다.

Leonard J. Savage의 널리[3] 인용된 텍스트 Foundations of Statistics는 다음과 같이 기술하고 있다.

통계가 어떻게든 확률에 의존한다는 것은 만장일치로 동의한다.그러나, 확률이 얼마인지, 그리고 그것이 통계와 어떻게 관련되어 있는지에 대해서는, 바벨탑 이후 이렇게 완전한 의견 불일치와 의사소통의 결렬은 거의 없었다.의심할 여지 없이, 의견 불일치의 대부분은 단지 용어일 뿐이고 충분히 날카로운 [4]분석 아래 사라질 것이다.

피셔의 '중요도 테스트'와네이만-피어슨 "하이포테시스 테스트"

20세기 2분기 고전 통계학의 개발에서 두 가지 경쟁 모델인 유도 통계 테스트가 개발되었다.[5][6]피셔가 사망할 때까지 그들의 상대적 공과에 대한 논쟁이 뜨거웠다[7].두 가지 방법을 혼합하여 널리 가르치고 사용하지만, 토론에서 제기된 철학적인 질문들은 해결되지 않았다.

중요도 테스트

피셔는 주로 두 권의 인기 있고 영향력 있는 책에서 [8][9]중요성 테스트를 대중화했습니다.이 책들에서 피셔의 문체는 예에 강하고 상대적으로 설명에 약했다.이 책에는 유의성 검정 통계(통계적 실천을 통계 이론보다 우선시하는)의 증거나 도출이 결여되어 있었다.피셔의 더 설명적이고 철학적인 글은 훨씬 [10]후에 쓰여졌다.그의 초기 관행과 후기 의견 사이에는 몇 가지 차이가 있는 것으로 보인다.

피셔는 이전 의견의 명확한 영향 없이 과학적인 실험 결과를 얻도록 동기를 부여받았다.유의성 테스트는 연역 추론의 전형적인 형태인 Modus Tollens의 확률론적 버전이다.유의성 검정은 간단히 "증거가 가설과 충분히 일치하지 않으면 가설을 기각하십시오."라고 말할 수 있습니다.적용 시 실험 데이터로부터 통계량을 계산하고, 그 통계량을 초과할 확률을 판단하여 역치와 비교한다.임계값('충분히 불일치'의 숫자 버전)은 임의입니다(일반적으로 규칙에 따라 결정됨).이 방법의 일반적인 적용은 비교 실험에 기초하여 치료제가 보고 가능한 효과를 가지고 있는지 여부를 결정하는 것입니다.통계적 유의성은 실제적 중요성이 아닌 확률의 척도이다.통계 신호/소음에 대한 요건으로 간주할 수 있다.이 방법은 귀무 가설에 대응하는 가상의 무한 모집단의 가정된 존재에 기초한다.

유의성 검정에는 하나의 가설만 필요합니다.테스트 결과는 간단한 이분법인 가설을 기각하는 것이다.이 테스트는 가설의 진실과 가설을 반증할 증거의 부족을 구분하기 때문에 유죄가 입증될 때까지 피고인이 무죄라고 가정하는 귀무 가설에 대해 피고인의 유죄를 평가하는 형사 재판과 같다.

가설 검정

Neyman & Pearson은 다른, 그러나 관련된 문제에 대해 협력했습니다.실험적인 증거만을 바탕으로 경쟁 가설 중 하나를 선택합니다.그들의 공동 보고서 중 가장 많이 인용된 [11]것은 1933년 것이다. 논문의 유명한 결과는 네이만-피어슨 보조군이다.가설은 확률의 비율이 가설을 선택하기 위한 훌륭한 기준이라고 말합니다(비교 분계점은 임의임).그 논문은 Student's t-test(중요도 검정 중 하나)의 최적성을 입증했다.Neyman은 가설 테스트가 유의성 테스트의 일반화이자 개선이라는 의견을 표명했다.그들의 방법에 대한 근거는 그들의 공동 [12]논문에서 찾을 수 있다.

가설 검정에는 여러 가설이 필요합니다.가설은 항상 선택되고 객관식이 선택됩니다.증거의 부족은 즉각적인 고려사항이 아니다.이 방법은 동일한 모집단의 반복 표본 추출 가정(고전적 빈도주의 가정)에 기초하지만, 피셔는 이 가정을 비판하였다(Rubin,[13] 2020).

이견의 이유

논쟁의 길이는 통계의 근간으로 간주되는 광범위한 이슈에 대한 토론을 허용했다.

1955-1956년의 교환 예
피셔의 공격[14] 네이먼의 반박[15] 논의
동일 모집단의 반복 표본 추출
  • 이러한 표본 추출은 빈도수 확률의 기초이다.
  • 피셔 선호 기준 추론
피셔의 기준 추론 이론은 결함이 있다
  • 역설은 흔하다.
빈발하는 확률에 기초한 피셔의 공격은 실패했지만, 결과가 없는 것은 아니었다.그는 두 테스트 학교가 서로 다른 결과에 도달한 특정 사례(2×2 표)를 식별했습니다.이 사건은 아직도 골치 아픈 몇 가지 사례 중 하나이다.해설자들은 "올바른" 답은 상황에 [16]따라 다르다고 믿는다.기준 확률은 잘 나오지 않아 사실상 지지자가 없는 반면, 빈도론자 확률은 여전히 주류 해석으로 남아 있다.
타입 II 오류
  • 다른 가설에서 비롯된 결과죠
순수 확률론적 테스트 이론은 대체 가설을 필요로 한다. 제2종 오류에 대한 피셔의 공격은 시간이 지남에 따라 희미해졌다.지난 몇 년간 통계는 탐색과 확증을 분리했다.현재 환경에서 유형 II 오류의 개념은 확인 가설 테스트 표본 크기 결정을 위한 전력 계산에 사용됩니다.
유도 거동 귀납적 행동에 대한 피셔의 공격은 그가 전장을 선택했기 때문에 대체로 성공적이었다.운용상의 의사결정은 통상적으로 다양한 기준(비용 등)에 근거해 행해지는 반면, 실험의 과학적 결론은 일반적으로 확률에 근거해 행해진다.

이 교환에서 Fisher는 또한 잘못된 판단에 불이익을 주는 비용 함수에 대한 구체적인 비판과 함께 귀납 추론에 대한 요구사항을 논의하였다.네이만은 가우스와 라플라스가 그것들을 사용했다고 반박했다.이러한 논쟁의 교환은 교과서가 통계 테스트의 혼합 이론을 가르치기 시작한 지 15년 에 일어났다.

피셔와 네이만은 (베이지안[16] 관점에 대한 격렬한 반대 의견으로 뭉쳤지만) 통계의 기초에 대해 의견이 달랐다.

  • 확률의 해석
    • 피셔의 귀납적 추론에 대한 불일치 vs.Neyman의 귀납적 행동은 베이지안/자주파 분열의 요소들을 포함하고 있었다.피셔는 계산된 확률에 근거해 자신의 의견을 기꺼이 변경(잠정 결론에 도달)했고, 네이만은 계산된 비용에 근거해 자신의 관찰 가능한 행동(결정)을 더 기꺼이 변경했다.
  • 모델링에 특히[7][17] 관심이 있는 과학적 질문의 적절한 공식화
  • 대안의 확률을 알지 못하고 낮은 확률에 기초하여 가설을 기각하는 것이 합리적인지 여부
  • 데이터를 기반으로 가설을 수용할 수 있는지 여부
    • 수학에서, 추론은 증명하고, 반례는 반증한다.
    • 포퍼의 과학 철학에서는 이론이 반증될 때 진보가 이루어진다.
  • 주관:피셔와 네이먼은 주관성을 최소화하기 위해 노력했지만, 둘 다 "좋은 판단"의 중요성을 인정했다.각각 상대방이 주관적이라고 비난했다.
    • 피셔는 귀무 가설을 주관적으로 선택했습니다.
    • Neyman-Pearson은 (확률에 국한되지 않은) 선택 기준을 주관적으로 선택했다.
    • 다 주관적으로 결정된 수치 임계값입니다.

피셔와 네이만은 태도와 어쩌면 언어에 의해 분리되었다.피셔는 과학자였고 직관적인 수학자였다.귀납적 추론은 자연스러웠다.네이만은 엄격한 수학자였다.그는 실험에 [5]기초한 확률 계산보다는 연역적 추론을 통해 확신했다.그래서 응용과 이론, 과학과 수학 사이에 근본적인 충돌이 있었다.

관련 이력

피셔와 같은 영국 건물을 차지했던 네이먼은 1938년 미국 서부 해안의 자리를 수락했다.그의 이사는 피어슨과의 협력과 가설 실험 [5]개발을 효과적으로 끝냈다.다른 사람들에 의해 더 많은 발전이 계속되었다.

교과서는 [18]1940년까지 의미와 가설 테스트를 혼합한 버전을 제공했다.오늘날 [6]소개 통계에서 가르친 하이브리드의 추가 개발에 개인적으로 관여한 주체는 아무도 없었다.

통계는 나중에 결정 이론(그리고 아마도 게임 이론), 베이지안 통계, 탐색적 데이터 분석, 견실한 통계, 비모수 통계 등 다양한 방향으로 발전했다.네이만-피어슨 가설 테스트는 (예를 들어 통계 품질 관리에서) 매우 많이 사용되는 의사결정 이론에 크게 기여했다.가설 테스트는 베이지안 풍미를 주는 이전의 확률을 받아들이기 위해 쉽게 일반화되었습니다.네이만-피어슨 가설 테스트는 대학원 [19]통계학에서 가르치는 추상적인 수학 과목이 되었고, 반면 가설 테스트의 기치 아래 저학년을 위해 가르치고 사용되는 것의 대부분은 피셔로부터 왔다.

현대적 의견

수십 년 동안 두 고전 시험 학파 간의 큰 싸움은 벌어지지 않았지만 저격은 계속되고 있다.몇 세대에 걸친 분쟁 후, 예측 가능한 미래에 어느 하나의 통계 테스트 이론이 다른 이론을 대체할 가능성은 사실상 없다.

경쟁 관계에 있는 두 테스트 학파의 혼합은 수학적으로 상호 보완적인[16] 두 가지 아이디어의 불완전한 결합 또는 철학적으로 양립할 수 없는 [20]아이디어의 근본적인 결함이 있는 결합으로 매우 다르게 볼 수 있습니다.피셔는 철학적 이점을 누린 반면, 네이만과 피어슨은 더 엄격한 수학을 사용했다.가설 검정은 일부 사용자 사이에서 논란이 있지만 가장 일반적인 대안(신뢰 구간)은 동일한 수학에 기초합니다.

개발의 역사는 일반적인 통계 관행을 반영하는 하이브리드 이론에 대한 인용 가능한 권위 있는 단일 출처 없이 시험을 남겨두었다.병합된 용어 또한 다소 일관성이 없습니다.기초 통계학 수업의 졸업생(및 강사)이 가설 [21]검정의 의미를 잘 이해하지 못한다는 강력한 경험적 증거가 있습니다.

요약

  • 확률에 대한 해석은 아직 해결되지 않았습니다(그러나 기준 확률은 고립되어 있습니다).
  • 두 테스트 방법 모두 거부되지 않았습니다.둘 다 다양한 용도로 많이 사용됩니다.
  • 텍스트는 가설 테스트라는 용어의 두 가지 테스트 방법을 통합했습니다.
    • 수학자들은 유의성 검정이 가설 검정의 특별한 경우라고 주장한다.
    • 다른 사람들은 문제와 방법을 구별(또는 호환되지 않는) 것으로 취급합니다.
  • 그 논쟁은 통계 교육에 악영향을 끼쳤다.

베이지안 추론 대 빈도론 추론

확률에 대한 두 가지 다른 해석(객관적 증거와 주관적 믿음 정도에 기초함)은 오랫동안 존재해 왔다.가우스와 라플레이스는 200년 전에 대안을 논의했을 수도 있다.그 결과 두 개의 경쟁 통계학 학파가 발전했다.고전적 추리 통계는 주로 20세기 [6]2분기에 개발되었으며, 그 대부분은 이전의 확률을 확립하기 위해 논란의 여지가 있는 무관심의 원칙을 이용한 시간의 확률에 대한 반응으로 개발되었다.베이지안 추론의 재생은 빈도론 확률의 한계에 대한 반응이었다.더 많은 반응들이 이어졌다.철학적 해석은 오래되었지만 통계적 용어는 그렇지 않다.현재의 통계 용어인 "베이지안"과 "자주파"는 [22]20세기 후반에 안정되었다.(철학, 수학, 과학, 통계학) 용어는 혼란스럽다: 확률의 "고전적" 해석은 베이지안이고 "고전적" 통계는 빈번하다."자주파"는 또한 다양한 해석을 가지고 있는데, 이는 물리학과 철학에서 다르다.

철학적 확률 해석의 뉘앙스는 다른 곳에서 논의된다.통계학에서 대안적 해석은 서로 다른 모델에 기초한 서로 다른 방법을 사용하여 서로 다른 데이터를 분석하여 약간 다른 목표를 달성할 수 있다.경쟁 학교들의 통계적 비교는 철학을 넘어선 실용적인 기준을 고려합니다.

주요 공헌자

빈번한 (고전적인) 방법에 기여한 두 사람은 피셔와 [5]네이먼이었다.Fisher의 확률에 대한 해석은 특이했다(그러나 강하게 비베이지안).Neyman의 견해는 엄격히 빈번했다.20세기 베이지안 통계철학, 수학 및 방법에 기여한 세 사람은 드 피네티,[23] 제프리스[24], [25]새비지였다.새비지는 영어권에서 드 피네티의 아이디어를 대중화시켰고 베이지안 수학을 엄격하게 만들었다.1965년, 데니스 린들리의 2권 작품 "베이지안 관점의 확률과 통계 입문"은 베이지안 방법을 광범위한 독자들에게 제공하였다.통계는 지난 3세대에 걸쳐 발전해 왔다.초기 기여자들의 "권위적" 관점은 모두 최신은 아니다.

대조적인 접근법

빈도주의 추론

빈도론자 추론은 위의 (Fisher's "significant testing" vs.에 부분적이고 간결하게 설명되어 있다.Neyman-Pearson "hypothesis testing")빈발주의 추론은 몇 가지 다른 관점을 결합한다.그 결과는 과학적 결론을 뒷받침하고, 신뢰 구간이 있든 없든 운영 결정을 내리고 매개변수를 추정할 수 있다.빈도주의 추론은 오로지 (한 세트의) 증거에 기초한다.

베이지안 추론

고전적인 빈도 분포는 데이터의 확률을 나타냅니다.베이즈의 정리를 사용하면 데이터가 주어진 가설(이론에 해당)의 확률인 보다 추상적인 개념을 사용할 수 있습니다.그 개념은 한때 "역확률"로 알려져 있었다.베이지안 추론은 추가 증거를 획득함에 따라 가설을 위한 확률 추정치를 갱신한다.베이지안 추론은 명백하게 증거와 사전 의견에 기초하고 있으며, 이를 통해 여러 증거 집합에 기초할 수 있다.

특성 비교

빈도론자와 베이시안은 다른 확률 모형을 사용합니다.빈도론자들은 종종 모수가 고정되어 있지만 알려지지 않은 것으로 간주하는 반면 베이시안들은 유사한 모수에 확률 분포를 할당합니다.결과적으로, 베이시안들은 빈도론자들에게 존재하지 않는 확률에 대해 말한다; 베이지안은 이론의 확률을 말하는 반면, 진정한 빈도론자는 이론과 증거의 일관성에 대해서만 말할 수 있다.예: 빈도론자는 모수의 실제 값이 신뢰 구간 내에 있을 확률이 95%라고 하지 않고 신뢰 구간의 95%가 실제 값을 포함한다고 말합니다.

에프론의 비교[26] 형용사
베이즈 빈발자
  • 근거
  • 결과 특성
  • _
  • 이상적인 응용 프로그램
  • 대상 독자
  • 모델링 특성
  • 신념(사전)
  • 원칙론
  • 원 디스트리뷰션
  • 동적(반복 샘플링)
  • 개인(주관)
  • 공격적인.
  • 동작(방법)
  • 기회주의적 방법
  • 많은 배포(부트스트랩)
  • 스태틱(1개의 샘플)
  • 커뮤니티(객관)
  • 방어적
대체[27][28] 비교
베이지안 빈발자
  • 완성하다
  • 정합성이 있다
  • 규범적
  • _
  • _
  • _
  • _
  • _
  • 모델의 강력한 추론
  • 추론이 올바르게 보정됨
  • 이전 분포를 지정할 필요가 없습니다.
  • 유연한 절차 범위
    • 불편함, 충분함, 불협화음...
    • 폭넓은 적용성과 신뢰성
    • 점근 이론
    • 알기 쉽다
    • 수작업으로 계산 가능
  • 강력한 모델의 책정 및 평가
약점
  • 과학적 추론을 하기에는 너무 주관적이다.
  • 설계에 대한 랜덤화의 역할을 거부합니다.
  • 모델의 완전한 사양(우도 및 이전)이 필요하며 이에 의존합니다.
  • _
  • _
  • _
  • 취약한 모델 제작 및 평가
  • 미완성
  • 애매하다
  • 일관성이 없다
  • 규범적이지 않다
  • 통일 이론 없음
  • (과다?) 점근 성질을 강조하다
  • 모형으로부터의 약한 추론

수학적 결과

어느 학교도 수학적 비판으로부터 자유롭지 못하며, 투쟁 없이 그것을 받아들이지 않는다.Stein의 역설(예를 들어)은 고차원에서 "평탄한" 또는 "정보적이지 않은" 사전 확률 분포를 찾는 것이 [1]미묘하다는 것을 보여주었다.베이시언들은 그것을 그들의 철학의 핵심에 대한 지엽적인 것으로 간주하면서 빈번한 이론이 모순, 역설, 잘못된 수학적 행태로 가득하다는 것을 발견한다.가장 많이 설명할 수 있는 것은 자주 하는 사람들이다.일부 "나쁜" 예는 극단적인 상황입니다. 예를 들어 코끼리 무리 중 하나의 몸무게를 측정하여 추정하는 것은 몸무게의 변동성에 대한 통계적 추정을 허용하지 않습니다.가능성 원칙은 전쟁터였다.

통계 결과

두 학교 모두 현실 세계의 문제를 해결하는데 있어 인상적인 결과를 얻었다.기계 계산기와 특수 통계 함수의 표를 인쇄하여 수많은 결과를 얻었기 때문에 고전 통계는 효과적으로 더 긴 기록을 가지고 있다.베이지안 방법은 순차적으로 자연스럽게 샘플링되는 정보(레이더 및 음파 탐지)의 분석에 매우 성공적이었다.많은 베이지안 방법과 최근의 빈도론 방법(부트스트랩 등)은 지난 수십 년 동안만 널리 이용 가능한 계산 능력을 필요로 한다.베이지안과 빈도론 [29][27]방법의 결합에 대한 활발한 논의가 있지만, 결과의 의미와 접근법의 다양성 감소에 대해 유보적인 입장을 표명한다.

철학적 결과

베이시안들은 빈발주의의 한계에 반대하여 단결하지만, 철학적으로 각기 다른 강조점을 가진 수많은 진영(경험적, 위계적, 객관적, 개인적, 주관적)으로 나뉜다.한 통계학 철학자는 지난 두 [30]세대에 걸쳐 통계 분야에서 철학적 확률 해석으로 후퇴한 것에 주목했다.베이지안 응용 프로그램의 성공이 뒷받침하는 [31]철학을 정당화하지 못한다는 인식이 있다.베이지안 방법은 종종 전통적인 추론에 사용되지 않고 [32]철학에 거의 영향을 미치지 않는 유용한 모델을 만든다.확률에 대한 철학적 해석(자주파 또는 베이지안) 중 어느 것도 견고해 보이지 않는다.빈도주의 관점은 너무 경직되고 제한적인 반면, 베이지안 관점은 객관적이고 주관적일 수 있다.

설명용 인용문

  • "사용하는 경우, 빈발하는 접근법은 때때로 서투른 [33]답변도 폭넓게 적용할 수 있습니다."
  • "편향되지 않은 [자주파] 기법을 고집하는 것은 분산의 음수 추정치를 초래할 수 있습니다. 다중 테스트에서 p-값을 사용하면 명백한 모순을 초래할 수 있습니다. 기존의 0.95 신뢰 영역은 실제로 전체 실선으로 구성될 수 있습니다.수학자들이 기존의 통계적 방법이 수학의 [34]한 분야라는 것을 믿기 어려운 것은 당연합니다.
  • "베이지안주의는 깔끔하고 완전한 원칙이 있는 철학인 반면, 빈도는 기회주의적이고 개별적으로 최적의 [26]방법들을 잡아채는 것입니다.
  • "다중 파라미터 문제에서 플랫 프리어는 매우 나쁜 [33]답을 얻을 수 있습니다."
  • [베이즈의 법칙]은 얼마나 많은 것이 알려져 있는지를 말하기 위해 현재의 정보와 이전의 경험을 결합하는 간단하고 우아한 방법이 있다고 말한다.이는 충분히 좋은 데이터가 이전에 이질적이었던 관찰자들에게 합의를 이끌어낼 것임을 시사한다.이용 가능한 정보를 최대한 활용하여 오류 [35]발생률이 가장 낮은 결정을 내릴 수 있습니다."
  • "베이지 통계는 확률 진술을 하는 것에 관한 것이고, 빈도 통계는 확률 [36]진술을 평가하는 것에 관한 것입니다."
  • "S] 타티스트들은 종종 Arrow의 패러독스를 연상시키는 설정에 놓이곤 합니다. 여기서 우리는 정보와 편견 없는 추정치와 데이터와 기본 참 [36]파라미터에 맞는 신뢰 진술을 제공하도록 요구받습니다." (이러한 요구사항은 상충됩니다.
  • "공식 추리 측면은 통계 [33]분석의 비교적 작은 부분이다."
  • "베이지안과 빈도론이라는 두 철학은 [26]정반대라기보다는 직교적입니다."
  • "참일 수 있는 가설은 관측 가능한 결과를 예측하지 못했기 때문에 기각됩니다.이것은 놀라운 [24]절차인 것 같습니다."

요약

  • 베이지안 이론은 수학적으로 유리하다
    • 빈도가 높은 확률에는 존재와 일관성 문제가 있다
    • 하지만 베이지안 이론을 적용할 좋은 전례를 찾는 것은 여전히 어렵다.
  • 두 이론 모두 성공적인 응용에 대한 인상적인 기록을 가지고 있다.
  • 확률에 대한 철학적 해석을 뒷받침하는 두 가지 모두 견고하지 않다.
  • 응용 프로그램과 철학 간의 연관성에 대한 회의론이 높아지고 있습니다.
  • 일부 통계학자들은 (휴전을 넘어) 적극적인 협업을 권장하고 있다.

우도 원리

우도는 일반적인 용법에서 확률의 동의어이다.통계학상 그것은 사실이 아니다.확률은 고정 가설에 대한 변수 데이터를 참조하는 반면 우도는 고정 데이터 집합에 대한 변수 가설을 참조합니다.눈금자를 사용하여 고정된 길이를 반복 측정하면 일련의 관측치가 생성됩니다.각 고정 관측 조건 집합은 확률 분포와 관련되며 각 관측치 집합은 확률의 빈도론적 관점인 해당 분포의 표본으로 해석될 수 있습니다.또는 여러 분포 중 하나를 표본 추출하여 관측치 집합을 얻을 수 있습니다(각각은 관측 조건 집합에서 비롯됨).고정 표본과 가변 분포(변수 가설에서 비롯된) 사이의 확률론적 관계를 가능성(확률에 대한 베이지안 관점)이라고 한다.일련의 길이 측정은 주의 깊고, 냉정하며, 휴식을 취하고, 동기부여가 있는 관찰자가 양호한 조명에서 판독한 것을 의미할 수 있습니다.

우도는 확률에 대한 제한된 빈도수 정의 때문에 존재하는 다른 이름의 확률입니다.가능성은 40년 이상 Fisher에 의해 도입되고 발전된 개념입니다(이 개념에 대한 이전의 언급은 존재했고 Fisher의 지원은 [37]어중간했습니다).이 개념은 Jeffreys[38]의해 받아들여지고 대폭 변경되었습니다.1962년 Birnbaum은 대부분의 [39]통계학자들이 수용할 수 있는 전제에서 우도 원칙을 "증명"했다."증거"는 통계학자들과 철학자들에 의해 논쟁되어 왔다.원리에 따르면 표본의 모든 정보는 우도 함수에 포함되며, 이는 Bayesians(빈도 분포가 아님)에 의해 유효한 확률 분포로 인정됩니다.

일부(자주파) 유의성 검정은 우도 원리와 일치하지 않습니다.베이시안들은 그들의 철학과 일치하는 원칙을 받아들인다."[T]우도 접근방식은 모수에 대한 후방 베이즈 분포가 베이즈 정리에 의해 이전 분포에 우도 [37]함수를 곱함으로써 발견된다는 점에서 베이지안 통계 추론과 양립할 수 있다."빈발론자들은 베이시안들에게 이 원칙을 증거의 신뢰성에 대한 우려가 없음을 암시하는 것으로 해석한다."베이지안 통계의 우도 원칙은 증거를 수집하는 실험 설계에 대한 정보가 데이터의 [40]통계 분석에 포함되지 않는다는 것을 의미한다."많은 베이시안(예:[41] Savage)은 이 영향을 취약성으로 인식하고 있습니다.

우도 원칙은 두 주요 통계학파 모두에게 난처한 일이 되었다.어느 한쪽을 선호하기 보다는 둘 다 약화되었다.가장 강력한 지지자들은 그것이 두 학교 중 어느 학교보다 더 나은 통계 기반을 제공한다고 주장한다."이러한 [베이지안 및 빈번한] [42]대안과 비교할 때 가능성이 매우 좋아 보입니다."이러한 지지자에는 통계학자와 과학 [43]철학자가 포함된다.베이시안들은 계산에 대한 우도의 중요성을 인정하면서도 사후 확률 분포가 [44]추론의 적절한 근거라고 믿는다.

모델링.

추리 통계는 통계 모델에 기초한다.예를 들어, 대부분의 고전적 가설 검정은 데이터의 가정된 정규성을 기반으로 했습니다.그러한 가정에 대한 의존도를 줄이기 위해 강력한 비모수 통계량이 개발되었다.베이지안 통계는 과거와 현재 사이의 모델링된 연속성을 가정하여 사전 지식의 관점에서 새로운 관찰을 해석한다.실험 설계는 제어, 변화, 랜덤화 및 관측될 요인에 대한 지식을 가정합니다.통계학자들은 인과관계를 입증하는 어려움(수학적 한계보다는 모델링 한계)을 잘 알고 있으며, "상관관계가 인과관계를 의미하는 것은 아니다"라고 말한다.

더 복잡한 통계는 변수 집합의 기초가 되는 잠재적 구조를 찾기 위해 더 복잡한 모델을 이용한다.모델과 데이터 세트가 [a][b]복잡해짐에 따라 모델의 정당성과 그것들로부터 도출된 추론의 타당성에 대한 근본적인 의문이 제기되었다.모델링에 대해 표현되는 상반된 의견의 범위는 넓다.

  • 모델은 과학적 이론 또는 임시 데이터 분석을 기반으로 할 수 있습니다.접근법은 서로 다른 방법을 사용합니다.각각의 [46]옹호자가 있다.
  • 모델의 복잡성은 타협입니다.Akaikean 정보 기준과 베이지안 정보 기준은 그러한 [47]타협을 달성하기 위한 주관적인 두 가지 접근법이다.
  • 사회과학에서 사용되는 단순한 회귀모델에 대해서도 근본적인 의구심이 표출되고 있다.모형의 타당성에 내재된 가정의 긴 목록은 일반적으로 언급되거나 확인되지 않습니다.관측치와 모형 간의 양호한 비교는 종종 [48]충분한 것으로 간주됩니다.
  • 베이지안 통계는 사후 확률에 너무 밀접하게 초점을 맞추어서 관측치와 [32]모형의 근본적인 비교를 무시합니다.
  • 기존의 관측 기반 모형은 많은 중요한 문제를 해결하기에는 불충분합니다.알고리즘 모델을 포함한 훨씬 더 광범위한 모델을 사용해야 합니다."모형이 자연에 대한 불충분한 모방이라면, 결론은 [49]틀릴 수 있습니다."
  • 모델링이 제대로 수행되지 않고([50]잘못된 방법이 사용됨) 보고가 제대로 이루어지지 않는 경우가 많습니다.

통계 모델링에 대한 철학적 합의 검토가 없을 때, 많은 통계학자들은 통계학자 조지 박스의 경고적인 말을 받아들인다: "모든 모델은 틀리지만, 일부 모델은 유용하다."

기타 판독치

통계정보의 기초에 대한 간단한 소개는 를 참조하십시오.Stuart, A.; Ord, J.K. (1994). "Ch. 8 – Probability and statistical inference". Kendall's Advanced Theory of Statistics. Vol. I: Distribution Theory (6th ed.). Edward Arnold.

그의 책 "원칙적인 주장으로서의 통계"에서 로버트 P. 아벨슨은 통계가 과학자들 사이의 분쟁을 해결하는 표준화된 수단으로서 역할을 한다는 입장을 분명히 하고 있다.그렇지 않으면 각자 자신의 입장에 대한 장점을 무한히 주장할 수 있다.이러한 관점에서 통계는 수사학의 한 형태이다. 분쟁을 해결하는 모든 수단과 마찬가지로 통계적 방법은 모든 당사자가 [51]사용하는 접근법에 동의해야만 성공할 수 있다.

「 」를 참조해 주세요.

각주

  1. ^ 일부 대형 모델들은 미국 유권자들의 행동을 예측하려고 한다.인구는 약 3억 명입니다.각 유권자는 많은 요인에 의해 영향을 받을 수 있습니다.유권자 행동의 복잡성(원주민이 가장 쉽게 이해할 수 있음)에 대해서는 다음을 참조하십시오: Gelman[45]
  2. ^ Efron(2013)은 수백만 개의 데이터 포인트와 수천 개의 과학적 [26]연구 매개변수를 언급하고 있습니다.

인용문

  1. ^ a b Efron 1978.
  2. ^ Bandyopadhyay & Forster 2011.
  3. ^ "citations of Savage (1972)". Google Scholar.
  4. ^ 새비지 1972년
  5. ^ a b c d 2011년 레만
  6. ^ a b c Gigerenzer et al.
  7. ^ a b Louss 1993 1993. 오류:: (도움말
  8. ^ 피셔 1925년
  9. ^ 피셔 1935년
  10. ^ 피셔 1956년
  11. ^ 네이만 & 피어슨 1933년
  12. ^ Neyman & Pearson 1967. 오류:: (
  13. ^ Rubin, M (2020). ""Repeated sampling from the same population?" A critique of Neyman and Pearson's responses to Fisher". European Journal for Philosophy of Science. 10 (42): 1–15. doi:10.1007/s13194-020-00309-6. S2CID 221939887.
  14. ^ 피셔 1955년
  15. ^ 1956년 네이만
  16. ^ a b c 레만 1993년
  17. ^ Lenhard 2006.
  18. ^ Halpin & Stam 2006.
  19. ^ Lehmann & Romano 2005.
  20. ^ Hubbard & Bayarri c. 2003년
  21. ^ Sotos2007. 오류:: (
  22. ^ Fienberg 2006.
  23. ^ 드 피네티 1964년
  24. ^ a b 제프리스 1939년
  25. ^ Savage 1954. 오류:: CITEREFSavage
  26. ^ a b c d Efron 2013.
  27. ^ a b Little 2005. 오류:: 2005
  28. ^ 2009년 6월
  29. ^ Berger 2003.
  30. ^ 2013년 5월
  31. ^ 2011년 Senn.
  32. ^ a b Gelman & Shalizi 2012.
  33. ^ a b c Cox 2005.
  34. ^ 베르나르도 2008년
  35. ^ Kass c. 2012
  36. ^ a b 겔만 2008.
  37. ^ a b Edwards 1999.
  38. ^ 알드리치 2002년
  39. ^ Bornbaum 1962년.
  40. ^ Backe 1999.
  41. ^ Savage 1960, 페이지 585. 오류:: )
  42. ^ Forster & Sereen 2001.
  43. ^ 로얄 1997년
  44. ^ 린들리 2000년
  45. ^ Gelman. "Red-blue talk UBC" (PDF). Statistics. Columbia U.
  46. ^ Tabachnick & Fidell 1996.
  47. ^ Forster & Sereen 1994.
  48. ^ 1995년 프리맨
  49. ^ Breiman 2001.
  50. ^ 친앤디
  51. ^ Abelson, Robert P. (1995). Statistics as Principled Argument. Lawrence Erlbaum Associates. ISBN 978-0-8058-0528-4. ... the purpose of statistics is to organize a useful argument from quantitative evidence, using a form of principled rhetoric.

레퍼런스

추가 정보

외부 링크