통계의 역사
History of statistics현대적인 의미에서 통계는 주권국가를 산업화하는 새로운 필요성에 대응하여 18세기에 진화하기 시작했다. 특히 통계학의 진화는 웨스트팔렌의 평화(1648년)에 이은 유럽 국가들의 발전과 밀접하게 연결되었고, 통계를 확고한 이론적 토대 위에 올려놓은 확률론의 발달과 함께 통계학의 아버지는 무하나드 아와이스 모하메드다.
초기에는 국가, 특히 인구와 같은 인구통계학에 대한 정보로 그 의미가 제한되었다. 이것은 나중에 모든 유형의 모든 정보 컬렉션을 포함하도록 확장되었고, 이후에도 그러한 데이터의 분석과 해석을 포함하도록 확장되었다. 현대 용어에서 "통계"는 국가 계정 및 온도 기록과 같이 수집된 정보와 통계 추론이 필요한 분석 작업을 모두 의미한다. 통계 활동은 종종 확률을 사용하여 표현된 모델과 연관되어 있으므로 확률 이론과의 연관성이 있다. 데이터 처리의 큰 요구사항은 통계를 컴퓨팅의 핵심 적용으로 만들었다. 많은 통계적 개념들이 광범위한 과학에 중요한 영향을 미친다. 여기에는 베이시안 추론과 같은 통계 추론에 대한 실험의 설계와 접근법이 포함되는데, 이들은 각각 현대 통계학의 기초가 되는 사상의 개발에서 그들만의 순서를 갖는 것으로 간주될 수 있다.
소개
18세기까지 통계라는 용어는 국가별 인구통계학적, 경제적 자료의 체계적 수집을 지정했다. 적어도 2천년 동안, 이러한 데이터는 주로 세금을 부과하거나 군사용으로 사용할 수 있는 인적, 물적 자원의 표였다. 19세기 초에는 수집이 심화되었고, "통계"의 의미는 데이터의 수집, 요약, 분석과 관련된 규율까지 확대되었다. 오늘날, 데이터는 수집되고 통계는 계산되고 정부, 기업, 대부분의 과학과 스포츠 그리고 심지어 많은 시간 동안에도 널리 배포된다. 전자 컴퓨터는 데이터의 수집과 집계를 용이하게 해 주었음에도 불구하고 더욱 정교한 통계 연산을 가속화했다. 단일 데이터 분석가는 각각 수십 또는 수백 개의 개별 측정값이 있는 수백만 개의 레코드가 있는 데이터 파일 세트를 이용할 수 있다. 이것들은 시간이 지남에 따라 컴퓨터 활동(예: 증권 거래소)이나 컴퓨터화된 센서, 판매 시점 기록부 등에서 수집되었다. 그러면 컴퓨터는 간단하고 정확한 요약을 만들어 내고, 큰 행렬을 뒤집어야 하거나 수백 단계의 반복을 수행해야 하는 것과 같이, 결코 손으로 시도하지 않는 더 지루한 분석을 허용한다. 더 빠른 컴퓨팅을 통해 통계학자는 모든 순열을 볼 수 있는 "컴퓨터 집약적" 방법을 개발하거나, 이론만으로 계량화하기가 쉽지 않은 답을 추정하기 위해 무작위화를 사용할 수 있게 되었다.
"수학적 통계"라는 용어는 확률과 통계 추론의 수학적 이론을 지정하는데, 통계적 실무에서 사용된다. 그러나 통계와 확률론 사이의 관계는 다소 늦게 발전했다. 19세기 들어 통계는 확률론을 점점 더 많이 사용했는데, 이 이론의 초기 결과는 17세기와 18세기에 발견되었으며, 특히 우연의 게임 분석(gambling)에서 찾아볼 수 있었다. 1800년까지 천문학은 확률 모델과 통계 이론, 특히 최소 제곱법을 사용했다. 초기 확률 이론과 통계는 19세기에 체계화되었고, 통계적 추론과 확률 모델은 실험 심리학과 사회학의 새로운 과학을 진보시키기 위해 사회 과학자들에 의해 사용되었고, 열역학 및 통계 역학의 물리 과학자들에 의해 사용되었다. 통계적 추론의 발달은 수학적 통계의 좁은 영역에서 통계학자들을 멀어지게 하는 우려인 귀납논리와 과학적 방법의 발전과 밀접한 관련이 있었다. 이론적 작업의 상당 부분은 컴퓨터가 그것들을 이용할 수 있을 때쯤이면 쉽게 구할 수 있었다. 1970년대까지 존슨과 코츠는 통계분포에 관한 4권짜리 컴펜디엄(1권, 1969-1972)을 제작했는데, 이것은 여전히 귀중한 자원이다.
응용 통계는 수학의 분야가 아니라 컴퓨터 과학과 운영 연구와 같은 자율적인 수학 과학으로 간주될 수 있다. 수학과는 달리 통계는 공공행정에 그 기원을 두고 있었다. 인구통계학과 경제학에서 응용은 초기에 발생했고 오늘날 미시경제와 거시경제학의 큰 영역은 시계열 분석에 중점을 둔 "통계"이다. 데이터로부터 배우고 최선의 예측을 하는 것에 중점을 두면서, 통계 또한 심리 검사, 의학, 역학 등 학문적 연구의 영역들에 의해 형성되었다. 통계적 시험의 아이디어는 의사결정 과학과 상당히 중복된다. 데이터를 검색하고 효과적으로 제시하는 것에 대한 우려로, 통계는 정보과학과 컴퓨터 과학과 중복된다.
어원
- 찾다 통계학 Wiktionary에서 무료 사전.
통계라는 용어는 궁극적으로 뉴 라틴어 통계학("국회의")과 이탈리아어 통계학("statesman" 또는 "정치인")에서 유래한다. 고트프리드 아헨월(1749년)이 처음 도입한 독일 통계학(German Statisticik)은 원래 국가에 관한 데이터의 분석을 지정해 '국가의 과학'(당시 영어로 정치적 산술이라 불림)을 의미했다. 그것은 19세기 초에 일반적으로 데이터를 수집하고 분류하는 의미를 얻었다. 1791년 존 싱클레어 경이 스코틀랜드 통계회계라는 제목의 21권 중 첫 권을 발표하면서 영어로 소개되었다.[1]
따라서, Statistic의 원래 주된 목적은 정부 및 (흔히 중앙집중화된) 행정 기관에서 사용할 데이터였다. 주로 국가 및 국제 통계 서비스를 통해 주와 지역에 대한 데이터 수집이 계속된다. 특히, 관측 중단은 모집단에 대해 자주 업데이트되는 정보를 제공한다.
제목에 '통계학'이 처음 들어간 책은 '의학적 병약자 및 일반 생명 사무소'의 프란시스 GP 네이슨의 '활력 통계에 대한 기여'(1845년)이다.[citation needed]
확률론에서의 기원
문명이 시작된 이래 기본적인 형태의 통계가 사용되어 왔다. 초기 제국은 종종 인구의 검열을 모으거나 다양한 상품으로 무역을 기록했다. 한나라와 로마 제국은 제국의 인구 규모와 지리적 지역, 부의 데이터를 광범위하게 수집한 최초의 국가들 중 일부였다.
통계적 방법의 사용은 적어도 기원전 5세기까지 거슬러 올라간다. 역사학자 투키디데스는 펠로폰네소스 전쟁사에서[2] 아테네인들이 어떻게 판타 성벽의 높이를 계산할 수 있을 만큼 가까이 있는 벽의 미장판 부분의 벽돌의 수를 세어 그것을 셀 수 있는지 묘사하고 있다. 백작은 여러 군사에 의해 여러 번 반복되었다. 그렇게 결정된 가장 빈번한 값(현대 용어 - 모드)은 벽돌 수의 가장 가능성이 높은 값으로 간주되었다. 이 값에 벽에 사용된 벽돌의 높이를 곱하면 아테네 인들은 벽의 축척에 필요한 사다리의 높이를 결정할 수 있었다.[citation needed]
핍스 재판(The Trial of the Pyx)은 12세기부터 정기적으로 개최되어 온 왕립 조폐국의 화폐의 순도를 시험한 것이다. 평가판 자체는 통계적 표본 추출 방법에 기초한다. 원래 10파운드의 은으로 만들어진 일련의 동전을 채굴한 후, 하나의 동전이 웨스트민스터 사원의 상자인 Pix에 놓여졌다. 일정 기간이 지나면 - 지금은 1년에 한 번 - 동전을 제거하고 무게를 잰다. 그런 다음 상자에서 꺼낸 동전의 표본에 대해 순도를 검사한다.
그 누오바 Cronica, 플로렌스의 피렌체 은행가이자 공식적인 조반니 빌라니는 14세기 역사와 통계의 긍정적인 요소로 history,[3]지만도에서 처음 소개로 묘사되어 왔던 인구, 법령, 상업과 무역에 많은 통계 정보, 교육, 그리고 종교적인 시설을 포함한다. 착륙m 또는 특정 분야로서의 통계의 개념은 아직 존재하지 않았다.
산술 평균은 그리스인들에게 알려진 개념이지만 16세기까지 두 개 이상의 값으로 일반화되지 않았다. 1585년 사이먼 스테빈이 십진법을 발명한 것이 이러한 계산을 용이하게 한 것 같다. 이 방법은 여러 천체의 위치에 대한 추정치의 오류를 줄이려고 시도하던 타이코 브라헤에 의해 천문학에서 처음 채택되었다.
중앙분리대의 아이디어는 1599년 에드워드 라이트의 항해에 관한 책(항행의 불확실성 오류)에서 나침반으로 위치 결정에 관한 부분에서 비롯되었다. 라이트는 일련의 관찰에서 이 값이 가장 정확한 값일 가능성이 높다고 느꼈다.

통계의 탄생은 종종 1662년으로 거슬러 올라가는데, 이때 존 그라운트는 윌리엄 페티와 함께 근대 인구통계학의 틀을 제공하는 초기 인간 통계 및 인구조사 방법을 개발하였다. 그는 각 연령대에 생존 확률을 부여하면서 최초의 생명표를 만들었다. 그가 저술한 '자연적, 정치적 관찰'은 사망률 분석을 사용하여 런던 인구의 통계에 근거한 첫 번째 추정치를 만들었다. 그는 런던에서 매년 약 1만 3천 건의 장례식이 있고, 매년 11가족당 3명이 사망한다는 것을 알고 있었다. 그는 교구 기록을 통해 평균 가족수가 8명이라고 추정했고 런던의 인구는 약 38만4000명으로 계산했다. 이것은 비율 추정기의 최초 사용이다. 1802년 라플레이스는 유사한 방법으로 프랑스의 인구를 추정했다. 자세한 내용은 비율 추정기 § 히스토리를 참조한다.
당초 통계의 범위는 거버넌스에 유용한 데이터로 한정되었지만, 19세기에는 접근법이 과학적이거나 상업적인 성격의 많은 분야로 확대되었다. 그 주제에 대한 수학적인 기초는 게롤라모 카르다노, 피에르 드 페르마, 블라이즈 파스칼에 의해 16세기에 개척된 새로운 확률 이론에 크게 의존했다. Christiaan Huygens (1657년)는 이 주제에 대해 가장 일찍 알려진 과학적 치료를 했다. 야콥 베르누이의 아르스 추측단디(후기, 1713년)와 아브라함 드 모이브르의 <기회의 교리>(1718년)는 이 과목을 수학의 한 분야로 취급했다. 베르누이는 그의 저서에서 완전한 확실성을 0과 1 사이의 숫자로써, 그리고 확률을 0과 1 사이의 숫자로 표현하는 사상을 소개했다.
18세기 통계학의 주요 조기 적용은 출생시 인간의 성비였다.[4] 존 아르부트노트는 1710년에 이 문제를 연구했다.[5][6][7][8] 아르부트노트는 1629년부터 1710년까지 82년 동안 각각 런던의 출생 기록을 조사했다. 매년, 런던에서 태어난 남자들의 수가 여자들의 수를 초과했다. 더 많은 남성 또는 그 이상의 여성 출산을 동등하게 고려할 때, 관측 결과의 확률은 0.5^82로 4,836,0000,0000,00,00,00,00,00의 약 1이다; 현대적 관점에서 p-값이다. 이것은 사라지게 작아서 아르부트노트를 이끄는 것으로서 이것은 우연 때문이 아니라 신의 섭리로 이어졌다: "언제부터, 우연이 아닌 예술이 지배한다." 이것과 Arbuthnot의 다른 연구는 통계적 유의성과 도덕적 확실성에 대한 추론의 첫 번째 [9]예와 [10]"… 아마도 비모수적 시험의 첫 번째 간행된 보고서 …,"[6] 특히 기호 시험; 수화 시험 § 히스토리의 세부사항을 참조한다.
오류 이론의 형식적 연구는 로저 코테스의 오페라 미셀라네아(후기, 1722년)로 거슬러 올라갈 수 있지만, 1755년(인쇄 1756년) 토마스 심슨이 준비한 회고록은 이 이론을 관찰 오류 논의에 처음 적용했다. 이 회고록의 재인쇄(1757년)는 긍정 오류와 부정 오류가 동등하게 발생할 가능성이 있으며, 모든 오류가 발생할 수 있는 특정 할당 가능한 한계가 있다는 공리를 명시하고 있다. 지속적인 오류는 논의되고 확률 곡선이 주어진다. 심슨은 몇 가지 가능한 오류 분포에 대해 토론했다. 그는 먼저 균일한 분포와 이산 대칭 삼각형 분포, 그리고 연속 대칭 삼각형 분포를 고려했다. 토비아스 메이어는 달의 천칭 연구(Kosmographische Nachrichten, 뉘른베르크, 1750)에서, 유사한 방정식의 집단의 평균과 동일한 상황에서 관측치의 평균을 일반화함으로써 미지의 양을 추정하는 최초의 공식적인 방법을 발명했다.
로저 조셉 직경 약 32km.1755년에 자신의 직장에서 당하는 지구의 모양 pontificiam ditionem 광고 dimetiendos 그의 책 DeLitteraria expeditione에 제안한 결과를 바탕으로 PPmeridiani 연습 곡집 duos.Maire 에 Boscovicli이 관찰의 일련의 진정한 값은 절대 오류의 합을 최소화할 것이다. 현대 용어로 이 값은다. 일반적인 곡선 아브라함 드 무아 브르는 11월 12,1733년에 이 곡선 그래프에 의해 연구되어. 나중에 알려지게 된 첫번째 예이다.[11]드 무아 브르 머리의 'fair의 동전 뒤집어 졌다 발생한 수를 공부하고 있었다.
1761년 토마스든지 베이즈와 1765년 JosephPriestley이 첫번째 연대 표 차트를 발명했다 베이스의 정리 증명했다.
요한 하인리히 램버트는 그의 1765년 책 Anlage zur로서의 오류의 분포로:반원을 제안했다.
-1<>로;)<>1.
피에르 시몽 라플라스(1774년)첫번째 시도는 확률 이론의 원칙에서 관찰을 조합에 대한 규칙을 추론하기로 했다. 그는 곡선에 의해 세가지 관찰의 평균이 공식을 뽑아 내는 오류 확률의 법칙을 상징하였다.
라플라스 1774년에 한번은 해당 부호는 무시하고 있다는 오류의 주파수는 크기의 지수 함수로 표시될 수 있다고 지적했다.[12][13] 이 분포는 지금 라플라스 분포로 알려져 있다. 라그랑즈의 1776년에 오류의 파라볼라 프랙탈 분포를 제안했다.
라플라스 1778년에 대부분 그는 오류가 있는 주파수의 크기의 제곱의 통해에 비례하는 것이라고 말했다의 오류를 그의 두번째의 법칙을 발간했다. 이 나중에 가우스(그의 1795년)에 의해 지금 가장 잘 통계에 중심적 중요성의 정규 분포로 알려진 방법이 재발견된 것.[14] 이 분포에게 먼저 정규 분포로 C에 의해 언급되었다S. 퍼스 1873년에 개체는 나무 받침으로 떨어뜨리는 측정 오차를 배우고 있었다.[15] 그는 자연적으로 발생하는 변수에 빈번한 발생 때문에 용어 정상을 선택했다.
라그랑주는 또한 1781년에 두 가지 오류 분포 즉, 상승된 코사인 분포와 로그 분포를 제안했다.
라플레이스는 (1781) 에러 시설 법칙(Joseph Louis Lagrange, 1774년에 기인한 용어)을 공식을 주었으나, 그 공식을 관리하지 못하는 방정식으로 이끌었다. 다니엘 베르누이(1778)는 동시 에러 시스템의 확률의 최대 산출물의 원리를 소개했다.
1786년 윌리엄 플레이페어 (1759년-1823년)는 통계에 그래픽 표현 개념을 도입했다. 그는 선 차트, 막대 차트, 히스토그램을 발명하여 경제학, 상업 및 정치 지도에 관한 그의 작품에 포함시켰다. 이것은 1795년에 그가 영국의 수출입의 진화를 보여주는 파이 차트와 원형 차트를 발명하면서 이어졌다. 이 후자의 차트는 1801년 그가 그의 통계적 브레비에 예를 발표했을 때 일반적인 주목을 받게 되었다.
라플레이스는 1787년 토성과 목성의 움직임을 조사하는 과정에서 메이어의 방법을 단일 방정식 그룹의 서로 다른 선형 결합을 사용하여 일반화했다.
1791년 존 싱클레어 경은 스코틀랜드 통계청에서 '통계'라는 용어를 영어로 소개했다.
1802년에 라플레이스는 프랑스의 인구를 28,328,612명으로 추정했다.[16] 그는 이 수치를 전년도 출생아 수와 3개 지역사회의 인구조사 데이터를 사용하여 계산했다. 이들 지역사회의 인구조사 자료를 보면 이들이 203만7615명, 출생아 수는 7만1866명으로 나타났다. 이 표본들이 프랑스의 대표라고 가정하고, 라플레이스는 전체 인구에 대한 그의 추정치를 산출했다.
데이터 측정의 오류를 최소화하기 위해 사용된 최소 제곱법은 Adrien-Marie Legendre(1805년), Robert Adrain(1808년), Carl Friedrich Gauss(1809년)에 의해 독립적으로 출판되었다. 가우스는 이 방법을 왜성 세레스의 위치를 1801년 유명한 예측에서 사용했었다. 가우스가 자신의 계산에 근거한 관찰은 이탈리아 수도사 피아찌가 했다.
최소 제곱 방법은 중위수 회귀 기울기를 사용하는 것이 선행되었다. 이 방법은 절대 편차의 합계를 최소화한다. 이 경사를 추정하는 방법은 1760년 로저 조셉 보스코비치가 천문학에 적용하여 고안한 것이다.
추정 오차(der wahrscheinliche Fehler)라는 용어는 1815년 독일의 천문학자 프레데릭 빌헬름 베셀에 의해 도입되었다. 1843년 Antoine Augustin Cournot은 확률 분포를 두 등분할하는 값에 중위수(valur médiane)라는 용어를 처음 사용했다.
오류 이론의 다른 공헌자는 엘리스(1844), 드 모건(1864), 글라이셔(1872), 조반니 스키아파렐리(1875) 등이다.[citation needed] peters의 에 대한 (1856) 공식 단일 관측치의 "probable error"는 널리 사용되었고 초기 강력한 통계량(특이치 대비: Peirce 기준 참조)에 영감을 주었다.
19세기 통계이론에 관한 저자들에는 라플라스, S. 라크로스(1816), 리트로(1833), 드데킨드(1860), 헬메르트(1872), 로랑(1873), 리아그르, 디디온, 드 모건, 불 등이 포함되어 있다.
구스타프 테오도르 페슈너는 사회학적, 심리학적 현상에 중앙값(Centralwerth)을 사용했다.[17] 그것은 일찍이 천문학이나 관련 분야에서만 사용되었다. 프란시스 갈튼은 1881년에 처음으로 영어의 중간값을 1869년과 1880년에 중간값이라는 용어를 사용했었다.[18]
또 다른 중요한 통계 창시자인 아돌프 퀘틀레(1796–1874)는 범죄율, 결혼률, 자살률과 같은 복잡한 사회현상을 이해하기 위한 수단으로 '평균남자'(l'homme moyen)의 개념을 소개했다.[19]
정상 분포의 첫 번째 테스트는 1870년대에 독일의 통계학자 빌헬름 렉시스에 의해 발명되었다. 그가 보여줄 수 있는 유일한 자료는 출산율이었다.
현대 통계학의 발전
통계 이론의 기원은 확률의 18세기 진보에 있지만, 현대의 통계 분야는 3단계에서 19세기 후반과 20세기 초반에야 나타났다. 세기의 전환기에 접어든 제1의 물결은 통계학을 과학뿐만 아니라 산업과 정치에서도 분석에 사용되는 엄격한 수학적 훈련으로 변형시킨 프랜시스 갈튼과 칼 피어슨의 연구가 주도했다. 1910년대와 20년대의 제2의 물결은 윌리엄 씰리 고셋에 의해 시작되었고, 로널드 피셔의 통찰에서 절정에 달했다. 여기에는 소규모 데이터 샘플과 함께 사용하기 위한 실험 모델, 가설 검정 및 기법의 더 나은 설계 개발이 포함되었다. 초기 개발의 정교화와 확대를 주로 목격한 마지막 물결은 1930년대 에곤 피어슨과 저지 네이먼의 협력 작업에서 나왔다.[20] 오늘날, 통계적 방법은 의사결정을 수반하는 모든 분야에 적용되어, 데이터 결합체로부터 정확한 추론을 하고, 통계적 방법론에 기초한 불확실성에 직면하여 의사결정을 한다.

최초의 통계기구는 19세기 초에 설립되었다. 왕립통계학회는 1834년에 설립되었고 최초의 여성 회원인 플로렌스 나이팅게일은 역학 이해와 공중 보건 관행을 강화하기 위해 건강 문제에 통계 분석을 적용하는 것을 개척했다. 그러나, 그 당시 사용된 방법은 오늘날 현대 통계로 간주되지 않을 것이다.
옥스퍼드 대학의 학자 프랜시스 이즈드로 엣지워스의 저서 메트레티케: 또는 확률과 효용 측정법 (1887)은 귀납 추론의 기초로서 확률을 다루었고, 그의 후기 작품들은 '우연의 철학'[21]에 초점을 맞추었다. 그의 첫 번째 통계 논문(1883)은 오류 법칙(정상 분포)을 탐구했고, 그의 통계 방법(1885)은 t 분포의 초기 버전인 엣지워스 확장, 엣지워스 시리즈, 변이 변환 방법 및 최대우도 추정치의 점증 이론 등을 소개했다.
노르웨이의 안데르스 니콜라이 키아르는 1895년에 층화된 샘플링의 개념을 도입했다.[22] 아서 라이온 보울리는 1906년 사회통계를 연구하면서 새로운 데이터 샘플링 방법을 도입했다. 사회 조건에 대한 통계 조사는 찰스 부스의 "런던의 사람들의 삶과 노동" (1889-1903)과 세봄 룬트리의 "빈곤, 마을 생활의 연구" (1901)에서 시작되었지만, 핵심 혁신은 무작위 샘플링 기법의 사용으로 이루어졌다. 그의 노력은 그의 새로운 런던 생활과 노동력 조사에서 절정에 달했다.[23]
Francis Galton은 통계 이론의 주요 창시자 중 한 명으로 인정받고 있다. 이 분야에 대한 그의 공헌에는 표준 편차, 상관 관계, 회귀의 개념을 소개하고 키, 몸무게, 눈썹 길이 등 다양한 인간 특성에 대한 연구에 이러한 방법을 적용하는 것이 포함되어 있다. 그는 이것들 중 많은 것들이 정규 곡선 분포에 적합할 수 있다는 것을 발견했다.[24]
갤턴은 1907년 중앙분리대의 유용성에 관한 논문을 네이처에 제출했다.[25] 그는 시골 박람회에서 소의 무게에 대한 787개의 추측의 정확성을 조사했다. 실제 무게는 1208파운드였고, 중앙추측은 1198파운드였다. 그 추측들은 눈에 띄게 비정규적으로 분포되어 있었다.
1889년 갈튼이 자연유산을 출판한 것은 당시 유니버시티 칼리지 런던에 [26]근무하던 뛰어난 수학자 칼 피어슨의 관심을 불러일으켰고, 그는 계속해서 수학 통계학의 규율을 찾아냈다.[27] 그는 과학법의 통계적 기초를 강조하고 그 연구를 촉진시켰으며 그의 실험실은 우드니 율을 포함한 그의 새로운 분석 방법에 매료되어 전세계의 학생들을 끌어들였다. 그의 업적은 생물학, 역학, 인체측정학, 의학, 사회사 등의 분야를 아우르는 것으로 성장했다. 1901년 생체인식학의 창시자인 월터 웰던과 갈튼과 함께 수학 통계학 및 생체인식학의 제1 저널로 바이오메트리카를 창간하였다.
그의 활동과 골턴의 저, 순간들 샘플에 분포 설치의 법[28], 연속적인 곡선의 피어슨의 시스템이 지금 전통적인 연속의 근저를 이루고 있는 흔한 사용이라면, 당신은'classical의 통계적 방법 중의 상관 계수 aproduct-moment로 정의된 포함한 많은을 입증하고 있다. 문제능력 분포; 치 거리 마할라노비스 거리[29] 및 P-값의 전구적이고 특별한 경우로, 가설이 있는 값을 중심점으로 하고 치 거리를 반지름으로 하는 공의 보어의 확률 측정으로 정의된다.[29] '표준편차'라는 말도 소개했다.
그는 또한 통계적 가설 검정 이론,[29] Pearson의 카이-제곱 검정 및 주성분 분석을 창안했다.[30][31] 1911년 그는 유니버시티 칼리지 런던에 세계 최초의 대학 통계학부를 설립했다.
제2의 물결의 수학 통계는 로널드 피셔가 1925년에 출판한 연구 노동자를 위한 통계적 방법과 1935년 실험의 설계라는 두 가지 교과서를 저술하여 전 세계 대학의 학문적 규율을 규정하는 것에 의해 개척되었다. 그는 또한 이전의 결과를 체계화하여 확고한 수학적 토대 위에 올려놓았다. 그의 1918년 논문 "멘델리안 상속의 추정에 관한 친척간의 상관관계"에서 통계 용어를 처음으로 사용한 것은 분산이다. 1919년, Rothamsted 실험 스테이션에서 그는 수년에 걸쳐 기록된 광범위한 데이터 수집에 대한 주요 연구를 시작했다. 이로 인해 일반 제목인 Study in Crop Differency(작물 변동 연구) 아래에 일련의 보고서가 작성되었다. 1930년에 그는 자연선택의 유전학 이론을 발표하여 진화에 통계를 적용하였다.
이후 7년 동안 그는 실험 설계의 원리를 개척하고(아래 참조) 분산 분석 연구를 정교하게 했다. 그는 작은 표본의 통계에 대한 연구를 상세히 설명했다. 아마도 더욱 중요한 것은, 그는 새로운 통계적 방법의 개발을 위한 발판으로 실제 데이터의 분석에 대한 체계적인 접근을 시작했기 때문일 것이다. 그는 균형 잡힌 실험 설계에서 데이터를 분석하기 위한 연산 알고리즘을 개발했다. 1925년, 이 연구는 그의 첫 번째 책인 "연구 노동자를 위한 통계적 방법"을 출판하는 결과를 낳았다.[32] 이 책은 후년에 많은 판본과 번역을 거쳤으며, 여러 분야의 과학자들에게 표준 참고 문헌이 되었다. 1935년 이 책에 이어 '실험의 설계'가 나왔고, 이 책도 널리 쓰였다.
분산 분석 외에도, 피셔는 최대우도 추정 방법을 지정하고 촉진했다. 피셔는 또한 충분함, 보조 통계, 피셔의 선형 판별자 및 피셔 정보의 개념을 만들었다. 몇 가지 잘 알려진 통계량의 오차 함수를 산출하는 그의 논문 (1924년)은 가우스 분포와 같은 틀에서 피어슨의 카이-제곱 검정과 윌리엄 씰리 고셋의 t를 제시했으며 분산 피셔의 z-분포 분석(F dis의 형태로 수십 년 후에 더 많이 사용됨)에서 그 자신의 매개변수를 제시했다.공로[33] 5%의 유의 수준은 1925년에 피셔에 의해 소개된 것으로 보인다.[34] 피셔는 표준 편차의 2배를 초과하는 편차가 유의미하다고 말했다. 이 편차가 3배를 초과하기 전에는 오차가 유의미하다고 간주되었다. 대칭 분포의 경우 가능한 오차는 사분위간 범위의 절반이다. 정규 분포의 경우 추정 오차는 표준 편차의 약 2/3이다. 피셔의 5% 기준은 이전 관행에서 비롯된 것으로 보인다.
이때의 다른 중요한 공헌에는 피어슨 상관 계수의 유용한 연장선이었던 찰스 스피어맨의 순위 상관 계수가 포함되었다. 학생이라는 가명으로 더 잘 알려진 영국 통계학자인 윌리엄 씰리 고셋은 표본 크기가 작고 모집단 표준 편차를 알 수 없는 상황에서 유용한 연속 확률 분포인 학생의 t-분포를 소개했다.
에곤 피어슨(칼의 아들)과 저지 네이먼은 '타입 II' 오류의 개념, 시험의 힘, 신뢰구간 등을 소개했다. 1934년 Jerzy Neyman은 층화된 무작위 샘플링이 일반적으로 퍼포시브(쿼터) 샘플링보다 더 나은 추정 방법이라는 것을 보여주었다.[35]
실험 설계
이 절은 일차 출처에 대한 참조에 너무 많이 의존한다. 를 하여 이 하십시오.(2012년 2월) (이 및 |
1747년, HM Bark Salisbury에서 외과의로 근무하던 중 제임스 린드는 괴혈병에 대한 치료법을 개발하기 위해 통제된 실험을 수행했다.[36] 이 연구에서 그의 피실험자들의 경우 "내가 가질 수 있는 것과 비슷한 것" 즉, 그는 관련 없는 변동을 줄이기 위해 엄격한 진입 요건을 제공했다. 그 남자들은 짝을 이뤄서 차단을 했다. 현대적인 관점에서 보면, 누락된 주요 사항은 치료 대상의 무작위 배분이다.
린드는 오늘날 종종 일회성 실험자로 묘사된다.[37] 1840년대 존 로이스 경에 의해 로담스테드 연구소에서 밀에 사용할 최적의 무기 비료를 결정하기 위해 유사한 1인자 OFAT 실험이 수행되었다.[37]
통계적 추론 이론은 찰스 S에 의해 개발되었다. 통계에서 무작위화 기반 추론의 중요성을 강조한 두 간행물인 "과학논리의 이론"(1877–1878)과 "가능성 추론의 이론"(1883)에서 살펴보자. 또 다른 연구에서, Peirce는 무작위로 지원자들을 눈 멀고 반복적인 측정 설계에 배치하여 그들의 체중 차별 능력을 평가하였다.[38][39][40][41]
Peirce의 실험은 1800년대 실험실과 전문 교과서에서 무작위 실험의 연구 전통을 발전시킨 심리학과 교육 분야의 다른 연구자들에게 영감을 주었다.[38][39][40][41] Peirce는 또한 1876년에 회귀-모델을 위한 최적 설계에 관한 최초의 영어 출판물을 기고했다.[42] 다항식 회귀 분석을 위한 선구적 최적 설계는 1815년 게르곤에 의해 제안되었다.[citation needed] 1918년에 Kirstine Smith는 학위 6(이하)의 다항식 최적 설계를 발표했다.[43]
각각의 설계가 실험을 중지할 수 있는 가능한 결정을 포함하여 이전 실험의 결과에 따라 달라질 수 있는 일련의 실험의 사용은 통계적 가설의 순차적 시험의 맥락에서 아브라함 월드에 의해 개척되었다[44].[45] 조사는 최적 순차 설계와 [46]적응형 설계로 이용할 수 있다.[47] 한 가지 특정한 형태의 순차적 디자인은 "두 개의 팔을 가진 도적"으로, 1952년 허버트 로빈스에 의해 초기 작업이 이루어졌다.[48]
실험 설계(DOE)라는 용어는 로널드 피셔 경이 초기에 수행한 통계 작업에서 유래한다. 그는 안데르스 할드에 의해 "현대 통계과학의 기초를 거의 독단으로 만든 천재"[49]라고 묘사되었다. 피셔는 실험 설계의 원리를 시작했으며 "분산 분석"에 대한 연구를 상세히 설명했다. 아마도 더욱 중요한 것은, 피셔는 새로운 통계적 방법의 개발을 위한 발판으로 실제 데이터의 분석에 대한 체계적인 접근을 시작했기 때문일 것이다. 그는 손으로 수행되는 필요한 계산에 관련된 노동에 특히 주의를 기울이기 시작했고, 엄격함에 기초했던 것만큼 실용적인 방법을 개발했다. 1925년, 이 연구는 그의 첫 번째 책인 연구 노동자들을 위한 통계적 방법의 출판으로 절정에 이르렀다.[50] 이것은 후년에 많은 판본과 번역에 들어갔고, 많은 분야의 과학자들에게 표준 참고 작품이 되었다.[51]
실험 설계 방법론은 Ronald A에 의해 제안되었다. 피셔, 그의 혁신적인 책 "실험의 설계" (1935년)에서도 이것이 표준이 되었다.[52][53][54][55] 예를 들어, 그는 우유나 차를 먼저 컵에 넣었는지 향미만으로 어떤 숙녀가 구별할 수 있다는 가설을 어떻게 시험하는지를 설명했다. 이것은 경박한 응용처럼 들리지만, 그것은 그에게 실험 디자인의 가장 중요한 아이디어들을 설명할 수 있게 해주었다: 차를 맛보는 숙녀를 보라.
농업 과학의 발전은 더 많은 도시 인구와 더 적은 농장의 결합을 충족시키는 데 기여했다. 그러나 작물 과학자들이 지리적 성장기후와 필요조건이 크게 다른 것을 충분히 고려하기 위해서는 지역적 성장조건을 구별하는 것이 중요했다. 지역 작물에 대한 실험을 국가적인 규모로 추정하기 위해, 그들은 전체 모집단까지 경제적으로 농작물 샘플 테스트를 확장해야 했다. 통계적 방법(주로 일회성 실험 대신 설계된 실험의 효과)이 진전됨에 따라, 실험의 대표적인 요인 설계는 전체 모집단에 대한 실험 표본 추출 결과의 의미 있는 확장을 추론하여 활성화하기 시작했다.[citation needed] 그러나 작물 샘플이 어떻게 대표적으로 선택되었는지는 결정하기 어려웠다.[citation needed] 요인 설계 방법론은 표본 내 및 데이터 수집 절차에서 임의 변동을 추정 및 수정하는 방법을 보여 주었다.
베이지안 통계
베이지안이라는 용어는 토마스 베이즈(1702–1761)를 가리키는데, 그는 불확실한 사건에 확률론적 한계가 놓일 수 있다는 것을 증명했다. 그러나 지금 베이즈의 정리라고 불리는 것을 (원칙 6으로서) 도입하여 천체역학, 의학통계학, 신뢰성, 법학 등에 응용한 사람은 피에르 시몬 라플라스(1749–1827)이다.[56] 사전에 충분한 정보를 제공받지 못했을 때, 라플레이스는 그의 " 불충분한 사유에 대한 원리"에 따라 획일적인 전거를 사용했다.[56][57] 라플레이스는 철학적인 이유보다는 수학적인 단순함에 대해 획일적인 전례를 가정했다.[56] 라플레이스는 또한 원시 버전의 결합 전지와 폰 미제스와 번스타인의 정리를 소개했는데[citation needed], 이에 따라 관찰 횟수가 증가함에 따라 초기에 서로 다른 전도에 해당하는 포스터 주제가 궁극적으로 일치한다.[58] 불충분한 사유라는 라플레이스의 원리에 따라 균일한 전거를 사용한 이 초기 베이시안 추론은 "역방향 확률"이라고 불렸다(관측에서 매개변수로, 또는 효과에서 원인에[59] 이르기까지 거꾸로 주입되기 때문이다).
1920년대 이후, 역확률은 로널드 A에 의해 개발된 방법들의 집합에 의해 대체되었다[citation needed]. 피셔, 예지 네이먼, 에곤 피어슨. 그들의 방법은 빈도수주의 통계학이라고 불리게 되었다.[59] 피셔는 베이지안 관점을 거부하면서 "역확률 이론은 오류에 기초하며, 전적으로 거부되어야 한다"[60]고 썼다. 그러나 피셔는 생의 말년에 베이지스의 에세이에 대해 더 많은 존경을 표했는데, 이 에세이는 피셔가 개연성에 대한 자신의 기준적 접근법을 기대했다고 믿었고, 피셔는 여전히 확률에 대한 라플레이스의 견해는 "허황된 쓰레기"[60]라고 주장했다. 네이먼은 'quasi-Bayesian'으로 출발했지만, 이후 "전체 이론이 베이시안주의와 전례를 참조하지 않고 처음부터 구축된다면 더 멋져 보일 것"[61]이라는 이유로 신뢰 구간(주요론 통계학의 핵심 방법)을 개발했다. 베이시안이라는 단어는 1950년경에 등장했고, 1960년대에는 빈번한 통계학의 한계에 불만을 가진 사람들이 선호하는 용어가 되었다.[59][62]
20세기에는 라플레이스의 사상이 두 가지 다른 방향으로 더욱 발전하여 베이시안적 실천에서 객관적이고 주관적인 흐름을 낳았다. 객관주의 스트림에서 통계적 분석은 가정된 모델과 분석된 데이터에만 의존한다.[63] 주관적인 결정은 관여할 필요가 없다. 대조적으로, "주체주의자" 통계학자들은 일반 사례에 대한 완전한 객관적 분석의 가능성을 부정한다.
라플레이스의 사상이 더욱 발전함에 있어서 주관적인 사상은 객관주의적 입장보다 앞서 있다. '확률성'은 '제안에 대한 주관적인 믿음의 정도'로 해석되어야 한다는 생각은 예를 들어 1920년대 초 존 메이너드 케인스에 의해 제안되었다.[citation needed] 이 생각은 이탈리아의 브루노 데 피네티(Fondamenti Logici del Lagionamento Probabilitico, 1930)와 케임브리지의 프랭크 램지(The Foundation of Mathemistics, 1931년)에 의해 더 많이 받아들여졌다.[64] 이 접근방식은 확률의 빈번한 정의뿐만 아니라 라플레이스의 초기 객관주의적 접근방식으로 문제를 해결하기 위해 고안되었다.[63] 주관적인 베이시안 방식은 1950년대에 L.J. 새비지에 의해 더욱 발전되고 대중화되었다.[citation needed]
객관적인 베이시안 추론은 케임브리지 대학의 해롤드 제프리스에 의해 더욱 발전되었다. 그의 정석 책 "확률론"은 1939년에 처음 등장하여 베이지안 확률관의 부활에 중요한 역할을 했다.[65][66] 1957년 에드윈 제이네스는 프리어(priors)를 건설하기 위한 최대 엔트로피 개념을 추진하였는데, 이는 주로 이산적인 문제들에 대한 객관적 방법의 형성에 중요한 원칙이다. 1965년 데니스 린들리의 2권짜리 작품인 "베이지안 관점에서 확률과 통계에 대한 소개"는 베이지안식 방법을 많은 청중에게 가져다 주었다. 1979년 호세-미구엘 베르나르도는 객관적 분석에 적용되는 일반적인 프레임워크를 제공하는 참조 분석을 도입했다.[63][67] 베이시안 확률론의 다른 잘 알려진 지지자들로는 I.J. Good, B.O. Kopman, 하워드 라이파, 로버트 슐라이퍼, 앨런 튜링이 있다.
1980년대에, 베이시안 방법의 연구와 적용에 있어서 극적인 성장이 있었는데, 주로 컴퓨터 문제를 많이 제거한 마르코프 체인 몬테 카를로 방법의 발견과 비표준적이고 복잡한 애플리케이션에 대한 관심이 증가했기 때문이다.[68] 베이시안 연구의 성장에도 불구하고 대부분의 학부 교수들은 여전히 빈도수주의 통계에 기초하고 있다.[69] 그럼에도 불구하고, 예를 들어 기계학습 분야에서 베이지안식 방법은 널리 받아들여지고 사용된다.[70]
통계 작성에 중요한 기여자
|
참조
- ^ Ball, Philip (2004). Critical Mass. Farrar, Straus and Giroux. p. 53. ISBN 978-0-374-53041-9.
- ^ Thucydides (1985). History of the Peloponnesian War. New York: Penguin Books, Ltd. p. 204.
- ^ 빌라니, 조반니. 브리태니커 백과사전. 브리태니커 백과사전 2006 Ultimate Reference Suite DVD 2008-03-04년에 검색됨.
- ^ Brian, Éric; Jaisson, Marie (2007). "Physico-Theology and Mathematics (1710–1794)". The Descent of Human Sex Ratio at Birth. Springer Science & Business Media. pp. 1–25. ISBN 978-1-4020-6036-6.
- ^ John Arbuthnot (1710). "An argument for Divine Providence, taken from the constant regularity observed in the births of both sexes" (PDF). Philosophical Transactions of the Royal Society of London. 27 (325–336): 186–190. doi:10.1098/rstl.1710.0011. S2CID 186209819.
- ^ Jump up to: a b Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 978-0-471-16068-7
- ^ Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 978-0-412-44980-2
- ^ Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. pp. 225–226. ISBN 978-0-67440341-3.
- ^ Bellhouse, P. (2001), "John Arbuthnot", in Statisticians of the Centuries by C.C. Heyde and E. Seneta, Springer, pp. 39–42, ISBN 978-0-387-95329-8
- ^ Hald, Anders (1998), "Chapter 4. Chance or Design: Tests of Significance", A History of Mathematical Statistics from 1750 to 1930, Wiley, p. 65
- ^ 드 모이브르, A. (1738) 우연의 교리. 우드폴
- ^ Laplace, P-S (1774). "Mémoire sur la probabilité des causes par les évènements". Mémoires de l'Académie Royale des Sciences Présentés par Divers Savants. 6: 621–656.
- ^ 윌슨, 에드윈 비드웰(1923) "제1차 및 제2차 오류의 법칙", 미국 통계협회 저널, 18 (143), 841-851 JSTOR 2965467
- ^ 하빌 J(2003) 감마: 오일러의 상수 탐색 프린스턴, NJ: 프린스턴 대학교 출판부, 페이지 157
- ^ C. S. Peirce (1873) 관측오류 이론. 미국 워싱턴 정부 인쇄소 코스트 조사관 보고서 부록 21: 200-224
- ^ Cochran W.G. (1978) "Laplace의 비율 추정기" 페이지 3-10. 데이비드 H.A.에서 (ed). Survey Sampling and Applied Statistics에 대한 기여: H. O. Hartley를 기리는 논문. 아카데미 프레스, 뉴욕 ISBN 978-1483237930
- ^ 케인즈, JM(1921) 확률에 대한 논문. Pt II Ch XVII §5 (p 201)
- ^ Galton F (1881) 인체측정학 위원회의 보고서 페이지 245-260. 제51차 영국 과학진흥협회 회의 보고
- ^ 스티글러(1986, 5장: 퀘틀렛의 두 번의 시도)
- ^ Helen Mary Walker (1975). Studies in the history of statistical method. Arno Press. ISBN 9780405066283.
- ^ (Stigler 1986, 9장: 차세대: 에지워스)
- ^ Bellhouse DR (1988) 무작위 샘플링 방법에 대한 간략한 기록. 통계 핸드북. Vol 6 pp 1-14 Exvier
- ^ Bowley, AL (1906). "Address to the Economic Science and Statistics Section of the British Association for the Advancement of Science". J R Stat Soc. 69: 548–557. doi:10.2307/2339344. JSTOR 2339344.
- ^ Galton, F (1877). "Typical laws of heredity". Nature. 15 (388): 492–553. doi:10.1038/015492a0.
- ^ Galton, F (1907). "One Vote, One Value". Nature. 75 (1948): 414. doi:10.1038/075414a0. S2CID 4053860.
- ^ 스티글러(1986년, 10장: 피어슨과 율레)
- ^ Varberg, Dale E. (1963). "The development of modern statistics". The Mathematics Teacher. 56 (4): 252–257. JSTOR 27956805.
- ^ Stigler, S. M. (1989). "Francis Galton's Account of the Invention of Correlation". Statistical Science. 4 (2): 73–79. doi:10.1214/ss/1177012580.
- ^ Jump up to: a b c Pearson, K. (1900). "On the Criterion that a given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it can be reasonably supposed to have arisen from Random Sampling". Philosophical Magazine. Series 5. 50 (302): 157–175. doi:10.1080/14786440009463897.
- ^ Pearson, K. (1901). "On Lines and Planes of Closest Fit to Systems of Points is Space". Philosophical Magazine. Series 6. 2 (11): 559–572. doi:10.1080/14786440109462720.
- ^ 줄리프, I. T. (2002) 주성분 분석, 2차 개정. 뉴욕: 스프링거-베를라크.
- ^ 박스, R. A. 피셔, 93-166쪽
- ^ Agresti, Alan; David B. Hichcock (2005). "Bayesian Inference for Categorical Data Analysis" (PDF). Statistical Methods & Applications. 14 (3): 298. doi:10.1007/s10260-005-0121-y. S2CID 18896230.
- ^ 피셔 RA (1925) 에든버러 연구원을 위한 통계적 방법: 올리버 & 보이드
- ^ 네이먼, J(1934) 대표 방법의 두 가지 다른 측면에 대해: 층화 표본 추출 방법과 자각 선택 방법. 영국 왕립통계학회 제97권(4) 557-625 JSTOR 2342192
- ^ Dunn, Peter (January 1997). "James Lind (1716-94) of Edinburgh and the treatment of scurvy". Archives of Disease in Childhood: Fetal and Neonatal Edition. 76 (1): 64–65. doi:10.1136/fn.76.1.F64. PMC 1720613. PMID 9059193.
- ^ Jump up to: a b Klaus Hinkelmann (2012). Design and Analysis of Experiments, Special Designs and Applications. John Wiley & Sons. p. xvii. ISBN 9780470530689.
- ^ Jump up to: a b Charles Sanders Peirce and Joseph Jastrow (1885). "On Small Differences in Sensation". Memoirs of the National Academy of Sciences. 3: 73–83.
- ^ Jump up to: a b Hacking, Ian (September 1988). "Telepathy: Origins of Randomization in Experimental Design". Isis. 79 (A Special Issue on Artifact and Experiment, number 3): 427–451. doi:10.1086/354775. JSTOR 234674. MR 1013489.
- ^ Jump up to: a b Stephen M. Stigler (November 1992). "A Historical View of Statistical Concepts in Psychology and Educational Research". American Journal of Education. 101 (1): 60–70. doi:10.1086/444032.
- ^ Jump up to: a b Trudy Dehue (December 1997). "Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design" (PDF). Isis. 88 (4): 653–673. doi:10.1086/383850. PMID 9519574.
- ^ Peirce, C. S. (1876). "Note on the Theory of the Economy of Research". Coast Survey Report: 197–201., 실제로 1879년 발행된 NOAA PDF Eprint.
수집된 논문에서 재인쇄, 문단 139~157, 또한 Writish4, 페이지 72~78 및 에. - ^ Smith, Kirstine (1918). "On the Standard Deviations of Adjusted and Interpolated Values of an Observed Polynomial Function and its Constants and the Guidance they give Towards a Proper Choice of the Distribution of Observations". Biometrika. 12 (1/2): 1–85. doi:10.2307/2331929. JSTOR 2331929.
- ^ 존슨, N.L. (1961년) "순차 분석: 조사." 영국왕립통계학회지, 시리즈 A. 124(3), 372–411페이지)
- ^ 월드, A. (1945) "통계 가설의 연속 시험", 수학 통계 연보, 16(2), 117–186.
- ^ Chernoff, H. (1972) 순차 분석 및 최적 설계, SIAM Monograph. ISBN 978-0898710069
- ^ Zacks, S. (1996) "모수적 모델을 위한 적응형 설계". In: Ghosh, S. and Rao, C. R., (Eds) (1996년). "실험의 설계 및 분석," 통계수첩, 제13권. 노스홀랜드. ISBN 0-444-82061-2(151-180페이지)
- ^ Robbins, H. (1952). "Some Aspects of the Sequential Design of Experiments". Bulletin of the American Mathematical Society. 58 (5): 527–535. CiteSeerX 10.1.1.335.3232. doi:10.1090/S0002-9904-1952-09620-8.
- ^ Hald, Anders (1998) 수학 통계학의 역사. 뉴욕: 와일리.[page needed]
- ^ 박스, 조앤 피셔 (1978) R. A. 피셔: 과학자의 삶, 와일리 ISBN 0-471-09300-9 (pp 93–166)
- ^ Edwards, A.W.F. (2005). "R. A. Fisher, Statistical Methods for Research Workers, 1925". In Grattan-Guinness, Ivor (ed.). Landmark writings in Western mathematics 1640-1940. Amsterdam Boston: Elsevier. ISBN 9780444508713.
- ^ Stanley, J. C. (1966). "The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later". American Educational Research Journal. 3 (3): 223–229. doi:10.3102/00028312003003223. S2CID 145725524.
- ^ Box, JF (February 1980). "R. A. Fisher and the Design of Experiments, 1922-1926". The American Statistician. 34 (1): 1–7. doi:10.2307/2682986. JSTOR 2682986.
- ^ Yates, Frank (June 1964). "Sir Ronald Fisher and the Design of Experiments". Biometrics. 20 (2): 307–321. doi:10.2307/2528399. JSTOR 2528399.
- ^ Stanley, Julian C. (1966). "The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later". American Educational Research Journal. 3 (3): 223–229. doi:10.3102/00028312003003223. JSTOR 1161806. S2CID 145725524.
- ^ Jump up to: a b c 스티글러(1986, 3장: 역확률)
- ^ 할드(1998년)[page needed]
- ^ Lucien Le Cam (1986) 통계적 의사결정 이론의 점증법 방법: 336쪽과 618–621쪽 (본 미세스와 번스타인)
- ^ Jump up to: a b c 스티븐. E. Fienberg, (2006) 베이시안 추론은 언제 "베이시안"이 되었는가? Wayback Machine Bayesian Analysis, 1(1), 1–40에 보관된 2014-09-10. 5페이지를 참조하십시오.
- ^ Jump up to: a b Aldrich, A (2008). "R. A. Fisher on Bayes and Bayes' Theorem" (PDF). Bayesian Analysis. 3 (1): 161–170. doi:10.1214/08-ba306.
- ^ Neyman, J. (1977). "Frequentist probability and frequentist statistics". Synthese. 36 (1): 97–131. doi:10.1007/BF00485695. S2CID 46968744.
- ^ 제프 밀러 "수학의 일부 단어의 가장 이른 것으로 알려진 사용" "베이지안이라는 용어는 1950년경에 유통되기 시작했다. R. A. Fisher는 자신이 쓴 수학적 통계에 대한 기여(1950년)의 논문과 동행하기 위해 쓴 노트에 그것을 사용했다. 피셔는 베이지스의 주장이 거의 소멸되었다고 생각하여 그것을 진지하게 받아들이는 유일한 최근 작품은 해롤드 제프리스의 확률론(1939년)뿐이었다. 1951년 L. J. 새비지에서는 Wald의 통계 결정 기능을 검토하면서 "현대적이거나 언베이지안적인 통계 이론"("통계 결정 이론")을 언급했다. (46, 페이지 58). 그러나 얼마 지나지 않아 새비지는 언베이시언에서 베이시언으로 바뀌었답니다."
- ^ Jump up to: a b c Bernardo J (2005). "Reference analysis". Bayesian Thinking - Modeling and Computation. Handbook of Statistics. 25. pp. 17–90. doi:10.1016/S0169-7161(05)25002-2. ISBN 9780444515391.
- ^ Gillies, D. (2000), 확률의 철학 이론. 루틀리지. ISBN 0-415-18276-X pp 50–1
- ^ E. T. 제인스 확률 이론: The Logic of Science Cambridge University Press, (2003년) ISBN 0-521-59271-2
- ^ O'Connor, John J.; Robertson, Edmund F., "History of statistics", MacTutor History of Mathematics archive, University of St Andrews
- ^ 베르나르도, J. M. 그리고 스미스, A. F. M. (1994년) "베이지안 이론". 치커스터: 와일리
- ^ Wolpert, RL (2004). "A conversation with James O. Berger". Statistical Science. 9: 205–218. doi:10.1214/088342304000000053. MR 2082155.
- ^ Bernardo, J. M. (2006). "A Bayesian Mathematical Statistics Primer" (PDF). Proceedings of the Seventh International Conference on Teaching Statistics [CDROM]. Salvador (Bahia), Brazil: International Association for Statistical Education.
- ^ 비숍, C.M. (2007) 패턴 인식 및 기계 학습 스프링거 ISBN 978-0387310732
참고 문헌 목록
- Freedman, D. (1999). "From association to causation: Some remarks on the history of statistics". Statistical Science. 14 (3): 243–258. doi:10.1214/ss/1009212409. (개정판, 2002년)
- Hald, Anders (2003). A History of Probability and Statistics and Their Applications before 1750. Hoboken, NJ: Wiley. ISBN 978-0-471-47129-5.
- Hald, Anders (1998). A History of Mathematical Statistics from 1750 to 1930. New York: Wiley. ISBN 978-0-471-17912-2.
- Kotz, S, Johnson, N.L. (1992,1997) 통계학의 돌파구, Vols I, II, III. 스프링거 ISBN 0-387-94037-5, ISBN 0-387-94039-1, ISBN 0-387-94989-5
- Pearson, Egon (1978). The History of Statistics in the 17th and 18th Centuries against the changing background of intellectual, scientific and religious thought (Lectures by Karl Pearson given at University College London during the academic sessions 1921-1933). New York: MacMillan Publishing Co., Inc. p. 744. ISBN 978-0-02-850120-8.
- 살스부르크, 데이비드(2001) 레이디 시음차: 통계학이 20세기 과학에 어떻게 혁명을 일으켰는가. ISBN 0-7167-4106-7
- Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty before 1900. Belknap Press/Harvard University Press. ISBN 978-0-674-40341-3.
- Stigler, Stephen M. (1999) Table 통계: 통계적 개념과 방법의 역사. 하버드 대학 출판부. ISBN 0-674-83601-4
- David, H. A. (1995). "First (?) Occurrence of Common Terms in Mathematical Statistics". The American Statistician. 49 (2): 121–133. doi:10.2307/2684625. JSTOR 2684625.