학생의 t-분포
Student's t-distribution 확률밀도함수 ![]() | |||
누적분포함수 ![]() | |||
매개변수 | > 자유도(실제) | ||
---|---|---|---|
지원 | |||
CDF |
| ||
평균 | > 의 경우 0 그렇지 않으면 정의되지 않음 | ||
중앙값 | 0 | ||
모드 | 0 | ||
분산 | - 2 {\}}:> > 1 2 그렇지 않으면 정의되지 않음 | ||
왜도 | > 의 경우 0 그렇지 않으면 정의되지 않음 | ||
엑스트라 쿠르토시스 | - {\의 경우 < 의 경우, 그렇지 않으면 정의되지 않음 | ||
엔트로피 |
| ||
MGF | 정의되지 않은 | ||
CF | for |
확률과 통계에서 학생의 t-분포(또는 단순히 t-분포)는 표본 크기가 작고 모집단의 표준 편차를 알 수 없는 상황에서 정규 분포 모집단의 평균을 추정할 때 발생하는 연속 확률 분포 계열의 구성원이다.영국의 통계학자 윌리엄 씰리 고셋이 '스튜디오'라는 필명으로 개발했다.
t-분포는 두 표본 평균 차이의 통계적 유의성을 평가하기 위한 학생의 t-검정, 두 모집단 평균 차이에 대한 신뢰 구간 구성 및 선형 회귀 분석에서 광범위하게 사용되는 여러 통계 분석에서 역할을 한다.학생의 t 분포는 일반 가정의 데이터에 대한 베이지안 분석에서도 발생한다.
정규 분포에서 관측치의 표본을 추출하는 경우 freedom= - 자유도가 있는 t 분포는 sta로 곱한 후 참 평균에 상대적인 표본 평균 위치의 분포로 정의할 수 있다.ndardizing 용어 이러한 방식으로 t-분포를 사용하여 실제 평균에 대한 신뢰 구간을 구성할 수 있다.
t-분포는 정규분포와 같이 대칭이며 종 모양이다.그러나 t 분포는 꼬리가 더 무거워 평균에서 멀리 떨어진 값을 산출하기 쉽다는 것을 의미한다.이것은 분모의 변동이 증폭되고 비율의 분모가 0에 가까울 때 외향 값을 산출할 수 있는 특정 유형의 무작위 수량 비율의 통계적 동작을 이해하는 데 유용하다.학생의 t-분포는 일반화된 쌍곡선 분포의 특별한 경우다.
역사와 어원
통계에서 t 분포는 1876년 헬머트와[2][3][4] 뤼트로스에 의해 후분포로서 처음 도출되었다.[5][6][7]t-분포는 칼 피어슨의 1895년 논문에서도 피어슨 4종 분포로 보다 일반적인 형태로 나타났다.[8]
영문학에서 이 분포는 윌리엄 씰리 고셋의 1908년 비오메트리카에 실린 논문에서 '학생'[9]이라는 필명으로 그 이름을 따왔다.고셋은 아일랜드 더블린에 있는 기네스맥주에서 일했고, 작은 표본의 문제, 예를 들어 표본 크기가 3 정도 되는 보리의 화학적 특성 등에 관심이 있었다.가명 원고의 한 버전은 고셋의 고용주가 실명 대신 과학논문을 발행할 때 직원이 필명을 사용하는 것을 선호해 '스튜던트'라는 이름을 사용해 신분을 숨겼다는 것이다.또 다른 버전은 기네스북이 경쟁자들이 원료의 품질을 결정하기 위해 t-테스트를 사용하고 있다는 사실을 알고 싶어하지 않았다는 것이다.[10][11]
고셋의 논문은 분포를 "정상 모집단에서 추출한 표본의 표준 편차의 빈도 분포"라고 한다.그것은 로널드 피셔의 작품을 통해 잘 알려지게 되었는데, 그는 그 분포를 "학생의 분포"라고 불렀고 t자로 시험값을 나타내었다.[12][13]
학생 분포가 표본 추출에서 발생하는 방법
Let be independently and identically drawn from the distribution , i.e. this is a sample of size from a normally distributed population with expected mean value 과 (와) 분산 2
내버려두다
을 본보기로 삼가다
표본 분산이다그러면 랜덤 변수
표준 정규 분포(예: 기대 평균이 0이고 분산 1인 정규 분포) 및 랜덤 변수가 있음
즉, 이(가) 을(를) 대체한 경우 학생 t-분포가 - {\ 자유도를 가지고 있다. 이 (가) , 을(를) 대체했기 때문에 이 식에서 관측할 수 없는 유일한 수량은 , 이므로 이것은 에 대한 신뢰 구간을 도출하는 데 사용될 수 있다 stypot.e 동일한 샘플 ,…, 에 기초하고 있음This can be seen by observing that and recalling that and are both linear combinations of the same set of i.i.d.정규 분포를 따르는 랜덤 변수.
정의
확률밀도함수
학생의 t-분포에는 다음과 같은 확률밀도함수(PDF)가 있다.
여기서 은 (는) 자유도 수이고 은 (는) 감마함수다.이것은 또한 다음과 같이 쓰여질 수 있다.
여기서 B는 베타 함수다.특히 자유도의 정수 값 {\}에 대해서는 다음과 같은 사항을 제공한다.
> 의 경우에도,
> 1홀수인 경우,
확률밀도함수는 대칭이며, 그 전체적인 모양은 약간 낮고 넓다는 점을 제외하고는 평균 0과 분산 1의 정규 분포 변수의 종 모양과 유사하다.자유도가 증가함에 따라 t 분포는 평균 0과 분산 1로 정규 분포에 접근한다.이 때문에 은 (는) 정규성 파라미터로도 알려져 있다.[14]
다음 이미지는 의 증가 값에 대한 t 분포의 밀도를 보여준다 정상 분포는 비교를 위해 파란색 선으로 표시된다.t-분포(빨간색 선)는 이 (가) 증가함에 따라 정규 분포에 가까워진다는 점에 유의하십시오.
누적분포함수
누적분포함수(CDF)는 정규화된 불완전 베타함수인 I로 작성할 수 있다.t > 0의 경우,[15]
어디에
다른 값들은 대칭으로 얻을 수 있을 것이다. < 에 유효한 대체 공식은 다음과[15] 같다.
역 누적 분포 함수에 대한 자세한 내용은 § 학생의 t-분포를 참조하십시오.
특례
의 특정 값은 특히 단순한 형태를 나타낸다.
- 분포 함수:
- 밀도 함수:
- Cauchy 분포 참조
- 분포 함수:
- 밀도 함수:
- 분포 함수:
- 밀도 함수:
- 분포 함수:
- 밀도 함수:
- 분포 함수:
- 밀도 함수:
- 분포 함수:
- 오류 함수 참조
- 밀도 함수:
- 정규 분포를 참조하십시오.
t-분포 발생 방법
시료채취분포
, 을(를) 예상 값 을(를) 가진 연속 분포 모집단에서 표본에서 관측된 숫자로 한다 표본 평균과 표본 분산은 다음과 같이 주어진다.
결과 t-값은
자유도가 - 인 t 분포는 표본이 정규 분포 모집단에서 동일한 독립 분포 관측치로 구성되었을 때 t-값의 표본 분포다.따라서 추론 목적상 t는 평균과 분산 , 2) 이 미지의 모집단 매개변수인 경우에 유용한 "양"으로, t-값이 \mu}, 에 의존하지 않는 확률 분포를 가진다.
베이시안 추론
베이시안 통계량에서 (확대, 이동) t 분포는 알 수 없는 분산에 대한 의존성이 한계화된 경우 정규 분포의 미지의 평균에 대한 한계 분포로 발생한다.[16]
여기서 은(는) 데이터{}{\\{을(를) 나타내며, 은 모델을 생성하는 데 사용되었을 수 있는 다른 모든 정보를 나타낸다.따라서 분포는 가 주어진의 조건부 분포 {\}과 가 μs2 {\\2}}의 한계 분포가 합쳐진 것이다
n{n\displaystyle}데이터 지점을 사용하는 경우, 또는 평평한, 위치와 규모 충분한 전과}}과(σ 2∣ 나는)∝ 1/σ 2{\displaystyle p(\sigma ^{2}\mid 나는)\propto 1/\sigma ^{2}}과 σ2μ에 하든지 베이즈 정리의 giv으로 여겨질 수 있는 동업-(μ ∣ σ 2, 나는))const{\displaystyle p(\mu\mid \sigma ^{2},I)={\text{const}p.es
정규 분포와 스케일 역치-제곱 분포 각각 서 = -1 {\ = 및
따라서 한계화 적분은
은 z= / 2 서 A= n(- μ - x )+ s - s 주어평가한다.
그렇게
그러나 z 적분은 이제 표준 감마 적분으로, 상수로 평가하여 남는다.
이는 명시적 스케일링과 시프트가 있는 t-분포의 한 형태로서, 아래 추가 섹션에서 자세히 살펴볼 것이다.대체에 의한 표준화된 t-분포와 관련될 수 있다.
위의 도출은 및 2에 대한 비정보적 사전의 경우에 대해 제시되었지만, 정상 분포를 스케일 역치 제곱 분포와 조합하게 하는 모든 사전 분포는 스케일 및 시 분포를 포함한 t-분포를 야기할 것이 명백하다의 }에 해당하는 스케일링 는 위의 데이터뿐만 아니라 이전 정보와 데이터 모두에 의해 영향을 받지만 P D ,) 에 대한 fting.
특성화
검정 통계량의 분포로서
자유도를 가진 학생의 t 분포는 다음 값을[15][17] 가진 랜덤 변수 T의 분포로 정의할 수 있다.
어디에
다른 분포는 주어진 일정한 μ에 대해 정의된 랜덤 변수의 분포로 정의된다.
이 랜덤 변수는 비중심 t-분포를 가지며 비중심 파라미터 μ를 가진다.이 분포는 학생 t-검사의 힘에 대한 연구에서 중요하다.
파생
X1, ..., X가n 정규 분포를 따르는 임의 변수 X의 독립적 실현이라고 가정해 보자. X는 기대값 μ와 분산 μ를2 가지고 있다.내버려두다
표본의 평균이다, 그리고
표본의 분산을 편파적으로 추정하다랜덤 변수가
= - 1 자유도를 갖는 카이 제곱 분포를 가진다([18]코크란의 정리).그 수량은 쉽게 알 수 있다.
표본 평균 의 은 (는) 평균 μ와 분산 σ2/n으로 정규 분포되기 때문에 평균 0과 분산 1로 정규 분포를 따른다.더욱이 이러한 두 개의 랜덤 변수(정상적으로 분포된 Z와 카이-제곱 분포된 V)가 독립적이라는 것을 보여줄 수 있다.결과적으로[clarification needed] 중추적인 수량
이는 정확한 표준 편차 σ이 무작위 변수n S로 대체된다는 점에서 Z와 다른 점이며, 위에서 정의한 학생 t-분포를 가지고 있다.알 수 없는 모집단 분산 σ은2 분자와 분모 둘 다에 있어서 취소하였으므로 T에는 나타나지 않는다는 점에 유의한다.고셋은 직관적으로 위에서 말한 확률밀도함수를 n - 1과 같은 equal 로 얻었고, 피셔는 1925년에 그것을 증명했다.[12]
시험통계 T의 분포는 나 μ는 아니지만μ는\에 따라 달라진다. μ와 μ는 μ와 μ에 대한 의존도의 부족이 이론과 실제 모두에서 t-분포를 중요하게 만든다.
최대 엔트로피 분포로서
학생의 t-분포는 ( + )이 고정된 임의 변수 X에 대한 최대 엔트로피 확률 분포다.[19][clarification needed][better source needed]
특성.
순간
> 1 의 경우t-분포의 원시 모멘트는
이상 주문 모멘트가 존재하지 않음.[20]
< < 짝수의 용어는 감마함수의 속성을 사용하여 다음과 같이 단순화할 수 있다.
자유도가 있는 t 분포의 경우 은 이면 0이고 > 2 -2인 경우 분산은 - >이다wn> 이면 왜도가 0이고, 초과 6 첨도는- 4 {6 > 이다
몬테카를로 샘플링
학생의 t-분포에서 무작위 샘플을 만드는 방법은 다양하다.문제는 표본이 독립적으로 필요한지, 또는 균일한 표본에 정량적 함수를 적용하여 시공해야 하는지에 따라 달라진다(예: 코풀라 의존성의 다차원적 적용 기준).[citation needed]독립형 표본 추출의 경우 Box-Muller 방법의 확장 및 극형 형태가 쉽게 배치된다.[21]모든 진짜 양의 자유도인 ν에 동등하게 잘 적용되는 반면, ν이 0에 가까우면 다른 많은 후보 방법이 실패한다는 장점이 있다.[21]
학생의 확률밀도함수와 p-값의 정수
함수 A(t ν)는 t ≥ 0에 대한 학생 확률밀도함수의 정수인 -t와 t 사이의 f(t)이다.따라서 관측된 데이터에서 계산된 값보다 작은 값이 우연히 발생할 확률을 제공한다.따라서 두 데이터 세트를 동일한 모집단에서 추출한 경우 t의 해당 값과 발생 확률을 계산하여 두 데이터 집합의 평균 간 차이가 통계적으로 유의한지 여부를 검정할 때 A(t ν) 함수를 사용할 수 있다.이것은 다양한 상황에서 특히 t-테스트에서 사용된다.통계 t의 경우, 자유도가 ∆인 경우, A(t ν)는 두 평균이 같을 경우 t가 관측값보다 작을 확률이다(더 작은 평균을 더 큰 평균에서 빼서 t ≥ 0을 얻는 경우).t-분포의 누적분포함수 Fν(t)로 쉽게 계산할 수 있다.
여기서 나는x 정규화된 불완전 베타 함수(a, b)이다.
통계적 가설 검정에서 이 함수는 p-값을 구성하는 데 사용된다.
일반화 학생의 t-분포
파라미터 ^ {\{\ 또는 ^
학생의 t 분포는 위치 모수 {\}}과(와 관계를 통해 모수 μ 을를) 도입하여 세 가지 모수 위치 척도 패밀리로 일반화할 수 있다.
또는
이는 - ^ }}}}}}}}}}}}}}}이(가) 인고전적인 학생 t 분포를 가지고 있음을 의미한다.
결과적으로 비표준화된 학생의 t-분포는 다음과 같이 정의된다.[22]
여기서 은(는) 표준 편차에 해당하지 않는다. 이는 존재하지도 않을 수 있는 스케일링 t 분포의 표준 편차가 아니며, 알 수 없는 기본 정규 분포의 표준 편차도 아니다. 은 (는) 단순히 분포의 전체 스케일링을 설정하십시오.위의 알려지지 않은 정규 평균 의 한계 분포에 대한 베이시안 파생에서 여기서 되는 ^ 은는) / {에 해당한다.
- = ( - x ) - 1
동등하게 분포는 과 같은 척도 모수의 제곱인
이 버전의 배포의 다른 속성은 다음과 같다.[22]
이 분포는 가우스 분포(정규 분포)를 평균 {\과 (와 수 없는 분산으로 혼합하여 얻으며, 역 감마 분포는 =/ a 즉, 랜덤 변수 X는 알 수 없는 분산이 역 감마선으로 분포된 가우스 분포를 갖는 것으로 가정하고, 그 다음 분산이 소외된다(통합 아웃).이 특성화의 유용성은 역 감마 분포가 가우스 분포의 분산의 사전 결합 분포이기 때문이다.결과적으로, 표준화되지 않은 학생의 t-분포는 많은 베이시안 추론 문제에서 자연스럽게 발생한다.아래 내용 참조.
동등하게, 이 분포는 분포를scaled {\} ^^ {\{\}}:{2 축척-반전-치-제곱 분포로 합성하여 얻는다.스케일-인버스-치-스퀘어 분포는 역 감마 분포와 정확히 동일한 분포지만, 매개변수화가 다른 경우 즉 =2 , = =
이 버전의 t-분포는 재무 모델링에 유용할 수 있다.예를 들어 플라텐과 시도로위츠는 일반화된 쌍곡선 분포의 계열 중에서 약 4도의 자유도를 갖는 t-분포의 형태가 많은 전 세계 주식 지수의 (로그) 수익에 가장 적합하다는 것을 발견했다.[23]
역 스케일링 모수 λ
역 스케일링 매개 변수 }(정밀도가 분산의 역수인 방식과 유사함)에 대한 대체 매개 변수 = 1 농도:[24]
이 버전의 배포의 다른 속성은 다음과 같다.[24]
이 분포는 가우스 분포와 평균 및 알 수 없는 정밀도(분산의 역수)를 곱한 결과, 감마 는 모수 = 2 {\ a/2} 및 b = /( )로 정밀도형 b즉, 랜덤 변수 X는 알 수 없는 정밀도가 감마선으로 분포된 정규 분포를 갖는 것으로 가정하고, 그 다음 감마 분포에 대해 한계화된다.
관련 분포
- If has a Student's t-distribution with degree of freedom then X2 has an F-distribution:
- 비중앙 t-분포는 위치 파라미터를 포함하도록 t-분포를 일반화한다.비표준화된 t-분포와 달리 비중심 분포는 대칭이 아니다(중위값이 모드와 같지 않음).
- 이산 학생의 t-분포는 r:에 비례하는 확률 질량 함수로 정의된다.[25]
- 정규 분포와 χ-분포의2 제곱근에서 변수의 비율을 취함으로써 Student-t 표본을 생성할 수 있다.예를 들어 어윈-홀 분포와 같은 정규 분포 대신 사용할 경우 정규 분포, 유니폼 분포, 삼각 분포, 학생 분포 및 카우치 분포가 포함된 대칭 4-모수 분포를 전체적으로 얻는다.이것은 정규 분포의 다른 대칭 일반화보다 더 유연하다.
- t-평균은 비율 분포의 한 예다.
사용하다
빈번한 통계적 추론에서.
학생의 t-분포는 데이터가 부가오류로 관측되는 환경에서 평균값과 같은 미지의 모수를 추정하는 것을 목적으로 하는 다양한 통계적 추정 문제에서 발생한다.(거의 모든 실제 통계 작업에서와 마찬가지로) 이러한 오류의 모집단 표준 편차를 알 수 없고 데이터로부터 추정해야 하는 경우, t 분포는 종종 이 추정에 따른 추가 불확실성을 설명하기 위해 사용된다.대부분의 그러한 문제에서 오차의 표준 편차를 알면 t-분포 대신 정규 분포를 사용하게 된다.
신뢰구간과 가설검사는 특정 통계량의 표본분포(예: 표준점수)의 정량적 분포를 요구하는 두 가지 통계적 절차다.이 통계가 데이터의 선형 함수인 모든 상황에서, 표준 편차의 일반적인 추정치로 나눈 결과 수량의 크기를 조정하고 학생의 t-분포를 따르도록 중심을 맞출 수 있다.평균, 가중 평균 및 회귀 계수를 포함하는 통계 분석은 모두 이러한 형태를 갖는 통계로 이어진다.
교과서 문제는 모집단 표준 편차를 알고 있는 것처럼 취급하여 학생의 t-분포를 사용할 필요가 없는 경우가 꽤 많다.이러한 문제들은 일반적으로 (1) 표본 크기가 너무 커서 분산의 데이터 기반 추정치를 확실한 것처럼 취급할 수 있는 문제들과 (2) 표준 편차 추정 문제가 autho가 아닌 점이기 때문에 일시적으로 무시되는 수학 추론을 설명하는 문제들이다.r 또는 강사가 설명하고 있다.
가설 검정
관심 있는 귀무 가설에서 중간 크기의 표본에 대해 t-분포를 갖는 여러 통계량을 보여줌으로써 t-분포가 유의성 검정의 기초를 형성한다.예를 들어, Spearman의 순위 상관 계수 ρ의 분포는 null의 경우(상관 0)가 약 20개 이상의 표본 크기에 대한 t 분포에 의해 잘 근사하다.[citation needed]
신뢰구간
A라는 숫자가 너무 선택되어 있다고 가정하자.
T가 자유도가 n - 1인 t-분포를 갖는 경우.대칭적으로 이것은 A가 만족한다고 말하는 것과 같다.
그래서 A는 이 확률 분포의 "95번째 백분위수" 또는 = (,- 그러면
그리고 이것은 에 해당한다.
따라서 엔드포인트가 있는 간격
μ에 대한 90% 신뢰 구간.따라서, 우리가 합리적으로 정규 분포를 가질 것으로 예상할 수 있는 관측치 집합의 평균을 발견하면, t-분포를 사용하여 해당 평균에 대한 신뢰 한계가 귀무 가설에서 예측된 값과 같이 이론적으로 예측된 값을 포함하는지 여부를 조사할 수 있다.
학생의 t 검정에 사용되는 이 결과: 두 정규 분포에서 표본 평균의 차이 자체가 정규 분포를 따르므로 t-분포를 사용하여 해당 차이가 0으로 합리적으로 가정할 수 있는지 여부를 조사할 수 있다.
데이터가 정규 분포를 따르는 경우 평균의 단측(1 - α)-상측 신뢰 한계(UCL)는 다음 방정식을 사용하여 계산할 수 있다.
결과 UCL은 주어진 신뢰 구간과 모집단 크기에 대해 발생하는 가장 큰 평균 값이 될 것이다.즉 의n 은 관측치 집합의 평균으로, 분포의 평균이 UCL보다1−α 낮을 확률은 신뢰수준 1 - α와 같다.
예측 구간
t-분포는 평균과 분산을 알 수 없는 정규 분포에서 관측되지 않은 표본에 대한 예측 구간을 구성하는 데 사용할 수 있다.
베이지안 통계학
학생의 t-분포는 특히 3-모수(위치-척도) 버전에서 정규분포와 연관된 결과로 베이시안 통계에서 자주 발생한다.정규 분포 랜덤 변수의 분산을 알 수 없고 역 감마 분포를 따르는 결합 전 배치될 때마다 변수의 결과 한계 분포는 학생의 t 분포를 따를 것이다.동일한 결과를 갖는 등가 구조에는 분산에 대한 결합 축척-반향-치 제곱 분포 또는 정밀도에 대한 결합 감마 분포가 포함된다.σ에−2 비례하는 부적절한 사전 비율이 분산 위에 놓이면 t-분포도 발생한다.정규 분포 변수의 평균을 알 수 있는지, 이전에 정규 분포된 공극에 따라 알 수 없는지, 또는 이전의 부적절한 상수에 따라 알 수 없는 것인지에 관계없이 이 경우다.
t-분포를 발생시키는 관련 상황은 다음과 같다.
- 정규 분포 변수의 알 수 없는 평균의 한계 후방 분포로, 위의 모형에 따른 알 수 없는 이전 평균과 분산이 있다.
- 위의 모델과 같이 이전 평균과 분산을 사용하여 동일한 분산된 일련의 독립적 정규 분포 데이터 점이 관찰된 경우 새로운 정규 분포 데이터 포인트의 사전 예측 분포 및 후방 예측 분포.
강력한 파라메트릭 모델링
t-분포는 종종 데이터에 대한 모델로서 정규 분포의 대안으로 사용되는데, 이는 종종 정규 분포가 허용하는 것보다 더 무거운 꼬리를 가지고 있다(예: 참조).랜지 [27]외고전적인 접근방식은 특이치를 식별하고(예: 그루브스 검정을 사용) 어떤 식으로든 이를 배제하거나 저체중화하는 것이었다.그러나 특이치를 식별하는 것이 항상 쉬운 것은 아니며(특히 높은 치수에서), t-분포는 그러한 데이터에 대한 자연스러운 모델 선택이며 강력한 통계량에 대한 파라메트릭 접근법을 제공한다.
베이시안 계정은 겔만 등지에서 찾을 수 있다.[28]자유도 모수는 분포의 첨도를 제어하며 척도 모수와 상관 관계가 있다.가능성은 여러 개의 국부적 최대치를 가질 수 있으며, 따라서 자유도를 상당히 낮은 값으로 고정하고 이것을 주어진 것으로 간주하는 다른 매개변수를 추정해야 하는 경우가 많다.일부 저자들은[citation needed] 3에서 9 사이의 가치가 종종 좋은 선택이라고 보고한다.Venables와 Ripley는[citation needed] 5의 값이 종종 좋은 선택이라고 제안한다.
학생의 t-과정
실질적인 회귀 분석과 예측 요구를 위해 학생의 t-프로세스가 도입되었는데, 이는 기능에 대한 학생 t-분산의 일반화다.학생의 t-프로세스는 가우스 분포로 구성되는 것처럼 학생의 t-분포에서 구성된다.가우스 공정의 경우 모든 값 집합은 다차원 가우스 분포를 가진다.Analogiusly, is a Student t-process on an interval if the correspondent values of the process () have a joint multivariate Student t-di공로를 [29]세우다이러한 프로세스는 회귀 분석, 예측, 베이시안 최적화 및 관련 문제에 사용된다.다변량 회귀 분석 및 다중 출력 예측의 경우 다변량 학생 t-프로세스를 도입하여 사용한다.[30]
선택한 값 표
다음 표에는 일방 또는 양면 임계 영역의 범위에 대해 자유도가 ν인 t-분산 값이 나열되어 있다.첫 번째 열은 ν이고, 상단을 따라 있는 백분율은 신뢰수준이며, 표의 본문에 있는 숫자는 신뢰구간에 관한 절에 기술된 , - 요인이다.
무한 ν의 마지막 행은 자유도가 무한히 많은 t 분포가 정규 분포이기 때문에 정규 분포에 임계 포인트를 준다는 점에 유의한다.(위의 관련 분포를 참조하십시오.)
일방적 | 75% | 80% | 85% | 90% | 95% | 97.5% | 99% | 99.5% | 99.75% | 99.9% | 99.95% |
---|---|---|---|---|---|---|---|---|---|---|---|
양면 | 50% | 60% | 70% | 80% | 90% | 95% | 98% | 99% | 99.5% | 99.8% | 99.9% |
1 | 1.000 | 1.376 | 1.963 | 3.078 | 6.314 | 12.71 | 31.82 | 63.66 | 127.3 | 318.3 | 636.6 |
2 | 0.816 | 1.080 | 1.386 | 1.886 | 2.920 | 4.303 | 6.965 | 9.925 | 14.09 | 22.33 | 31.60 |
3 | 0.765 | 0.978 | 1.250 | 1.638 | 2.353 | 3.182 | 4.541 | 5.841 | 7.453 | 10.21 | 12.92 |
4 | 0.741 | 0.941 | 1.190 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 | 5.598 | 7.173 | 8.610 |
5 | 0.727 | 0.920 | 1.156 | 1.476 | 2.015 | 2.571 | 3.365 | 4.032 | 4.773 | 5.893 | 6.869 |
6 | 0.718 | 0.906 | 1.134 | 1.440 | 1.943 | 2.447 | 3.143 | 3.707 | 4.317 | 5.208 | 5.959 |
7 | 0.711 | 0.896 | 1.119 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 | 4.029 | 4.785 | 5.408 |
8 | 0.706 | 0.889 | 1.108 | 1.397 | 1.860 | 2.306 | 2.896 | 3.355 | 3.833 | 4.501 | 5.041 |
9 | 0.703 | 0.883 | 1.100 | 1.383 | 1.833 | 2.262 | 2.821 | 3.250 | 3.690 | 4.297 | 4.781 |
10 | 0.700 | 0.879 | 1.093 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 | 3.581 | 4.144 | 4.587 |
11 | 0.697 | 0.876 | 1.088 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 | 3.497 | 4.025 | 4.437 |
12 | 0.695 | 0.873 | 1.083 | 1.356 | 1.782 | 2.179 | 2.681 | 3.055 | 3.428 | 3.930 | 4.318 |
13 | 0.694 | 0.870 | 1.079 | 1.350 | 1.771 | 2.160 | 2.650 | 3.012 | 3.372 | 3.852 | 4.221 |
14 | 0.692 | 0.868 | 1.076 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 | 3.326 | 3.787 | 4.140 |
15 | 0.691 | 0.866 | 1.074 | 1.341 | 1.753 | 2.131 | 2.602 | 2.947 | 3.286 | 3.733 | 4.073 |
16 | 0.690 | 0.865 | 1.071 | 1.337 | 1.746 | 2.120 | 2.583 | 2.921 | 3.252 | 3.686 | 4.015 |
17 | 0.689 | 0.863 | 1.069 | 1.333 | 1.740 | 2.110 | 2.567 | 2.898 | 3.222 | 3.646 | 3.965 |
18 | 0.688 | 0.862 | 1.067 | 1.330 | 1.734 | 2.101 | 2.552 | 2.878 | 3.197 | 3.610 | 3.922 |
19 | 0.688 | 0.861 | 1.066 | 1.328 | 1.729 | 2.093 | 2.539 | 2.861 | 3.174 | 3.579 | 3.883 |
20 | 0.687 | 0.860 | 1.064 | 1.325 | 1.725 | 2.086 | 2.528 | 2.845 | 3.153 | 3.552 | 3.850 |
21 | 0.686 | 0.859 | 1.063 | 1.323 | 1.721 | 2.080 | 2.518 | 2.831 | 3.135 | 3.527 | 3.819 |
22 | 0.686 | 0.858 | 1.061 | 1.321 | 1.717 | 2.074 | 2.508 | 2.819 | 3.119 | 3.505 | 3.792 |
23 | 0.685 | 0.858 | 1.060 | 1.319 | 1.714 | 2.069 | 2.500 | 2.807 | 3.104 | 3.485 | 3.767 |
24 | 0.685 | 0.857 | 1.059 | 1.318 | 1.711 | 2.064 | 2.492 | 2.797 | 3.091 | 3.467 | 3.745 |
25 | 0.684 | 0.856 | 1.058 | 1.316 | 1.708 | 2.060 | 2.485 | 2.787 | 3.078 | 3.450 | 3.725 |
26 | 0.684 | 0.856 | 1.058 | 1.315 | 1.706 | 2.056 | 2.479 | 2.779 | 3.067 | 3.435 | 3.707 |
27 | 0.684 | 0.855 | 1.057 | 1.314 | 1.703 | 2.052 | 2.473 | 2.771 | 3.057 | 3.421 | 3.690 |
28 | 0.683 | 0.855 | 1.056 | 1.313 | 1.701 | 2.048 | 2.467 | 2.763 | 3.047 | 3.408 | 3.674 |
29 | 0.683 | 0.854 | 1.055 | 1.311 | 1.699 | 2.045 | 2.462 | 2.756 | 3.038 | 3.396 | 3.659 |
30 | 0.683 | 0.854 | 1.055 | 1.310 | 1.697 | 2.042 | 2.457 | 2.750 | 3.030 | 3.385 | 3.646 |
40 | 0.681 | 0.851 | 1.050 | 1.303 | 1.684 | 2.021 | 2.423 | 2.704 | 2.971 | 3.307 | 3.551 |
50 | 0.679 | 0.849 | 1.047 | 1.299 | 1.676 | 2.009 | 2.403 | 2.678 | 2.937 | 3.261 | 3.496 |
60 | 0.679 | 0.848 | 1.045 | 1.296 | 1.671 | 2.000 | 2.390 | 2.660 | 2.915 | 3.232 | 3.460 |
80 | 0.678 | 0.846 | 1.043 | 1.292 | 1.664 | 1.990 | 2.374 | 2.639 | 2.887 | 3.195 | 3.416 |
100 | 0.677 | 0.845 | 1.042 | 1.290 | 1.660 | 1.984 | 2.364 | 2.626 | 2.871 | 3.174 | 3.390 |
120 | 0.677 | 0.845 | 1.041 | 1.289 | 1.658 | 1.980 | 2.358 | 2.617 | 2.860 | 3.160 | 3.373 |
∞ | 0.674 | 0.842 | 1.036 | 1.282 | 1.645 | 1.960 | 2.326 | 2.576 | 2.807 | 3.090 | 3.291 |
일방적 | 75% | 80% | 85% | 90% | 95% | 97.5% | 99% | 99.5% | 99.75% | 99.9% | 99.95% |
양면 | 50% | 60% | 70% | 80% | 90% | 95% | 98% | 99% | 99.5% | 99.8% | 99.9% |
신뢰 구간 계산
크기가 11이고 표본 평균이 10이고 표본 분산 2인 표본이 있다고 가정합시다.자유도가 10인 90%인 경우 표의 단측 t-값은 1.372이다.그런 다음 다음 다음에서 계산된 신뢰 구간을 사용하여
우리는 90%의 자신감으로 아래에 진정한 평균이 있다고 판단한다.
즉, 특정 표본으로부터 이 방법에 의해 상한 임계값을 계산하는 시간의 90%는 이 상한 임계값이 참 평균을 초과한다.
그리고 90%의 자신감으로 우리는 위에 있는 진정한 평균을 가지고 있다.
즉, 특정 표본으로부터 이 방법에 의해 낮은 임계값을 계산하는 시간의 90%가, 이 낮은 임계값은 참 평균보다 낮다.
따라서 80% 신뢰도(100% - 2×(1 - 90%) = 80%로 계산됨)에서 구간 내에 실제 평균이 거짓말을 함
상한과 하한 임계값이 주어진 표본에서 이 방법에 의해 계산되는 시간의 80%를 말한다면, 참 평균은 상한 임계값보다 낮으며 하한 임계값보다 높다고 말하는 것은 실제 평균이 계산된 특정 상한과 하한 임계값 사이에 있을 확률이 80%라고 말하는 것과 같지 않다.이 방법에 따라; 신뢰구간과 검사의 오류를 보라.
오늘날, R 프로그래밍 언어와 같은 통계 소프트웨어와 많은 스프레드시트 프로그램에서 이용할 수 있는 기능들은 표 없이 t-분포와 그것의 역분포의 값을 계산한다.
참고 항목
메모들
- ^ Hurst, Simon. "The Characteristic Function of the Student t Distribution". Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95. Archived from the original on February 18, 2010.
- ^ Helmert FR (1875). "Über die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler". Z. Math. U. Physik. 20: 300–3.
- ^ Helmert FR (1876). "Über die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit in Zusammenhang stehende Fragen". Z. Math. Phys. 21: 192–218.
- ^ Helmert FR (1876). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit" [The accuracy of Peters' formula for calculating the probable observation error of direct observations of the same accuracy]. Astron. Nachr. (in German). 88 (8–9): 113–132. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802.
- ^ Lüroth J (1876). "Vergleichung von zwei Werten des wahrscheinlichen Fehlers". Astron. Nachr. 87 (14): 209–20. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402.
- ^ Pfanzagl J, Sheynin O (1996). "Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution". Biometrika. 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.
- ^ Sheynin O (1995). "Helmert's work in the theory of errors". Arch. Hist. Exact Sci. 49 (1): 73–104. doi:10.1007/BF00374700. S2CID 121241599.
- ^ Pearson, K. (1895-01-01). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material". Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 186: 343–414 (374). Bibcode:1895RSPTA.186..343P. doi:10.1098/rsta.1895.0010. ISSN 1364-503X.
- ^ "Student" [William Sealy Gosset] (1908). "The probable error of a mean" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. JSTOR 2331554.
- ^ Wendl MC (2016). "Pseudonymous fame". Science. 351 (6280): 1406. Bibcode:2016Sci...351.1406W. doi:10.1126/science.351.6280.1406. PMID 27013722.
- ^ Mortimer RG (2005). Mathematics for physical chemistry (3rd ed.). Burlington, MA: Elsevier. pp. 326. ISBN 9780080492889. OCLC 156200058.
- ^ a b Fisher RA (1925). "Applications of 'Student's' distribution" (PDF). Metron. 5: 90–104. Archived from the original (PDF) on 5 March 2016.
- ^ Walpole RE, Myers R, Myers S, et al. (2006). Probability & Statistics for Engineers & Scientists (7th ed.). New Delhi: Pearson. p. 237. ISBN 9788177584042. OCLC 818811849.
- ^ Kruschke JK (2015). Doing Bayesian Data Analysis (2nd ed.). Academic Press. ISBN 9780124058880. OCLC 959632184.
- ^ a b c Johnson NL, Kotz S, Balakrishnan N (1995). "Chapter 28". Continuous Univariate Distributions. Vol. 2 (2nd ed.). Wiley. ISBN 9780471584940.
- ^ Gelman AB, Carlin JS, Rubin DB, et al. (1997). Bayesian Data Analysis (2nd ed.). Boca Raton: Chapman & Hall. p. 68. ISBN 9780412039911.
- ^ Hogg RV, Craig AT (1978). Introduction to Mathematical Statistics (4th ed.). New York: Macmillan. ASIN B010WFO0SA. Sections 4.4 and 4.8
{{cite book}}
: CS1 maint : 포스트스크립트(링크) - ^ Cochran WG (1934). "The distribution of quadratic forms in a normal system, with applications to the analysis of covariance". Math. Proc. Camb. Philos. Soc. 30 (2): 178–191. Bibcode:1934PCPS...30..178C. doi:10.1017/S0305004100016595.
- ^ Park SY, Bera AK (2009). "Maximum entropy autoregressive conditional heteroskedasticity model". J. Econom. 150 (2): 219–230. doi:10.1016/j.jeconom.2008.12.014.
- ^ Casella G, Berger RL (1990). Statistical Inference. Duxbury Resource Center. p. 56. ISBN 9780534119584.
- ^ a b Bailey RW (1994). "Polar Generation of Random Variates with the t-Distribution". Math. Comput. 62 (206): 779–781. Bibcode:1994MaCom..62..779B. doi:10.2307/2153537. JSTOR 2153537.
- ^ a b Jackman, S. (2009). Bayesian Analysis for the Social Sciences. Wiley. p. 507. doi:10.1002/9780470686621. ISBN 9780470011546.
- ^ Platen, Eckhard & Sidorowicz, Renata (March 2007). "Empirical Evidence on Student-t Log Returns of Diversified World Stock Indices" (PDF). Quantitative Finance Research Center. ISSN 1441-8010. Archived from the original (PDF) on 2019-04-30. Retrieved 2022-03-22.
{{cite journal}}
: CS1 maint : 복수이름 : 작성자 목록(링크) - ^ a b Bishop, C.M. (2006). Pattern Recognition and Machine Learning. New York, NY: Springer. ISBN 9780387310732.
- ^ Ord JK (1972). Families of Frequency Distributions. London: Griffin. ISBN 9780852641378. See Table 5.1.
{{cite book}}
: CS1 maint : 포스트스크립트(링크) - ^ Ord JK (1972). "Chapter 5". Families of frequency distributions. London: Griffin. ISBN 9780852641378.
- ^ Lange KL, Little RJ, Taylor JM (1989). "Robust Statistical Modeling Using the t Distribution" (PDF). J. Am. Stat. Assoc. 84 (408): 881–896. doi:10.1080/01621459.1989.10478852. JSTOR 2290063.
- ^ Gelman AB, Carlin JB, Stern HS, et al. (2014). "Computationally efficient Markov chain simulation". Bayesian Data Analysis. Boca Raton, Florida: CRC Press. p. 293. ISBN 9781439898208.
- ^ Shah, Amar; Wilson, Andrew Gordon; Ghahramani, Zoubin (2014). "Student-t processes as alternatives to Gaussian processes" (PDF). JMLR. 33 (Proceedings of the 17th International Conference on Artificial Intelligence and Statistics (AISTATS) 2014, Reykjavik, Iceland): 877–885. arXiv:1402.4306.
- ^ Chen, Zexun; Wang, Bo; Gorban, Alexander N. (2019). "Multivariate Gaussian and Student-t process regression for multi-output prediction". Neural Computing and Applications. 32 (8): 3005–3028. arXiv:1703.04455. doi:10.1007/s00521-019-04687-8.
참조
- Senn, S.; Richardson, W. (1994). "The first t-test". Statistics in Medicine. 13 (8): 785–803. doi:10.1002/sim.4780130802. PMID 8047737.
- Hogg RV, Craig AT (1978). Introduction to Mathematical Statistics (4th ed.). New York: Macmillan. ASIN B010WFO0SA.
- Venables, W. N.; Ripley, B. D. (2002). Modern Applied Statistics with S (Fourth ed.). Springer.
- Gelman, Andrew; John B. Carlin; Hal S. Stern; Donald B. Rubin (2003). Bayesian Data Analysis (Second ed.). CRC/Chapman & Hall. ISBN 1-58488-388-X.
외부 링크
- "Student distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- 수학의 일부 단어의 초기 알려진 사용법 (S) (학생 분포라는 용어의 역사에 대한 설명)
- Rouaud, M. (2013), Probability, Statistics and Estimation (PDF) (short ed.) 112페이지의 첫 번째 학생.
- 학생 t-Distribution,[dead link] ck12