귀무 가설

Null hypothesis

추리 통계량에서 귀무 가설(종종 [1]H로 표시0)은 두 가지 가능성이 같다는 것입니다.귀무 가설은 관측된 차이가 우연에 의한 것이라는 것입니다.통계적 검정을 사용하여 귀무 가설이 참일 가능성을 계산할 수 있습니다.

기본 정의

귀무 가설과 대립 가설은 통계적 테스트에 사용되는 추측의 유형으로, 데이터에 근거해 결론을 내리거나 결정을 내리는 공식 방법이다.가설은 모집단의 표본에 기초모집단의 통계 모델에 대한 추측입니다.테스트는 통계적 추론의 핵심 요소이며, 과학적 주장과 통계적 잡음을 분리하기 위해 과학적 실험 데이터의 해석에 많이 사용된다.

"통계적 유의성 테스트에서 테스트되는 진술은 귀무 가설이라고 불립니다.유의성 검정은 귀무 가설에 대한 증거의 강도를 평가하기 위해 고안되었습니다.일반적으로 귀무 가설은 '효과 없음' 또는 '차이 없음'[2]의 진술입니다."그것은 종종 H0 상징된다.

귀무 가설에 대해 검정 중인 진술이 대립 [2]가설입니다.기호에는 Ha H가 포함됩니다1.

통계적 유의성 검정: "대략적으로 판단 절차는 다음과 같습니다.모집단에서 랜덤 표본을 추출합니다.표본 데이터가 귀무 가설과 일치하면 귀무 가설을 기각하지 마십시오. 표본 데이터가 귀무 가설과 일치하지 않으면 귀무 가설을 기각하고 대립 가설이 [3]참이라는 결론을 내리십시오."

다음은 기본 정의에 컨텍스트와 뉘앙스를 추가합니다.

랜덤 샘플 2개(남성과 여성 중 1개)의 테스트 점수를 고려할 때, 한 그룹은 다른 그룹과 다른가요?가능한 귀무 가설은 평균 남성 점수가 평균 여성 점수와 같다는 것입니다.

H01: μ2 = μ

어디에

H0 = 귀무 가설,
μ1 = 모집단 1의 평균
μ2 = 모집단 2의 평균.

더 강력한 귀무 가설은 두 표본이 동일한 모집단에서 추출되어 분포의 분산과 모양도 동일하다는 것입니다.

용어.

단순 가설
모집단 분포를 완전히 지정하는 가설입니다.이러한 가설에서 통계량의 표본 분포는 표본 크기만의 함수이다.
복합 가설
모집단 분포를 [4]완전히 지정하지 않은 가설입니다.예:지정된 평균과 지정되지 않은 분산을 가진 정규 분포를 지정하는 가설입니다.

단순/복합적 구별은 Neyman과 [5]Pearson이 만들었습니다.

정확한 가설
정확한 모수 [6]값을 지정하는 가설입니다.예: μ = 100.동의어: 점 가설.
부정확한 가설
파라미터 범위 또는 간격을 지정하는 것.예: μ 100 100, 95 μ μ 105 105.

Fisher는 검정을 위해 정확한 귀무 가설을 요구했습니다(아래 인용문 참조).

단꼬리 가설([2]단측 검정을 사용하여 검정됨)은 모수의 값이 다음과 같이 지정된 부정확한 가설입니다.

  • 특정 값보다 크거나 같거나
  • 특정 값 이하입니다.

한쪽 꼬리가 있는 가설은 방향성이 있다고 한다.

Fisher의 원래 예(여자가 차를 시식하는 것)는 한쪽 꼬리 테스트였다.귀무 가설은 비대칭이었다.모든 컵을 정확하게 추측할 확률은 모든 컵을 잘못 추측하는 것과 같았지만, 피셔는 정확하게 추측하는 것만이 이 여성의 주장과 양립할 수 있다고 지적했다.

  • 8살 때 남자아이들이 여자아이들보다 키가 크나요?귀무 가설은 "두 사람의 평균 키는 같다"입니다.
  • 청소년들은 성인들보다 식당 위치 찾기 앱을 더 많이 사용하나요?귀무 가설은 "이러한 앱을 같은 평균 양으로 사용한다"는 것입니다.
  • 하루에 사과 한 개씩 먹는 것이 의사 면회를 줄일 수 있습니까?귀무 가설은 "애플이 의사 면회를 줄이지 않는다"는 것이다.
  • 작은 주들이 큰 주들보다 더 인구밀도가 높은가?귀무 가설은 "작은 주들은 큰 주들과 같은 인구 밀도를 가진다"이다.
  • 큰 주들은 작은 주들보다 인구가 더 밀집되어 있나요?귀무 가설은 "큰 주들은 작은 주들과 인구 밀도가 같다"입니다.
  • 주의 크기가 인구 밀도에 영향을 미칩니까?귀무 가설은 "모든 주의 인구 밀도가 같다"입니다.
  • 큰 개들은 큰 먹이를 먹는 것을 선호하나요?귀무 가설은 "큰 개들은 큰 키블 크기를 선호하지 않는다"는 것이다.
  • 고양이는 생선과 우유 중 어느 것을 더 좋아하나요?귀무 가설은 "고양이는 선호도가 없다; 그들은 그들을 똑같이 좋아한다"이다.

기술 설명

귀무 가설은 측정할 수량이 0(귀무)이라는 기본 가설입니다.일반적으로 측정되는 양은 두 상황의 차이입니다.예를 들어, 효과가 발생했거나 표본이 서로 다른 [7][8]배치에서 파생되었다는 확실한 증거가 있는지 확인하려고 합니다.

귀무 가설은 (관심 있는) 양이 0보다 크거나 같고 0보다 작거나 같다는 것을 나타냅니다.어느 하나의 요건이 확실히 뒤집힐 수 있는 경우, 귀무 가설은 "가능성의 영역에서 제외"된다.

귀무 가설은 일반적으로 참일 가능성이 있는 것으로 가정됩니다.예를 들어 높은 신뢰 수준을 갖는 등 가설을 어떻게 거부하거나 제외해야 하는지를 보여주기 위해 다중 분석을 수행할 수 있으며, 따라서 통계적으로 유의한 차이를 나타낼 수 있다.이는 0이 어느 한쪽에서나 측정의 지정된 신뢰 구간([8]일반적으로 실제 수치 이내)을 벗어난다는 것을 보여줌으로써 입증된다.귀무 가설을 배제하지 못하면(확실히) 귀무 가설을 논리적으로 확인하거나 뒷받침하지 못합니다.(예를 들어 x보다 큰 것이 증명되었을 때, 반드시 x보다 작거나 같은 것을 의미하는 것은 아니며, 대신 낮은 정밀도의 낮은 품질 측정이 될 수 있습니다.귀무 가설을 양면적으로 확인하는 것은 0보다 크거나 같음을 확실히 증명하고 0보다 작거나 같음을 확실히 증명하는 것과 같습니다.이것은 무한한 정확성과 정확히 제로 효과가 필요한 것으로, 일반적으로는 어느 쪽도 현실적이지 않습니다.또한 측정 시 차이가 정확히 0이 아닌 확률을 나타내지 않습니다.)따라서 귀무 가설의 제외 실패는 지정된 신뢰 수준에서 "모르는" 것과 같습니다. 데이터가 귀무 가설에 대해 이미 (덜 강한) 표시를 나타낼 수 있기 때문에, 귀무 가설이 즉시 귀무(null)를 의미하는 것은 아닙니다.사용된 신뢰 수준은 제외에 실패할 때 null의 가능성에 절대 해당하지 않습니다. 실제로 이 경우 사용된 신뢰 수준이 높으면 여전히 타당한 범위가 확장됩니다.

non-null 가설은 작성자에 따라 다음과 같은 의미를 가질 수 있으며 a) 0 이외의 값을 사용하고 b) 0 이외의 여백을 사용하며 c) "대안" [9][10]가설을 사용할 수 있다.

귀무 가설을 시험(제외 또는 제외하지 않음)하면 두 현상 사이에 관계가 있다고 믿을 수 있는 통계적으로 충분한 근거가 있다는 증거를 제공한다(예: 어느 쪽이든 잠재적 치료법이 0이 아닌 효과를 갖는다는 사실).귀무 가설을 검증하는 것은 현대 과학에서 통계 가설 테스트의 중심 과제이다.특정 신뢰 수준에서 귀무 가설을 제외하거나 제외하지 않는 정확한 기준이 있습니다.신뢰 수준은 훨씬 더 많고 더 나은 데이터가 여전히 같은 [8]쪽에서 귀무 가설을 제외할 수 있는 가능성을 나타내야 합니다.

귀무 가설의 개념은 통계적 추론에 대한 두 가지 접근법에서 다르게 사용된다.Ronald Fisher의 유의성 검정 접근법에서는 귀무 가설이 참일 경우 관측된 데이터가 유의하게 발생할 가능성이 낮으면 귀무 가설이 기각됩니다.이 경우 귀무 가설이 기각되고 대신 대립 가설이 받아들여집니다.데이터가 통계적으로 참일 가능성이 있는 귀무 가설과 일치하면 귀무 가설이 기각되지 않습니다.두 경우 모두 귀무 가설이나 귀무 가설의 대안이 입증되지 않았습니다. 데이터가 많거나 많더라도 귀무 가설은 여전히 기각될 수 있습니다.이는 피의자나 피고인이 합리적 의심을 넘어 유죄(통계적으로 유의한 정도)[8]가 입증될 때까지 무죄(무죄는 기각되지 않음)로 가정하는 무죄 추정의 법리와 유사하다.

Jerzy Neyman과 Egon Pearson의 가설 테스트 접근법에서 귀무 가설은 대립 가설과 대조되며, 두 가설은 데이터에 기초하여 특정 오류율과 함께 구별된다.그것은 연구에서 답을 공식화하는 데 사용된다.

통계적 추론은 귀무 가설 없이 각 후보 가설에 대응하는 통계 모델을 지정하고 가장 적합한 모델을 [11]선택하기 위해 모델 선택 기법을 사용하여 수행할 수 있습니다.(가장 일반적인 선택 기법은 Akaike 정보 기준 또는 Bayes 계수를 기반으로 합니다.)

원칙

가설 검정에서는 우연 또는 랜덤 공정만이 결과에 대한 책임이 있는 경우 데이터가 어떻게 보일지에 대한 통계적 모형을 구성해야 합니다.우연만이 결과에 대한 책임이 있다는 가설을 귀무 가설이라고 합니다.랜덤 공정의 결과 모형을 귀무 가설에서는 분포라고 합니다.얻어진 결과를 귀무 가설에서의 분포와 비교하여 얻어진 결과를 찾을 가능성을 결정한다.[12]

가설 검정은 랜덤하게 선택된 대표 표본에 대한 연구를 수행할 때 데이터를 수집하고 특정 데이터 집합의 가능성을 측정하는 방식으로 작동합니다(귀무 가설이 참이라고 가정).귀무 가설은 표본[13]선택된 모집단의 변수 사이에 관계가 없다고 가정합니다.

랜덤하게 선택된 대표 표본의 데이터 집합이 귀무 가설(거의 관측되지 않는 데이터 집합의 일부로 정의됨)에 비해 매우 가능성이 낮은 경우, 실험자는 귀무 가설을 기각하고 (아마도) 잘못된 것일 수 있습니다.이러한 데이터 집합의 클래스는 일반적으로 귀무 가설에서 명백히 벗어난 정도를 측정하기 위해 설계된 검정 통계량을 통해 지정됩니다.이 절차는 테스트 통계량에 의해 측정된 관측 이탈이 정의된 값보다 큰지 여부를 평가하여, 귀무 가설에서 더 극단적인 값의 발생 확률이 작습니다(일반적으로 귀무 가설이 유지되는 유사한 데이터 집합의 5% 또는 1% 미만).

데이터가 귀무 가설과 모순되지 않으면 관측된 데이터 집합이 귀무 가설에 대한 불충분한 증거를 제공한다는 약한 결론만 내릴 수 있습니다.이 경우 귀무 가설이 참 또는 거짓일 수 있기 때문에, 어떤 상황에서는 데이터가 결론을 내리기 위한 충분한 증거를 제공하는 반면, 다른 상황에서는 현재 유용한 체제에서 다른 것으로의 변경을 뒷받침할 충분한 증거가 없다는 의미로 해석됩니다.그럼에도 불구하고, 이 시점에서 효과가 가능성이 높거나 충분히 큰 것으로 보인다면, 더 큰 샘플을 실행하는 것과 같은 추가 조사를 위한 동기가 있을 수 있다.

예를 들어, 특정 약물은 심장마비를 일으킬 위험을 줄일 수 있다.가능한 귀무 가설은 "이 약은 심장마비 위험을 줄이지 않는다" 또는 "이 약은 심장마비 위험에 영향을 미치지 않는다"이다.이 가설의 테스트는 대조 실험으로 스터디 그룹의 사람들 중 절반에게 약을 투여하는 것으로 구성됩니다.데이터가 약을 공급받는 사람들의 통계적으로 유의한 변화를 보여주는 경우 귀무 가설은 기각됩니다.

귀무 가설 검정의 목적

하나 이상의 표본, 평균, 분산 및 비율, 쌍체 또는 비쌍체 데이터, 서로 다른 분포, 크고 작은 표본에 대한 유의성 검정에는 여러 가지 유형이 있으며, 모두 귀무 가설이 있습니다.유의성 [14]검정의 귀무 가설에는 적어도 네 가지 목표가 있습니다.

  • 기술적 귀무 가설은 통계적 가정을 검증하기 위해 사용된다.예를 들어, 데이터와 통계 모형 사이의 잔차는 랜덤 노이즈와 구별할 수 없습니다.사실일 경우 모델을 복잡하게 만들 이유가 없습니다.
  • 과학적 영의 가정은 이론을 직접적으로 진전시키기 위해 사용된다.예를 들어, 우주의 각운동량은 0이다.만약 사실이 아니라면, 초기 우주의 이론은 수정이 필요할지도 모른다.
  • 균질성에 대한 귀무 가설을 사용하여 여러 실험이 일관된 결과를 산출하고 있는지 확인합니다.예를 들어, 노인에 대한 약물의 효과는 일반 성인 인구의 효과와 일치한다.사실일 경우, 이는 일반적인 효과 결론을 강화하고 사용 권장 사항을 단순화합니다.
  • 두 가지 이상의 대체 치료제(예: 약물과 위약) 효과의 동일성을 주장하는 귀무 가설을 사용하여 통계적 잡음을 기반으로 한 과학적 주장을 감소시킨다.이것은 가장 일반적인 귀무 가설이다.이것은 매우 인기가 많아서 유의한 검정에 대한 많은 진술이 그러한 귀무 가설을 가정합니다.

귀무 가설을 기각하는 이 유의성 검사기의 진짜 목표는 아닙니다.적절한 통계 모형은 null을 기각하지 못하는 것과 관련될 수 있습니다. null이 기각되지 않을 때까지 모형이 조정됩니다.유의성 검정의 수많은 사용은 귀무 [15]가설을 정의하기 전에 10년 동안 쓴 그의 책에서 많은 것을 논의한 피셔에게 잘 알려져 있었다.

통계적 유의성 검정은 신뢰 구간과 많은 수학을 공유합니다.그들은 서로 을 발하고 있다.결과는 종종 관계의 부호에 대한 신뢰가 있는 경우(구간에는 0이 포함되지 않음) 유의합니다.관계의 징후가 중요할 때마다 통계적 유의성은 가치 있는 목표이다.이것은 또한 유의성 테스트의 약점을 드러냅니다.관계 강도에 대한 적절한 평가 없이도 결과는 중요할 수 있습니다.의미는 그다지 중요하지 않은 목표가 될 수 있습니다.또한 관계가 약한 경우에도 충분한 데이터가 있으면 유의성을 얻을 수 있습니다.일반적으로 유의 구간과 신뢰 구간을 모두 보고하는 것이 좋습니다.

중요도 검정을 다양하게 사용하면 모든 응용 프로그램에 대해 수행할 수 있는 일반화의 수를 줄일 수 있습니다.

귀무 가설 선택

귀무 가설의 선택은 희박하고 일관성 없는 조언과 관련이 있다.Fisher는 선택에 대한 몇 가지 제약 조건을 언급하고 많은 귀무 가설을 고려해야 하며 각각에 대해 많은 검정이 가능하다고 말했습니다.다양한 응용 프로그램과 다양한 목표는 선택이 복잡할 수 있음을 나타냅니다.많은 응용 프로그램에서 테스트의 공식은 전통적인 방식입니다.사용 가능한 검정의 범위를 잘 알고 있으면 특정 귀무 가설 및 검정을 제안할 수 있습니다.귀무 가설을 공식화하는 것은 자동화되지 않습니다(일반적으로 유의성 검정의 계산은 자동화됩니다).데이비드 콕스 경은 "주제문제에서 통계모델로의 변환이 어떻게 이루어지는지가 종종 분석에서 가장 중요한 부분"[16]이라고 말했다.

통계적 유의성 검정은 가설을 검정하기 위한 것입니다.가설이 데이터 집합을 요약하는 경우 해당 데이터 집합에 대한 가설을 검정하는 데 아무런 가치가 없습니다.예: 작년 일기예보에 대한 연구에서 한 지역에 비가 주로 주말에 내린다는 것이 밝혀진다면, 그 귀무 가설은 다른 의 일기예보에 대해서만 검증할 수 있다.데이터에 의해 제시된 가설 검정은 아무것도 증명하지 않는 순환 추론이며, 귀무 가설의 선택에 대한 특별한 제한입니다.

통상적인 순서는 다음과 같습니다.과학적 가설부터 시작합시다.이것을 통계적 대체 가설로 변환하여 계속 진행하십시오: "H는 우리가 증거를 찾고자 하는 효과를 나타내기 때문에a, 우리는 종종 H로 시작해서a H를 희망 효과가 [2]존재하지 않는다는 진술로 설정한다0."이 조언은 null에 대한 증거를 찾지 않으려는 모델링 어플리케이션에서는 반대입니다.

복잡한 예는 다음과 같습니다.[17]임상 연구의 황금 기준은 무작위 플라시보 대조 이중 블라인드 임상 시험이다.하지만 새로운 약물을 위약에 대해 시험하는 것은 심각한 질병에는 비윤리적일 수 있습니다.의학적으로 효과적인 오래된 약물에 대해 신약을 테스트하는 것은 테스트의 목적과 실험자들의 동기에 관한 근본적인 철학적 문제를 제기한다.표준 "차이가 없는" 귀무 가설은 제약 회사가 부적절한 데이터를 수집한 것에 대해 보상을 제공할 수 있습니다.이 경우 "차이"는 더 나은 귀무 가설이지만, 통계적 유의성은 약물의 효과에 대한 좋은 수치적 추정이 필요한 미묘한 결론에 도달하기 위한 적절한 기준이 아니다.(새로운 대 플라시보)가 아닌 (새로운 대 오래된) 귀무 가설의 "소규모" 또는 "단순" 제안된 변경은 복잡한 비통계적 이유로 검정의 효용성에 극적인 영향을 미칠 수 있다.

방향성

귀무 가설(H0)의 선택과 방향성의 고려("단꼬리 검정" 참조)가 중요합니다.

null-hypothesis 검정의 테일성

동전 던지기가 공정한지(즉, 평균적으로 동전 던지기 시간의 50%를 앞면이 향함)와 동전을 5번 던지는 실험을 고려해 보십시오.우리가 여기서 고려하는 실험의 가능한 결과는 5개입니다.확률이 유의 분계점 0.05보다 낮으면 가정된 분포에 대해 결과가 가능성이 낮은 것으로 간주합니다.

단꼬리 검정을 암시하는 잠재적 귀무 가설은 "이 동전은 앞면에 치우치지 않는다"입니다.이 문맥에서 "꼬리"라는 단어는 두 가지 의미를 가집니다. 즉, 단일 토스의 결과 또는 확률 분포에서 극단값의 영역입니다.

실제로, 공정한 동전의 경우, 이 실험 결과의 확률은5 1/2 = 0.031이며, 동전이 꼬리 쪽으로 치우쳐 있으면 더 낮을 것이다.따라서 관측치는 귀무 가설을 유지할 수 있을 만큼 충분하지 않으며 검정에서 이를 반박합니다.이 동전은 표면적으로는 공정하지도 않고 뒷면에도 치우치지 않기 때문에 실험의 결론은 동전이 앞면에 치우친다는 것이다.

또는 두 개의 꼬리가 있는 검정을 암시하는 귀무 가설은 "이 동전은 공정하다"입니다.이 귀무 가설은 실험에서 꼬리가 너무 많거나 앞면이 너무 많은지 살펴봄으로써 조사할 수 있습니다.이 귀무 가설을 거부하는 경향이 있는 결과는 앞면이 많거나 뒷면이 많은 결과이며, 앞면이 5개 있는 실험은 이 부류에 속하는 것으로 보입니다.

그러나, 앞면이든 뒷면이든 상관없이 동일한 종류의 5번의 토스 확률은 단독으로 고려되는 5번의 토스 발생 확률의 두 배이다.따라서 이 두 개의 꼬리가 있는 귀무 가설에서 관측치는 0.063의 확률 값을 받습니다.따라서 단꼬리 검정에 동일한 유의 임계값(0.05)을 사용하면 동일한 결과가 통계적으로 유의하지 않습니다.따라서 이 경우 동전이 앞면에 치우친다는 단꼬리 귀무 가설의 결론을 뒷받침하지 않고 양꼬리 귀무 가설이 보존된다.

이 예는 통계 검정에서 도출된 결론이 귀무 가설과 대립 가설의 정확한 공식에 따라 달라질 수 있음을 보여줍니다.

논의

피셔는 귀무 가설은 정확해야 하며 모호함과 모호함이 없어야 한다. 왜냐하면 귀무 가설은 중요성의 테스트가 해결책인 '분포의 문제'의 기초를 제공해야 하기 때문이다라고 말해 [18]H에 대한 보다0 제한적인 영역을 암시했다.이 관점에 따르면 귀무 가설은 수치적으로 정확해야 합니다. 귀무 가설은 특정 수량 또는 차이가 특정 숫자와 동일하다는 것을 명시해야 합니다.고전 과학에서는 특정 처리의 효과가 없다는 것이 가장 일반적인 진술이며, 관측에서는 일반적으로 특정 측정된 변수의 값과 예측 변수의 값 사이에 차이가 없다는 것이 일반적이다.

대부분의 통계학자들은 방향을 귀무 가설의 일부 또는 귀무 가설/[19]대립 가설 쌍의 일부로 기술하는 것이 타당하다고 생각합니다.그러나, 결과는 실험의 모든 결과에 대한 완전한 설명은 아니며, 단지 하나의 특정 목적에 맞춘 단일 결과일 뿐이다.예를 들어, 새로운 치료제의 모집단 평균이 모집단 평균 = 10(오랜 경험에서 알 수 있음)인 잘 확립된 치료제의 개선이라고 주장하는 H0 고려하자. 단꼬리 대안은 새로운 치료제의 평균 > 10이다.x-bar를 통해 얻은 표본 증거가 -200이고 해당 t-검정 통계량이 -50인 경우, 검정의 결론은 새로운 치료법이 기존 치료법보다 더 낫다는 증거가 없다는 것입니다. 즉, 현저하게 더 나쁘다고 보고하지는 않지만 이 검정이 찾는 것은 아닙니다.귀무 가설의 테스트 결과를 보고할 때 발생할 수 있는 모호성을 극복하기 위해 테스트가 양면적인지 여부를 표시하고, 단면적인 경우 테스트하는 효과의 방향을 포함하는 것이 최선이다.

여기서 다루는 단순한 방향성 사례와 더 복잡한 사례를 다루는 데 필요한 통계 이론은 편향되지 않은 검정의 개념을 이용한다.

가설의 방향성이 항상 명확한 것은 아니다.피셔의 아가씨가 차를 맛본다는 명백한 귀무 가설은 아가씨가 그런 능력이 없다는 것이었고, 이는 대칭 확률 분포를 이끌어냈다.검정의 한쪽 끝 특성은 한쪽 끝 대립 가설(Fisher가 사용하지 않는 용어)에서 비롯되었습니다.귀무 가설은 암묵적으로 한쪽 꼬리가 되었다.부인의 한쪽 꼬리 주장의 논리적 부정도 한쪽 꼬리였다(청구: 능력 > 0; 스테이트드 늘: 능력 = 0; 암묵적 늘: 능력 0 0).

단일 꼬리 검정의 사용에 대한 순수한 주장은 다양한 검정에 의해 복잡해집니다.일부 검정(예2: § 적합도 검정)은 본질적으로 한 쪽입니다.일부 확률 분포는 비대칭입니다.3개 이상의 그룹에 대한 기존 검정은 양 꼬리입니다.

한 쪽 꼬리 가설의 사용에 관한 조언은 일관성이 없었고 [20]분야마다 받아들여지는 관행이 달랐다.한쪽 끝의 가설에 대한 가장 큰 반대는 그들의 잠재적인 주관성이다.유의하지 않은 결과는 (분석가의 변덕에 따라 공정한 동전 검정과 같이) 한쪽 꼬리를 가진 가설을 사용함으로써 유의한 결과로 변환될 수 있다.주장의 반대면: 일방적인 테스트는 실제 효과를 무시할 가능성이 적다.단꼬리 검정은 예측과 부호가 다른 데이터의 게시를 억제할 수 있습니다.객관성은 통계 테스트 개발자들의 목표였다.

기본적으로 한쪽 꼬리 가설을 사용하는 것이 일반적입니다.그러나 미리 확실한 방향을 정하지 않았다면 양면적인 대안을 사용하라.게다가, 일부 통계 이용자들은 우리가 항상 양면적인 [2][21]대안을 가지고 일해야 한다고 주장한다."

이 조언의 한 가지 대안은 세 가지 결과 테스트를 사용하는 것입니다.각 방향으로 한 번씩 두 번 테스트하고 결과를 결합하여 세 [22]가지 가능한 결과를 도출함으로써 가설의 방향성을 둘러싼 문제를 제거합니다.이 접근방식의 변형은 과거가 있으며,[23] 1950년 이후 10번 정도 제안되었다.

한쪽 끝의 시험에 대한 의견 차이는 과학 철학에서 비롯된다.피셔는 모든 차잔을 잘못 추측하는 것 같지 않은 경우를 기꺼이 무시했지만, 의학은 환자를 죽이는 제안된 치료법이 모든 면에서 중요하고 보고되고 아마도 설명되어야 한다고 믿는다.부실한 통계 보고 관행은 한쪽 꼬리 테스트에 대한 의견 불일치에 기여하였다.양 꼬리 검정에 의한 통계적 유의성은 관계의 부호에 민감하지 않습니다. 유의성 보고만으로는 불충분합니다."치료에 효과가 있다"는 것은 양 꼬리 테스트의 유익한 결과입니다."치료에 유익한 효과가 있다"는 것은 한쪽 꼬리 검사의 더 유용한 결과입니다."치료가 효과가 있어 평균 입원 기간을 1.5일 줄인다"는 것은 치료와 효과 사이의 관계에 대한 수치적 추정치와 양 꼬리 유의성 테스트 결과를 결합한 가장 유용한 보고서이다.수치 결과를 명시적으로 보고하면 한쪽 꼬리 테스트의 철학적인 이점이 없어집니다.근본적인 문제는 수치 예측 이론이 없는 적절한 형태의 실험 과학이다.수치 결과 모델은 단순한 유의성 모델(비제로 또는 알 수 없음)보다 더 유용한 효과 부호 모델(양수, 음수 또는 알 수 없음)보다 더 유용한 정보이다. 수치 이론 부호가 없을 경우 충분할 수 있다.

통계 테스트 이력

귀무 가설과 대립 가설의 역사는 통계 [24][25]검정의 역사에 포함되어 있다.

  • 1925년 이전:과거 수세기 동안 통계 검정의 일시적인 흔적이 종종 있는데, 이는 귀무 가설의 초기 예를 제공한다.19세기 후반에 통계적 유의성이 정의되었다.20세기 초에는 중요한 확률 분포가 정의되었다.Gossett과 Pearson은 유의성 검정의 특정 사례에 대해 연구했습니다.
  • 1925년: Fisher는 통계적 유의성 테스트를 정의하고 많은 실험 과학에 대한 주류 분석 방법으로 만든 연구 근로자를 위한 통계적 방법 초판을 발행했다.그 텍스트는 증거가 부족하고 설명이 부족했지만, 실제 사례로 가득 차 있었다.그것은 발표된 통계이론보다 훨씬 앞서 과학에 통계적 실천을 배치했다.
  • 1933년: Neyman & Pearson일련의 논문에서 통계 가설 테스트를 피셔의 테스트에 대한 제안된 개선 사항으로 정의했습니다.논문은 (H, H...를2 대안으로 하여)[5] 관측 데이터를 사용하여 테스트할 가설로서 대안 가설과0 H를 포함한 통계1 테스트에 대한 많은 용어를 제공했다.Neyman은 그의 방법에 대한 이후의 글에서 귀무 가설이라는 용어를 사용하지 않았다.
  • 1935년: 피셔는 귀무[26] 가설을 소개하고(정의가 아닌 예에 의해) 실험 결과의 해석의 맥락에서 유의성 검정의 근거를 신중하게 설명한 The Design of Experiments의 초판을 출판했다. 귀무 가설을 둘러싼 인용문을 참조한다.
  • 이하를 참조해 주세요.피셔와 네이만은 1962년 피셔가 사망할 때까지 서로 경쟁하는 공식의 상대적인 장점을 두고 다투었다.경력 변경과 2차 세계대전은 네이먼과 피어슨의 협력 관계를 종식시켰다.공식은 비교적 익명의 교과서 집필자, 실험자(저널 편집자) 및 수리 통계학자에 의해 [24]교장들의 의견 없이 통합되었다.오늘날 이 주제는 Neyman & Pearson의 용어 및 설명력과 Fisher가 제공한 과학적 철학과 계산을 결합한 것입니다.통계 테스트가 제대로 한 과목인지 두 과목인지에 대해서는 여전히 의견 [27]불일치의 원인이 되고 있다.2개의 샘플:한 텍스트는 주제를 가설 검정(지수에 유의성 검정을 언급하지 않음)이라고 하는 반면, 다른 텍스트는 유의성 검정(추론에 대한 절을 결정으로 함)이라고 말한다.Fisher는 연구자들이 그들의 증거를 평가할 수 있는 유연한 도구로서 유의성 테스트를 개발했다.대신 테스트는 제도화되었습니다.통계적 유의성은 많은 과학 저널에 실험 결과를 발표하기 위해 엄격하게 정의되고 시행되는 기준이 되었다.일부 분야에서는 유의성 테스트가 지배적이고 거의 배타적인 통계 분석 형태가 되었다.그 결과 테스트의 한계를 철저히 연구했다.책들은 유의성 검사에 대한 총체적인 비판들로 가득 차 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Helmenstine, Anne Marie. "What Is the Null Hypothesis? Definition and Examples". ThoughtCo. Retrieved 2019-12-10.
  2. ^ a b c d e Moore, David; McCabe, George (2003). Introduction to the Practice of Statistics (4 ed.). New York: W.H. Freeman and Co. p. 438. ISBN 9780716796572.
  3. ^ Weiss, Neil A. (1999). Introductory Statistics (5th ed.). p. 494. ISBN 9780201598773.
  4. ^ 를 클릭합니다Rossi, R. J. (2018), Mathematical Statistics, Wiley, p. 281.
  5. ^ a b Neyman, J; Pearson, E. S. (January 1, 1933). "On the Problem of the most Efficient Tests of Statistical Hypotheses". Philosophical Transactions of the Royal Society A. 231 (694–706): 289–337. Bibcode:1933RSPTA.231..289N. doi:10.1098/rsta.1933.0009.
  6. ^ Winkler, Robert L; Hays, William L (1975). Statistics : probability, inference, and decision. New York: Holt, Rinehart and Winston. p. 403. ISBN 978-0-03-014011-2.
  7. ^ Everitt, Brian (1998). The Cambridge Dictionary of Statistics. Cambridge and New York: Cambridge University Press. ISBN 978-0521593465.
  8. ^ a b c d Hayes, Adam. "Null Hypothesis Definition". Investopedia. Retrieved 2019-12-10.
  9. ^ Zhao, Guolong (2015-04-18). "A Test of Non Null Hypothesis for Linear Trends in Proportions". Communications in Statistics - Theory and Methods. 44 (8): 1621–1639. doi:10.1080/03610926.2013.776687. ISSN 0361-0926.
  10. ^ "OECD Glossary of Statistical Terms - Non-null hypothesis Definition". stats.oecd.org. Retrieved 2020-12-05.
  11. ^ 를 클릭합니다Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach (2nd ed.), Springer-Verlag, ISBN 978-0-387-95364-9.
  12. ^ Stockburger D.W. (2007), "Hypothesis and hesion testing", 측정 통계 백과사전(편집자: Salkind N.J.), Sage Publications.
  13. ^ "Understanding Null Hypothesis Testing – Research Methods in Psychology". opentextbc.ca. Retrieved 2019-12-10.
  14. ^ Cox, DR (1982). "Statistical Significance Tests". Br. J. Clin. Pharmacol. 14 (3): 325–331. doi:10.1111/j.1365-2125.1982.tb01987.x. PMC 1427620. PMID 6751362.
  15. ^ 연구종사자를 위한 통계적 방법(제11호):제4장: 적합도, 독립성 및 균질성 검정, § 표와2 함께. 적합도를 뒷받침하는 유의성 검정: 계산된 확률이 높으면 "[null] 가설이 검정되었다고 의심할 이유가 없습니다.[낮음]이면 [늘] 가설이 모든 사실을 설명하지 못한다는 것을 강하게 시사합니다."
  16. ^ Cox, D. R. (2006). Principles of Statistical Inference. Cambridge University Press. p. 197. ISBN 978-0-521-68567-2.
  17. ^ Jones, B; P Jarvis; J A Lewis; A F Ebbutt (6 July 1996). "Trials to assess equivalence: the importance of rigorous methods". BMJ. 313 (7048): 36–39. doi:10.1136/bmj.313.7048.36. PMC 2351444. PMID 8664772. 기본 위치(귀무 가설)는 처리가 동일하지 않다는 것이 좋습니다.결론은 유의성보다는 신뢰 구간에 근거해 이루어져야 한다.
  18. ^ Fisher, R. A. (1966). The Design of Experiments (8th ed.). Edinburgh: Hafner.
  19. ^ 예를 들어 귀무 가설 참조
  20. ^ Lombardi, Celia M.; Hurlbert, Stuart H. (2009). "Misprescription and misuse of one-tailed tests". Austral Ecology. 34: 447–468. doi:10.1111/j.1442-9993.2009.01946.x. 생물학에서 한쪽 꼬리 검사의 장점과 역사적 용도를 상세히 논한다.
  21. ^ Bland, J Martin; Altman, Douglas G (23 July 1994). "One and two sided tests of significance". BMJ. 309 (6949): 248. doi:10.1136/bmj.309.6949.248. PMC 2540725. PMID 8069143. 의료 통계에 관하여: "일반적으로 한쪽 방향의 차이가 크면 전혀 차이가 없는 것과 같은 작용으로 이어질 때 일방검사가 적절하다.특정 방향의 차이에 대한 기대는 충분한 정당성이 없다. "양면 테스트는 특별한 이유가 없는 한 사용해야 한다.단측면 시험을 사용하는 경우 시험 방향을 미리 명시해야 한다.일방 테스트는 단순히 기존의 유의하지 않은 차이를 유의하게 만드는 장치로 사용해서는 안 됩니다."
  22. ^ Jones, Lyle V.; Tukey, John W. (2000). "A Sensible Formulation of the Significance Test". Psychological Methods. 5 (4): 411–414. doi:10.1037/1082-989X.5.4.411. PMID 11194204. S2CID 14553341. 테스트 결과에는 유의한 긍정적 효과, 유의한 부정적 효과 또는 알려지지 않은 징후가 미치는 미미한 효과라는 서명이 있습니다.이것은 양 꼬리 테스트의 결론보다 더 미묘한 결론이다.단점 없이 한쪽 꼬리만 테스트하는 장점이 있습니다.
  23. ^ Hurlbert, S. H.; Lombardi, C. M. (2009). "Final collapse of the Neyman-Pearson decision theoretic framework and rise of the neoFisherian". Ann. Zool. Fennici. 46 (5): 311–349. doi:10.5735/086.046.0501. ISSN 1797-2450.
  24. ^ a b Gigerenzer, Gerd; Zeno Swijtink; Theodore Porter; Lorraine Daston; John Beatty; Lorenz Kruger (1989). "Part 3: The Inference Experts". The Empire of Chance: How Probability Changed Science and Everyday Life. Cambridge University Press. pp. 70–122. ISBN 978-0-521-39838-1.
  25. ^ Lehmann, E. L. (2011). Fisher, Neyman, and the creation of classical statistics. New York: Springer. ISBN 978-1441994998.
  26. ^ Aldrich, John. "Earliest Known Uses of Some of the Words of Probability & Statistics". Retrieved 30 June 2014. 최종 갱신 2003년 3월 12일제프 밀러로부터.
  27. ^ Lehmann, E. L. (December 1993). "The Fisher, Neyman-Pearson Theories of Testing Hypotheses: One Theory or Two?". Journal of the American Statistical Association. 88 (424): 1242–1249. doi:10.1080/01621459.1993.10476404.

추가 정보

  • Adèr, H. J.; Mellenbergh, G. J. & Hand, D. J. (2007). Advising on research methods: A consultant's companion. Huizen, The Netherlands: Johannes van Kessel Publishing. ISBN 978-90-79418-01-5.
  • Efron, B. (2004). "Large-Scale Simultaneous Hypothesis Testing". Journal of the American Statistical Association. 99 (465): 96–104. doi:10.1198/016214504000000089. 이 문서에서 유의성 테스트의 적용은 특이하다.귀무 가설을 찾기 위한 테스트?중요한 걸 보여주려는 게 아니라 흥미로운 사례를 찾으려는 건가요?
  • 라이스, 윌리엄 R.;게인즈, 스티븐 디(1994년 6월)."내가 이기고 'Heads, 당신을 잃다:진화 생태학적 연구에 방향 대안 hypotheses을 테스트하는 거야".TREE.9(6):235–237. doi:10.1016(94)90258-5.PMID 21236837.Directed 테스트로 이루어져 있다."...유도 시험이 일방적인 시험 이전에 사용했던 거의 모든 용도에 데이터가 어디만 H0에서, 한 방향으로 날수 있는지 그 사건을 제외하고 사용해야 한다."과two-tailed 단 측 검정의 특성을 결합한다.

외부 링크