조화 평균 p-값
Harmonic mean p-value조화 평균 p-값[1][2][3](HMP)은 강한 감각의 가족-현상 오류율을[2] 제어하는 다중 비교 문제를 해결하기 위한 통계 기법이다(이 주장은 논쟁의 여지가[4] 있다).조합된 시험, 즉 피셔의 방법처럼 p-값 그룹이 통계적으로 유의한지 시험함으로써 본페로니 교정의 힘을 향상시킨다.[5]그러나 p-값이 피셔의 방법과는 달리 독립적이라는 제한적 가정을 회피한다.[2][3]따라서, 시험은 종속적일 때, 시험이 독립적일 때 더 적은 전력(즉, 더 높은 잘못된 음수 비율)의 비용으로 거짓 양성률을 제어한다.[2]엄격한 가족별 오류율을 제어하는 본페로니 수정과 같은 접근방법에 대한 대안을 제공하는 것 외에도, 그것은 덜 끈적이는 허위 발견률을 통제하기 위해 널리 사용되는 벤자민i-호흐베르크 절차(BH)에 대한 대안을 제공한다.[6]유의미한 가설 집단을 검출하는 HMP의 힘이 BH의 유의한 개별 가설을 검출하는 힘보다 크기 때문이다.[2]
기법에는 두 가지 버전이 있다: (i) 대략적인 p-값으로 HMP를 직접 해석하는 방법과 (ii) HMP를 점증적으로 정확한 p-값으로 변환하는 절차.이 접근방식은 통계적으로 유의한 p-값의 가장 작은 그룹을 구할 수 있는 다단계 시험 절차를 제공한다.
조화 평균 p-값의 직접 해석
p-값 ,…, p 의 가중 고조파 평균은 다음과 같이 정의된다.
일반적으로 HMP를 p-값으로 직접 해석하는 것은 반보수적인 것으로, 이는 거짓 양성률이 예상보다 높다는 것을 의미한다.그러나 HMP가 작아질수록 특정 가정에서는 불일치가 감소하므로 유의성의 직접적인 해석은 충분히 작은 값에 대해 내포된 값에 가까운 잘못된 양의 비율을 달성한다(예: 0 [2]
HMP는 작은 에 e e 이상의 반보수가 결코 아니며[3] L 에 로그 L보다 크지만, 이러한 한계는 실제로 보수적일 가능성이 높은 임의의 의존 하에 최악의 시나리오를 나타낸다.이러한 한계를 적용하기보다는 HMP를 변형하여 점증적으로 정확한 p-값을 산출할 수 있다.
점근법적으로 정확한 고조파 평균 p-값 절차
일반화된 중앙 한계 정리에서는 증상 정확한 p-값인 p 을를) HMP, p 에서 계산될[2] 수 있음을 보여준다
p.hmp지휘권harmonicmeanp R 패키지; 온라인에서 튜토리얼을 이용할 수 있다. 동등하게 HMP를 임계값 표와 비교할 수 있다(표 1).표는 거짓 양성률이 작을수록, 시험 횟수가 적을수록 임계값이 거짓 양성률에 가깝다는 것을 보여준다.
| 10 | 0.040 | 0.0094 | 0.00099 |
| 100 | 0.036 | 0.0092 | 0.00099 |
| 1,000 | 0.034 | 0.0090 | 0.00099 |
| 10,000 | 0.031 | 0.0088 | 0.00098 |
| 100,000 | 0.029 | 0.0086 | 0.00098 |
| 1,000,000 | 0.027 | 0.0084 | 0.00098 |
| 10,000,000 | 0.026 | 0.0083 | 0.00098 |
| 100,000,000 | 0.024 | 0.0081 | 0.00098 |
| 1,000,000,000 | 0.023 | 0.0080 | 0.00097 |
다단계 테스트 절차를 통한 다중 테스트
p-값 그룹에 대해 HMP가 어느 정도 수준 에서 유의한 경우, 가장 작은 유의 그룹에 대해 p-값의 모든 하위 집합을 검색하는 동시에 강력한 가족-현상 오류율을 유지할 수 있다.[2]공식적으로, 이것은 폐쇄 시험 절차를 구성한다.[7]
이(가) 작을 경우(예:< 0. 05 HMP의 직접 해석에 기초한 다음의 다단계 테스트는 약 수준에서 강-센스 계열 오류율을 제어한다.
- L p-값의 하위 집합 에 대한 HMP 정의
- Reject the null hypothesis that none of the p-values in subset are significant if , where . (정의상 = 1 = 1} .)
위의 버전이 무증상적으로 한 버전은 2단계에서 R 을(를) 로 대체한다.
HMP의 직접 해석이 더 빠르기 때문에, 직접 해석을 사용하여 유의할 가능성이 있는 p-값의 하위 집합을 식별하기 위해 2-통과 절차를 사용할 수 있으며, 점근법적으로 정확한 공식을 사용하여 확인할 수 있다.
HMP의 속성
HMP는 일반화된 중심 한계 정리로부터 발생하는 다양한 속성을 가지고 있다.[2]바로 다음과 같다.
- p-값 간의 강력한 의존성 및 긍정적 의존성.
- 정확한 검사 횟수에 둔감함, L.
- 중량 분포에 강인함, w.
- 대부분은 가장 작은 p-값의 영향을 받는다.
HMP가 유의하지 않으면 구성성 시험의 하위 집합도 유의하지 않다.반대로, 다단계 시험에서 p-값의 하위 집합이 유의하다고 간주되는 경우, 결합된 모든 p-값의 HMP는 유의할 가능성이 높다. 이는 HMP를 직접 해석할 때 확실하다.개별 p-값의 유의성을 평가하는 것이 목적이므로 p-값 그룹에 관한 결합 시험이 관심없도록 HMP는 Bonferroni 절차와 동일하지만 보다 엄격한 유의 인 α L {\표 1)에 따른다.
HMP는 개별 p-값이 귀무 가설이 참일 때 표준 균일 분포를 갖는다고 가정한다.그러므로 많은 수의 저전력 시험은 HMP의 힘을 해칠 수 있다.
귀무 가설에서 HMP의 유효성에 있어 가중치의 선택은 중요하지 않지만, 가중치는 절차의 힘에 영향을 미친다.의 보충 방법 §5C 및 온라인 자습서에서는 이 문제를 더 자세히 고려한다.
HMP에 대한 베이지안 해석
HMP는 베이지안 모델 평균과 유추하여 구상되었으며 우도비 시험에서 p-값을 결합할 때 모델 평균 베이즈 인자에 반비례하는 것으로 해석할 수 있다.[1][2]
조화 평균 음의 규칙
I. J. Good는 Bayes 인자와 우도비 검정의 p-값 사이의 경험적 관계를 보고했다.[1]귀무 가설 의 경우, 보다 일반적인 대립 가설 H , 에 내포되어 있는 경우가 많았다.
bayesian calibration of p-values
만약 이 대안 가설 아래 p-values의 분포 변수와 베타 분포를 따르{\displaystyle \left(0<, \xi_{나는}<>1,1\right)}, 한 형태 Sellke, Bayarri과 Berger,[14] 다음model-averaged 베이스 요인과 외부 장착 기총용 포들 수 있는 사이의 역 비례에 의해 간주되어(0<>ξ 나는 <, 1,1). as[2][15]규격화된
- 은(는) i = {\ 과(와) 같은 대립 가설 {\ i의 이전 확률이다.
- /( 1+ i) 는 대립 i, i에서 i 의 예상 값이다.
- = / w_{bar {\xi 은(는) p-값 , i에 귀속되는 가중치 입니다.
- =( i /( 1 -- ) }\/(은(으) 이전의 모델 확률과 힘을 가중치에 통합하고,
- 은(는) 체중을 정상화한다.
근사치는 전력 공급이 잘 되는 시험( _에 가장 적합하다.
Bayes 요인에 대한 경계로서의 조화 평균 p-값
정확히 자유도가 2도인 우도비 시험의 경우, Wilks의 정리는 p = / i 여기서 는 대립 i, 에 유리한 최대우도비, 즉 implies= 1/ 의 을 의미한다., where is the weighted mean maximized likelihood ratio, using weights Since is an upper bound on the Bayes factor, , t암탉 / 은(는) 모델 평균 베이즈 인자의 상한 값이다.
가설은 대안 가설 아래 p-values의 분포 변수와 베타 분포를 따르다 하에서,{\displaystyle \left(1,\kappa_{나는}>1\right),}이 무게 w(1, 나입니다.;1κ)나는 나는,(_{나는},}은 외부 장착 기총용 포드에 더욱 강력한 위는 지금에게 덤벼들다를 제공한다 μ원del-av지워진 베이즈 인자:
참조
- ^ a b c Good, I J (1958). "Significance tests in parallel and in series". Journal of the American Statistical Association. 53 (284): 799–813. doi:10.1080/01621459.1958.10501480. JSTOR 2281953.
- ^ a b c d e f g h i j k l m n Wilson, D J (2019). "The harmonic mean p-value for combining dependent tests". Proceedings of the National Academy of Sciences USA. 116 (4): 1195–1200. doi:10.1073/pnas.1814092116. PMC 6347718. PMID 30610179.
- ^ a b c Vovk, Vladimir; Wang, Ruodu (April 25, 2019). "Combining p-values via averaging" (PDF). Algorithmic Learning in a Random World.
- ^ Goeman, Jelle J.; Rosenblatt, Jonathan D.; Nichols, Thomas E. (2019-11-19). "The harmonic mean p-value: Strong versus weak control, and the assumption of independence". Proceedings of the National Academy of Sciences. 116 (47): 23382–23383. doi:10.1073/pnas.1909339116. ISSN 0027-8424. PMID 31662466.
- ^ Fisher, R A (1934). Statistical Methods for Research Workers (5th ed.). Edinburgh, UK: Oliver and Boyd.
- ^ Benjamini Y, Hochberg Y (1995). "Controlling the false discovery rate: A practical and powerful approach to multiple testing". Journal of the Royal Statistical Society. Series B (Methodological). 57 (1): 289–300. doi:10.1111/j.2517-6161.1995.tb02031.x. JSTOR 2346101.
- ^ Marcus R, Eric P, Gabriel KR (1976). "On closed testing procedures with special reference to ordered analysis of variance". Biometrika. 63 (3): 655–660. doi:10.1093/biomet/63.3.655. JSTOR 2335748.
- ^ Wilson, Daniel J (August 17, 2019). "Updated correction to "The harmonic mean p-value for combining independent tests"" (PDF).
- ^ Good, I J (1984). "C192. One tail versus two-tails, and the harmonic-mean rule of thumb". Journal of Statistical Computation and Simulation. 19 (2): 174–176. doi:10.1080/00949658408810727.
- ^ Good, I J (1984). "C193. Paired versus unpaired comparisons and the harmonic-mean rule of thumb". Journal of Statistical Computation and Simulation. 19 (2): 176–177. doi:10.1080/00949658408810728.
- ^ Good, I J (1984). "C213. A sharpening of the harmonic-mean rule of thumb for combining tests "in parallel"". Journal of Statistical Computation and Simulation. 20 (2): 173–176. doi:10.1080/00949658408810770.
- ^ Good, I J (1984). "C214. The harmonic-mean rule of thumb: Some classes of applications". Journal of Statistical Computation and Simulation. 20 (2): 176–179. doi:10.1080/00949658408810771.
- ^ Good, Irving John. (2009). Good thinking : the foundations of probability and its applications. Dover Publications. ISBN 9780486474380. OCLC 319491702.
- ^ Sellke, Thomas; Bayarri, M. J; Berger, James O (2001). "Calibration of p Values for Testing Precise Null Hypotheses". The American Statistician. 55 (1): 62–71. doi:10.1198/000313001300339950. ISSN 0003-1305.
- ^ Wilson, D J (2019). "Reply to Held: When is a harmonic mean p-value a Bayes factor?" (PDF). Proceedings of the National Academy of Sciences USA. 116 (13): 5857–5858. doi:10.1073/pnas.1902157116. PMC 6442550. PMID 30890643.
- ^ Held, L (2019). "On the Bayesian interpretation of the harmonic mean p-value". Proceedings of the National Academy of Sciences USA. 116 (13): 5855–5856. doi:10.1073/pnas.1900671116. PMC 6442579. PMID 30890644.
