통계적 결론 타당성

통계적 결론 타당성(statistical expresence validation)은 데이터에 근거한 변수들 간의 관계에 대한 결론이 정확하거나 "합리적"인 정도를 말한다.이것은 단지 변수의 관계에 대한 통계적 결론이 올바른지에 대한 것으로 시작되었지만, 이제는 양적, 통계적, 질적 데이터 등 사용하는 "합리적" 결론으로 이동하려는 움직임이 있다.^[1]기본적으로 두 가지 유형의 오류가 발생할 수 있다: I 유형(존재할 때 차이 또는 상관 관계 찾기)과 II 유형(존재할 때 차이 또는 상관 관계 찾기).통계적 결론 타당성은 이러한 유형의 오류를 더 가능성이 높은 연구 품질과 관련이 있다.통계적 결론 타당성에는 적절한 표본 추출 절차, 적절한 통계 시험 및 신뢰할 수 있는 측정 절차의 사용을 보장하는 것이 포함된다.^[2]^[3]^[4]

일반 위협

통계적 결론 유효성에 대한 가장 일반적인 위협은 다음과 같다.

낮은 통계적 힘

검정력은 귀무 가설이 거짓일 때(타입 II 오류율의 반대) 귀무 가설을 올바르게 기각할 확률이다.저력을 가진 실험은 귀무 가설을 잘못 받아들일 확률이 더 높다. 즉, 유형 II 오류를 범하고 실제 있을 때 효과가 없다고 결론짓는다(즉, 원인과 결과 사이에 실제 공분리가 있다).저전력은 다른 요인(작은 효과 크기, 큰 그룹 변동성, 신뢰할 수 없는 측정 등)을 고려할 때 연구의 표본 크기가 너무 작을 때 발생한다.

테스트 통계량의 위반 가정

대부분의 통계적 검정(특히 추정 통계)은 가설을 검정하는 데 적합한 분석을 만드는 데이터에 대한 가정을 포함한다.통계적 시험의 가정을 위반하면 원인-효과 관계에 대한 잘못된 추론을 초래할 수 있다.시험의 강건성은 그것이 위반에 얼마나 민감한지를 나타낸다.가정 위반은 시험을 통해 유형 I 또는 II 오류를 발생시킬 가능성이 높거나 낮을 수 있다.

준설 및 오류율 문제

각 가설 검정에는 유형 I 오류(알파율)의 설정된 위험이 포함된다.만약 연구자가 그들의 데이터를 검색하거나, 유의미한 효과를 찾기 위해 여러 가지 다른 가설들을 시험하면서, 그들의 타입 I 오류율을 부풀리고 있다.연구원이 반복적으로 데이터를 검사할수록 1종 오류를 관찰하고 관계의 존재에 대해 부정확한 추론을 할 가능성이 높아진다.

조치의 신뢰성 없음

종속변수 및/또는 독립변수를 신뢰성 있게 측정하지 않을 경우(즉, 측정오차가 큰 경우), 잘못된 결론을 도출할 수 있다.

범위 제한

바닥과 천장 효과 또는 선택 효과와 같은 범위를 제한하면 실험의 힘이 감소하고, 타입 II 오류의 확률이 증가한다.^[5]이는 상관관계가 변동성 감소에 의해 감쇠(약화)되기 때문이다(예: 추정에서 점수 분산을 사용하는 Pearson 제품-순간 상관 계수에 대한 방정식 참조).

연구 대상 단위의 이질성

연구에 참여하는 개인의 이질성이 더 크면 결과의 분산을 증가시키거나 참된 관계를 모호하게 함으로써 결과의 해석에도 영향을 미칠 수 있다(표본 오차 참조).이것은 단위의 특성과 인과관계 사이의 가능한 상호작용을 모호하게 한다.

내부 유효성에 대한 위협

연구 연구의 내부 타당성에 영향을 미칠 수 있는 영향은 결과를 편향시키고 도달한 통계적 결론의 타당성에 영향을 미칠 수 있다.내부 타당성에 대한 이러한 위협에는 치료 구현의 신뢰성이 없거나(표준화 결여) 관련 변수에 대한 통제 실패가 포함된다.

참고 항목

참조

^ Cozby, Paul C. (2009). Methods in behavioral research (10th ed.). Boston: McGraw-Hill Higher Education.
^ Cohen, R. J.; Swerdlik, M. E. (2004). Psychological testing and assessment (6th edition). Sydney: McGraw-Hill.
^ Cook, T. D.; Campbell, D. T.; Day, A. (1979). Quasi-experimentation: Design & analysis issues for field settings. Houghton Mifflin.
^ Shadish, W.; Cook, T. D.; Campbell, D. T. (2006). Experimental and quasi-experimental designs for generalized causal inference. Houghton Mifflin.
^ Sackett, P.R.; Lievens, F.; Berry, C.M.; Landers, R.N. (2007). "A Cautionary Note on the Effects of Range Restriction on Predictor Intercorrelations" (PDF). Journal of Applied Psychology. 92 (2): 538–544. doi:10.1037/0021-9010.92.2.538. PMID 17371098.

[Cozby-1] Cozby, Paul C. (2009). Methods in behavioral research (10th ed.). Boston: McGraw-Hill Higher Education.

[Cohen-2] Cohen, R. J.; Swerdlik, M. E. (2004). Psychological testing and assessment (6th edition). Sydney: McGraw-Hill.

[Cook-3] Cook, T. D.; Campbell, D. T.; Day, A. (1979). Quasi-experimentation: Design & analysis issues for field settings. Houghton Mifflin.

[Shadish-4] Shadish, W.; Cook, T. D.; Campbell, D. T. (2006). Experimental and quasi-experimental designs for generalized causal inference. Houghton Mifflin.

[Sackett-5] Sackett, P.R.; Lievens, F.; Berry, C.M.; Landers, R.N. (2007). "A Cautionary Note on the Effects of Range Restriction on Predictor Intercorrelations" (PDF). Journal of Applied Psychology. 92 (2): 538–544. doi:10.1037/0021-9010.92.2.538. PMID 17371098.

[1]

[2]

[3]

[4]

[5]

Search