스피어맨-브라운 예측 공식

Spearman–Brown prediction formula

스피어맨-브라운 예언 공식으로도 알려진 스피어맨-브라운 예측 공식은 시험 길이에 대한 심리학적 신뢰도와 관련된 공식으로, 시험 길이를 변경한 후 시험의 신뢰성을 예측하기 위해 심리학자들이 사용한다.[1] 이 방법은 스피어맨(1910)과 브라운(1910)이 독자적으로 출판했다.[2][3]

계산

예측 신뢰성, , { 는 다음과 같이 추정한다.

여기서 n은 조합된 "tests"의 수(아래 참조)와 x {\은 현재 "테스트"의 신뢰성이다. 이 공식은 현재 시험을 n번 복제(또는 동등하게, 현재 시험의 n개의 평행한 형태로 시험을 생성)하여 구성된 새 시험의 신뢰도를 예측한다. 따라서 n = 2는 현재 시험과 동일한 속성을 가진 항목을 추가하여 시험 길이를 두 배로 늘린다는 것을 의미한다. 1보다 작은 값은 시험의 단축 효과를 예측하는 데 사용될 수 있다.

예측 테스트 길이

또한 공식을 다시 배열하여 어느 정도의 신뢰도를 달성하는 데 필요한 복제 수를 예측할 수 있다.

분할반 신뢰도

타우 등가 신뢰성이 개발되기 전까지는 스피어맨-브라운 공식을 이용한 분할 반 신뢰성이 항목간 신뢰도를 얻을 수 있는 유일한 방법이었다.[4] 전체 품목을 임의로 반반으로 나눈 후, 스피어맨-브라운 공식을 적용하여 분할-할프 사이의 상관관계를 신뢰도로 변환할 수 있다. 그것은

,여기서 분할-할브 사이의 Pearson 상관 관계다. spearman-Brown 공식은 tau 등가 신뢰도 개발 후 신뢰도 계수로 거의 사용되지 않지만, 이 방법은 여전히 2항목 척도에 유용하다.[5]

다른 분할 반 신뢰도 계수와의 관계

분할 반 평행 신뢰도

조모(2016년)[6]씨는 신뢰성 계수가 역사적으로 부정확하고 비정보적인 명칭으로 체계적이지 못하고 일관되지 않은 방식으로 표현돼 왔다고 비판하며 체계적인 명명법과 공식 표현을 사용할 것을 제안한다. 스피어맨-브라운 공식의 가정은 분할-할브가 평행하다는 것이며, 이는 분할-할프의 분산이 동일하다는 것을 의미한다. 스피어맨-브라운 공식에 제안된 체계적 명칭은 반 평행 신뢰도다. 또한 다음과 같은 체계적인 공식이 제안되었다.

스플릿 하프 타우 등가 신뢰성

분할 반 타우 등가 신뢰성은 분할 할브의 분산이 같지 않을 때 사용할 수 있는 신뢰도 계수다. Flanagan-Rulon[7](ρ FR1{\displaystyle{\rho}_{FR1}},ρ FR2{\displaystyle{\rho}_{FR2}}), 이반은(λ 4{\displaystyle{\lambda_{4}}})[8]은 다음 공식 표현:ρ FR1=을 제안했다 4ρ 12σ 1σ 2σ 12+σ 22+2ρ 12σ 12. σ, , and - 1 + 2 2) {\

Where , , , and is the variance of the first split-half, the second half, the sum of the two split-halves, and the difference of the two split-halves, respective리의

이 공식들은 모두 대수학적으로 동등하다. 체계적 공식은 다음과 같다.

2

스플릿-반쪽 착향성 신뢰성

분할 반 평행 신뢰성과 분할 반 타우 등가 신뢰성은 분할 할브의 길이가 같다고 가정한다. 절반의 착향성 신뢰성은 이러한 가정을 완화시킨다. 그러나 주어진 정보 조각보다 추정이 필요한 매개변수가 더 많기 때문에 다른 가정이 필요하다. 라주(1970)[10]는 각 분할 반의 상대적인 길이를 알 때 분할 반의 성격적 신뢰도 계수를 조사했다. 안고프(1953)[11]와 펠트(1975)는 [12]각 분할 반의 길이가 분산과 공분산 합계에 비례한다고 가정하여 분할 반의 성격적 신뢰도를 발표했다.[13]

역사

스피어맨-브라운이라는 이름은 파트너십을 의미하는 것 같지만 두 작가는 경쟁적이었다. 이 공식은 브라운(1910)과 스피어맨(1910)이 영국 심리학 저널에 동시에 발표한 두 논문에서 유래한다. 찰스 스피어맨 킹스칼리지 런던에서 함께 일했던 칼 피어슨과 적대적인 관계를 맺었고, 그들은 서로를 비난하고 조롱하는 서류를 주고받았다.[14] 윌리엄 브라운은 피어슨의 지도 아래 박사학위를 받았다. 브라운 박사학위 논문의 중요한 부분은 스피어맨의 작품을 비판하는 데 바쳐졌다.[16] 스피어맨은 브라운보다 더 권위 있는 학자이기 때문에 브라운보다 이 공식에서 먼저 등장한다.[17] 예를 들어 스피어맨은 제1차 신뢰이론을[18] 정립해 '고전적 신뢰이론의 아버지'[19]로 불린다. 매튜 이펙트스티글러의 에포니미 법칙의 예다.

이 공식은 다음과 같은 이유로 브라운 스피어맨 공식으로 언급해야 한다.[20] 첫째, 오늘날 우리가 사용하는 공식은 스피어맨(1910) 버전이 아니라 브라운(1910)이다. 브라운(1910)은 이 공식을 반분 신뢰도 계수로 명시적으로 제시했지만 스피어맨(1910)은 그렇지 않았다. 둘째, 브라운(1910)의 형식적 유래는 스피어맨(1910)보다 간결하고 우아하다.[21] 셋째, 브라운(1910)이 스피어맨(1910)보다 먼저 쓰여졌을 가능성이 높다. 브라운(1910년)은 출간 당시 이미 구할 수 있었던 박사학위 논문을 바탕으로 하고 있다. 스피어맨(1910년)은 브라운(1910년)을 비판했지만 브라운(1910년)은 스피어맨(1904년)만 비판했다. 넷째, 저자들을 알파벳 순으로 나열하는 것이 APA 스타일이다.

사용 및 관련 항목

이 공식은 일반적으로 시험 길이를 변경한 후 시험의 신뢰성을 예측하기 위해 심리측정학자들이 사용한다. 이 관계는 신뢰도 추정의 분할 및 관련 방법(이 방법을 "스텝 업" 공식이라고도 한다)[22]에 특히 중요하다.

이 공식은 또한 시험 신뢰도와 시험 길이 사이의 비선형 관계를 이해하는 데 도움이 된다. 시험 길이는 원하는 신뢰성이 1.0에 가까워질수록 점점 더 큰 값으로 커져야 한다.

더 긴/더 짧은 테스트가 현재 테스트와 평행하지 않으면 예측이 엄격히 정확하지 않을 것이다. 예를 들어, 신뢰성이 높은 시험이 불량품들을 많이 추가하여 길어진 경우, 달성된 신뢰성은 아마도 이 공식에 의해 예측된 신뢰도보다 훨씬 낮을 것이다.

2항목 시험의 신뢰성에 대해서는 크론바흐의 알파보다 공식이 더 적합하다(이러한 방법으로, 스피어맨-브라운 공식을 "표준화된 크론바흐의 알파"라고도 하는데, 이는 평균 항목 공분산 및 단위 항목 분산을 사용하여 계산한 크론바흐의 알파와 같기 때문이다. 항목 분산.[23]

인용구

  1. ^ Allen, M.; Yen W. (1979). Introduction to Measurement Theory. Monterey, CA: Brooks/Cole. ISBN 0-8185-0283-5.
  2. ^ 스탠리, J. (1971) 신뢰성. R. L. Thorndike (Ed.)에서 Educational Measurement. 제2판. 워싱턴 DC: 미국 교육 위원회
  3. ^ 와이너, H, & Thissen, D. (2001) 참 점수 이론: 전통적인 방법. H. 와이너와 D.에서. Thissen, (Eds.), 테스트 스코어링. 마화, NJ:로렌스 엘바움
  4. ^ 켈리, T. L. (1924년) 테스트의 신뢰성에 대한 참고사항: 크럼 박사의 비판에 대한 답변. 교육심리학 저널, 15, 193–204. doi: 10.1037 / h0072471.
    Kuder, G. F. & Richardson, M. W. (1937) 시험 신뢰도 추정 이론. 사이코메트리카, 2, 151-160. 도이: 10.1007 / BF02288391.
  5. ^ 아이징가, R.; 테 그로텐후이스, M.; 펠저, B. (2013) "Pearson, Cronbach 또는 Spearman-Brown의 2항목 척도의 신뢰성?" 국제 공중 보건 저널 58 (4): 637-642. 도이: 10.1007 / s00038-012-0416-3
  6. ^ 조 E. (2016년) 신뢰성 확보: 신뢰성 계수에 대한 체계적인 접근법. 조직 연구 방법, 19, 651-682. doi:10.1177/1094428116656239.
  7. ^ 플래너건, J. C. (1937). 객관적 시험의 효율성을 높이기 위한 제안 절차. 교육심리학 저널 28, 17-21. 도이: 10.1037 / h0057430. 룰론, P. J. (1939년). 분할 할인에 의한 검정의 신뢰도를 결정하기 위한 간단한 절차. 하버드 교육 리뷰 9, 99-103
  8. ^ 거트만, L. (1945년) 시험검사 신뢰도를 분석하기 위한 기초. 사이코메트리카, 10, 255-282. 도이: 10.1007 / BF02288892.
  9. ^ 조 E. (2016년) 신뢰성 확보: 신뢰성 계수에 대한 체계적인 접근법. 조직 연구 방법, 19, 651-682. doi:10.1177/1094428116656239.
  10. ^ N. S. 라주(1970). 부적합한 길이의 부품에서 총 시험 신뢰도를 추정하기 위한 새로운 공식. 제78회 APA 연차협약 절차, 5, 143-144.
  11. ^ 앤고프, W. H. (1953) 시험 신뢰도 및 유효 시험 길이 사이코메트리카 18(1), 1-14
  12. ^ Feldt, L. S. (1975) 길이가 같지 않은 두 부분으로 나뉜 시험의 신뢰도 추정. 사이코메트리카, 40(4), 557-561
  13. ^ 조 E. (2016년) 신뢰성 확보: 신뢰성 계수에 대한 체계적인 접근법. 조직 연구 방법, 19, 651-682. doi:10.1177/1094428116656239.
  14. ^ Cowles, M. (2005) 심리학 통계: 역사적 관점. 뉴욕: 심리학 출판사.
  15. ^ 나중에 책 브라운 W. (1911년)로 출판되었다. 정신 측정의 필수 요소. 런던: 케임브리지 대학 출판부.
  16. ^ 스피어맨, C. (1904) 두 가지 사이의 연관성에 대한 증명과 측정. 미국 심리학 저널 15, 72-101
  17. ^ 조, E.&천, S.(2018). 고장난 시계 수리: Cronbach의 알파를 포함한 원점 신뢰도 계수에 대한 과거 검토. 서베이 리서치, 19(2), 23-54.
  18. ^ 스피어맨, C. (1904) 두 가지 사이의 연관성에 대한 증명과 측정. 미국 심리학 저널 15, 72-101
  19. ^ 크론바흐, L. J., 라자라트남, G. C. (1963년) 일반화 이론: 신뢰성 이론의 자유화. 영국 통계심리학회지, 16, 137-163. doi: 10.111 / j.2044-8317.1963.tb00206.x.
  20. ^ 조, E.&천, S.(2018). 고장난 시계 수리: Cronbach의 알파를 포함한 원점 신뢰도 계수에 대한 과거 검토. 서베이 리서치, 19(2), 23-54.
  21. ^ 트라우브, R. E. (1997) 역사적 관점에서 고전적인 시험 이론. 교육적 측정: 문제 및 관행, 16, 8-14. doi: 10.111 / j.1745-3992.1997.tb00603.x.
  22. ^ 스탠리, J. (1971) 신뢰성. R. L. Thorndike (Ed.)에서 Educational Measurement. 제2판. 워싱턴 DC: 미국 교육 위원회
  23. ^ Eisinga, R.; Te Grotenhuis, M.; Pelzer, B. (2013). "The reliability of a two-item scale: Pearson, Cronbach or Spearman-Brown?". International Journal of Public Health. 58 (4): 637–642. doi:10.1007/s00038-012-0416-3. hdl:2066/116735. PMID 23089674.

참조

  • 스피어맨, 찰스, C.(1910). 결함 있는 데이터에서 계산된 상관 관계. 영국 심리학 저널 3, 271–295.
  • 브라운, W. (1910) 어떤 실험은 정신적 능력의 상관관계를 초래한다. 영국 심리학 저널 3,296–322.