무작위 실험

Randomized experiment
CONSORT 2010[1] Statement에서 수정된 두 그룹의 병렬 무작위 시험 4단계(등록, 개입 할당, 후속 조치 및 데이터 분석) 흐름도

과학에서 랜덤화 실험은 치료 효과에 대한 통계적 추정치의 신뢰성과 유효성을 극대화하는 실험입니다.랜덤화 기반 추론은 실험 설계와 조사 표본 추출에서 특히 중요하다.

개요

통계적 실험 설계 이론에서 랜덤화는 처리 그룹 전체에 실험 단위를 랜덤하게 할당하는 것을 포함합니다.예를 들어, 실험이 신약을 표준 약물과 비교하는 경우, 환자를 신약 또는 무작위화를 이용한 표준 약물 제어에 할당해야 한다.

무작위 실험은 계획적이지 않습니다.랜덤화는 (큰 수의 법칙에 따라) 실험 설계에서 명시적으로 설명되지 않은 다른 요인들을 동등하게 함으로써 편향을 줄입니다.랜덤화는 모델 기반 통계 추론, 특히 베이지안 또는 우도 기반에서 가치 있는 무시할 수 없는 설계도 생성한다.실험 설계에서 처리를 비교하는 가장 간단한 설계는 "완전 랜덤화 설계"입니다.일부 "랜덤화 제한"은 변경하기 어려운 요인을 가진 차단 및 실험과 함께 발생할 수 있다. 완전한 랜덤화가 불가능하거나 선택한 효과의 추정치의 분산을 줄이는 것이 바람직할 때 랜덤화에 대한 추가 제한이 발생할 수 있다.

임상시험에서의 치료의 무작위화는 윤리적인 문제를 야기한다.경우에 따라 무작위화는 의사와 환자 모두의 치료 옵션을 감소시키므로 무작위화는 치료와 관련하여 임상적 균형을 필요로 한다.

온라인 무작위 제어 실험

웹 사이트는 무작위 제어 실험을[2] 실행하여 피드백 [3]루프를 생성할 수 있습니다.오프라인 실험과 온라인 실험의 주요 차이점은 다음과 같습니다.[3][4]

  • 로깅: 사용자 상호 작용을 안정적으로 기록할 수 있습니다.
  • 사용자 수: Amazon, Bing/Microsoft, Google 등의 대규모 사이트에서 각각 100만 명 이상의 사용자가 실험을 수행합니다.
  • 동시 실험 수: 대규모 사이트에서 수십 개의 중복 또는 동시 [5]실험을 실행합니다.
  • 크롤러가 유효한 소스인지 아니면 악의적인 인터넷 [clarification needed]봇인지에 관계없이 로봇입니다.
  • 낮은 백분율에서 높은 백분율로 실험을 확대할 수 있습니다.
  • 속도/성능은 주요 지표에 [3][6]큰 영향을 미칩니다.
  • 사전 실험 기간을 A/A 검정으로 사용하여 분산을 [7]줄일 수 있습니다.

역사

통제된 실험이 구약성서의 다니엘 책에 제시된 것으로 보인다.느부카드네살 왕은 일부 이스라엘 사람들에게 "왕의 식탁에서 매일 나오는 음식과 포도주를 먹을 것"을 제안했다.다니엘은 채식주의 식단을 선호했지만, 그 관리는 왕이 "당신 또래의 다른 젊은이들보다 당신이 더 안 좋아 보일까 봐 걱정했다.그러면 왕은 너 때문에 내 목을 차지하게 될 것이다.그러자 다니엘은 다음과 같은 통제된 실험을 제안했다. "10일 동안 당신의 하인들을 시험해 보세요.먹을 야채와 마실 물만 주세요.그런 다음 우리의 외모를 궁중음식을 먹는 젊은이들의 외모와 비교하고, 당신이 보는 대로 당신의 종들을 대하라." (다니엘 1, 12–13)[8][9]

무작위 실험은 C에 의한 무작위 실험의 발명에 따라 1800년대 후반 심리학과 교육에 제도화 되었다. S. Peirce.[10][11][12][13]R.A.는 심리학과 교육 이외에도 무작위 실험을 대중화했다. 피셔는 그의 저서 Statistical Methods for Research Workers에서 실험 설계의 추가 원칙을 소개했다.

통계적 해석

루빈 원인 모형은 랜덤화 실험을 설명하는 일반적인 방법을 제공합니다.루빈 인과 모델은 인과적 매개변수(즉, 결과에 대한 무작위 치료의 영향)를 정의하기 위한 프레임워크를 제공하는 반면, 실험 분석은 여러 가지 형태를 취할 수 있다.일반적으로 랜덤화 실험은 분산 분석, 학생의 t-검정, 회귀 분석 또는 이와 유사한 통계적 검정을 사용하여 분석됩니다.

랜덤화가 차이를 만든다는 경험적 증거

무작위화된 연구와 무작위화되지 않은 연구,[14] 그리고 적절하고 부적절하게 무작위화된 시험 간의 경험적 차이는 [15][16]발견하기 어려웠다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Schulz KF, Altman DG, Moher D; for the CONSORT Group (2010). "CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials". BMJ. 340: c332. doi:10.1136/bmj.c332. PMC 2844940. PMID 20332509.{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크)
  2. ^ Kohavi, Ron; Longbotham, Roger (2015). "Online Controlled Experiments and A/B Tests" (PDF). In Sammut, Claude; Webb, Geoff (eds.). Encyclopedia of Machine Learning and Data Mining. Springer. pp. to appear.
  3. ^ a b c Kohavi, Ron; Longbotham, Roger; Sommerfield, Dan; Henne, Randal M. (2009). "Controlled experiments on the web: survey and practical guide". Data Mining and Knowledge Discovery. 18 (1): 140–181. doi:10.1007/s10618-008-0114-1. ISSN 1384-5810.
  4. ^ Kohavi, Ron; Deng, Alex; Frasca, Brian; Longbotham, Roger; Walker, Toby; Xu Ya (2012). "Trustworthy Online Controlled Experiments: Five Puzzling Outcomes Explained". Proceedings of the 18th ACM SIGKDD Conference on Knowledge Discovery and Data Mining.
  5. ^ Kohavi, Ron; Deng Alex; Frasca Brian; Walker Toby; Xu Ya; Nils Pohlmann (2013). Online Controlled Experiments at Large Scale. Proceedings of the 19th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Vol. 19. Chicago, Illinois, USA: ACM. pp. 1168–1176. doi:10.1145/2487575.2488217.
  6. ^ Kohavi, Ron; Deng Alex; Longbotham Roger; Xu Ya (2014). Seven Rules of Thumb for Web Site Experimenters. Proceedings of the 20th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Vol. 20. New York, New York, USA: ACM. pp. 1857–1866. doi:10.1145/2623330.2623341.
  7. ^ Deng, Alex; Xu, Ya; Kohavi, Ron; Walker, Toby (2013). "Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-Experiment Data". WSDM 2013: Sixth ACM International Conference on Web Search and Data Mining.
  8. ^ Neuhauser, D; Diaz, M (2004). "Daniel: using the Bible to teach quality improvement methods". Quality and Safety in Health Care. 13 (2): 153–155. doi:10.1136/qshc.2003.009480. PMC 1743807. PMID 15069225.
  9. ^ Angrist, Joshua; Pischke Jörn-Steffen (2014). Mastering 'Metrics: The Path from Cause to Effect. Princeton University Press. p. 31.
  10. ^ Charles Sanders Peirce and Joseph Jastrow (1885). "On Small Differences in Sensation". Memoirs of the National Academy of Sciences. 3: 73–83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm
  11. ^ Hacking, Ian (September 1988). "Telepathy: Origins of Randomization in Experimental Design". Isis. 79 (3): 427–451. doi:10.1086/354775. JSTOR 234674. MR 1013489. S2CID 52201011.
  12. ^ Stephen M. Stigler (November 1992). "A Historical View of Statistical Concepts in Psychology and Educational Research". American Journal of Education. 101 (1): 60–70. doi:10.1086/444032. S2CID 143685203.
  13. ^ Trudy Dehue (December 1997). "Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design" (PDF). Isis. 88 (4): 653–673. doi:10.1086/383850. PMID 9519574. S2CID 23526321.
  14. ^ Anglemyer A, Horvath HT, Bero L (April 2014). "Healthcare outcomes assessed with observational study designs compared with those assessed in randomized trials". Cochrane Database Syst Rev. 2014 (4): MR000034. doi:10.1002/14651858.MR000034.pub2. PMC 8191367. PMID 24782322.
  15. ^ Odgaard-Jensen J, Vist G, et al. (April 2011). "Randomisation to protect against selection bias in healthcare trials". Cochrane Database Syst Rev. 2015 (4): MR000012. doi:10.1002/14651858.MR000012.pub3. PMC 7150228. PMID 21491415.
  16. ^ Howick J, Mebius A (2014). "In search of justification for the unpredictability paradox". Trials. 15: 480. doi:10.1186/1745-6215-15-480. PMC 4295227. PMID 25490908.