커버리지 에러
Coverage error커버리지 오류는 대상 모집단과 샘플이 [2]추출된 샘플링 프레임 간에 일대일 대응 관계가 없을 때 발생하는 비샘플링[1] 오류의 한 유형입니다.이로 인해 [3]조사 데이터를 사용하여 계산된 추정치가 편향될 수 있습니다.예를 들어, 연구자는 전화번호부(표본 프레임)에 기재된 주택에 전화를 걸어 등록 유권자(대상 인구)의 의견을 조사할 수 있다.모든 유권자가 전화번호부에 기재되어 있지 않은 경우 커버리지 부족이 발생할 수 있습니다.일부 유권자의 전화번호가 여러 개일 경우 오버커버리지가 발생할 수 있습니다.전화번호부에 기재되어 있는 전화번호 중 일부가 등록 [4]유권자의 것이 아닌 경우에도 편견이 발생할 수 있습니다.이 예에서는 언더커버리지, 오버커버리지 및 미등록 유권자가 샘플링 프레임에 포함되어 있는 것에 의한 바이어스가 커버리지오류의 예입니다.
논의
탐지 범위 오류는 측량 샘플링에서 발생할 수 있는 총 측량 오류의 한 유형입니다.조사 표본 추출에서 표본 추출 프레임은 대상 모집단의 표본을 [3]추출하는 표본 추출 단위 목록입니다.대상 모집단과 샘플 [5]프레임 간에 차이가 있을 경우 커버리지 오류가 발생합니다.
예를 들어, 한 연구원이 트위터를 사용하여 미국 대통령이 최근 취한 행동에 대한 미국 유권자들의 의견을 결정한다고 가정해 보자.조사 대상자는 미국 유권자이지만 트위터 이용자 명단을 표본 추출 프레임으로 사용하고 있다.모든 유권자가 트위터 사용자가 아닌 데다 모든 트위터 사용자가 유권자가 아니기 때문에 유권자를 이용하는 트위터의 인구통계나 의견이 [4]유권자 모집단을 대표하지 못할 수 있기 때문에 대상 인구와 표본 추출 프레임 간에 편견이 생길 수 있다.
언더커버리지(undercoverage)는 샘플링 프레임에 대상 모집단의 모든 멤버가 포함되지 않은 경우에 발생합니다.앞의 예에서는 유권자 모두가 트위터 사용자가 아니기 때문에 유권자는 충분히 보호받지 못하고 있습니다.한편, 타겟 모집단의 일부 멤버가 샘플링 프레임에 과잉 표현되면 오버커버리지가 발생합니다.위의 예에서는 일부 사용자가 여러 개의 Twitter 계정을 가지고 있을 가능성이 있으며,[4] 하나의 계정만 있는 Twitter 사용자보다 폴링에 포함될 가능성이 높습니다.
종적 연구는 특히 [6]시간이 지남에 따라 연구 대상 인구가 변할 수 있기 때문에 적용 범위가 부족할 수 있다.예를 들어, 연구원들은 특정 학군에서 3학년이 받는 편지 성적과 이 아이들이 성인이 되었을 때 받는 임금 사이의 관계를 연구하고 싶어할 수 있다.이 경우, 연구자는 이 학군의 모든 3학년 학생들이 성인이 되도록 성장(대상 인구)하는 것에 관심이 있습니다.그녀의 표본 추출 프레임은 학군의 3학년 목록일 수 있습니다(표본 추출 프레임).시간이 지남에 따라, 연구자는 원래 연구에서 사용된 아이들 중 일부를 잃어버릴 가능성이 높기 때문에, 성인의 표본 프레임이 더 이상 연구에서 사용된 아이들의 표본 프레임과 일치하지 않게 된다.
커버리지 오류를 정량화하는 방법
커버리지 오류를 정량화하고 수정하기 위해 다양한 방법이 사용되었습니다.사용되는 방법은 특정 기관 및 조직에 따라 다를 수 있습니다.예를 들어, 미국 인구조사국은 U.S. Postal Service의 배달 시퀀스 파일, IRS 1040 주소 데이터, 상업적으로 이용 가능한 압류 카운트 및 인구조사 블록에 의한 과소 카운트를 예측할 수 있는 기타 데이터를 사용하여 모델을 개발했다.인구조사국은 이러한 모형을 제로 팽창 음이항 분포 또는 제로 팽창 포아송([7]ZIP) 분포에 적합시키는 데 성공했다고 보고했다.
커버리지 에러를 정량화하는 또 다른 방법은 마크 앤 재캡처 [8]방법론을 사용한다.마크 앤 리캡처 방법론에서는 샘플이 모집단에서 직접 추출되어 마킹되고 모집단에 다시 도입된다.나중에 모집단에서 다른 표본을 추출(재캡처)하고, 이전에 표시된 표본의 비율을 사용하여 실제 모집단 크기를 추정합니다.이 방법은 대상 모집단에서 직접 샘플을 추출한 후 데이터 프레임에서 다른 샘플을 추출하여 언더커버리지([9]under-coverage)를 추정함으로써 샘플링 프레임의 유효성을 결정하는 것으로 확장될 수 있습니다.예를 들어, 인구 조사가 실시되었다고 가정합니다.인구조사가 완료된 후 프레임에서 무작위 표본을 추출하여 [8]다시 계산할 수 있다.
커버리지 오류를 줄이는 방법
커버리지 오류를 줄이는 방법 중 하나는 샘플프레임을 구축하거나 정보를 요청하기 위해 여러 소스에 의존하는 것입니다.이를 혼합 모드 방식이라고 합니다.예를 들어, 워싱턴 주립 대학교 학생들은 거리 주소와 이메일 [5]주소를 모두 사용하여 샘플 프레임을 구축하여 학생 조사 경험 조사를 실시했습니다.
또 다른 혼합 모드 접근방식의 예로서, 2010년 미국 인구 조사는 주로 거주지 우편 응답에 의존했으며, 그 후 비응답자를 인터뷰하기 위해 현장 인터뷰 담당자를 배치했다.이렇게 하면 Field Interviewer는 특정 주소가 아직 존재하는지, 아니면 아직 사용되고 있는지 여부를 판단할 수 있습니다.이 접근방식은 대다수의 사람들이 우편으로 응답하고 현장 [8][5]방문을 필요로 하지 않기 때문에 비용 절감이라는 추가적인 이점이 있었습니다.
예: 2010년 센서스
미국 인구조사국은 약 1억4천490만 개의 주소의 마스터 주소 파일을 준비하여 관리하고 있으며, 이 주소는 미국 10년마다 실시하는 인구조사 및 기타 조사를 위한 표본 추출틀로 사용됩니다.약 111,105명의 현장 대표자들의 노력과 거의 5억 달러의 지출에도 불구하고, 인구조사국은 여전히 마스터 주소 [7]파일에 들어가지 않은 상당한 수의 주소를 발견했다.
커버리지 폴로업(CFU)과 필드 검증(FV)은 2000개의 인구조사 데이터를 기반으로 2010년 인구조사를 개선하기 위해 실시된 인구조사국 업무이다.이러한 조작은, 다음의 종류의 커버리지 에러에 대처하는 것을 목적으로 하고 있습니다.세어져야 할 사람을 세지 않는 것, 세어서는 안 될 사람을 세는 것, 그리고 세어져야 할 사람을 세는 것, 하지만 식별된 위치가 잘못된 사람을 세는 것.미국 인구 조사에서의 커버리지 오류는 정부에 의해 사람들 집단이 충분히 대표되지 않도록 하는 잠재적인 영향을 끼친다.특히 관심사는 대상 인구 통계 집단을 과소평가하는 "차이 과소 카운트"이다.CFU와 FV의 노력으로 2010년 인구 조사 정확도가 향상되었지만,[10] 차등 과소 카운트 문제를 해결하기 위해 더 많은 연구가 권장되었다.
「 」를 참조해 주세요.
레퍼런스
- ^ Salant, Priscilla, Don A.딜먼.「자체만의 앙케이트 실시 방법:최고의 프로페셔널은, 신뢰할 수 있는 결과를 얻기 위한 실적이 있는 기술을 제공합니다」(1995년)
- ^ Fisheries, NOAA (2019-02-21). "Survey Statistics Overview NOAA Fisheries". www.fisheries.noaa.gov. Retrieved 2019-02-24.
- ^ a b 쉐퍼, 리처드 L. 1996년Ronald S.에 의한 교육 조사 샘플링 섹션 5.Fecso, 윌리엄 D.칼스비크, 샤론 L. 로어, 리처드 L.셔퍼, 프리츠 J. 셔런, 엘리자베스 A.스테이시미국 통계학자 50:4(1996년 11월), 페이지 335–337. (jstor에 대하여)
- ^ a b c Scheaffer, Richard L. (2012). Elementary survey sampling (7th, student ed.). Boston, MA: Brooks/Cole. ISBN 978-0840053619. OCLC 732960076.
- ^ a b c Dillman, Don A.; Smyth, Jolene D.; Christian, Leah Melani (6 August 2014). Internet, phone, mail, and mixed-mode surveys : the tailored design method (Fourth ed.). Hoboken. ISBN 9781118921302. OCLC 878301194.
- ^ Lynn, Peter (2009). Methodology of longitudinal surveys. Chichester, UK: John Wiley & Sons. ISBN 9780470743911. OCLC 317116422.
- ^ a b Bureau, US Census. "Selection of Predictors to Model Coverage Errors". www.census.gov. Retrieved 2019-02-24.
- ^ a b c Biemer, Paul P.; de Leeuw, Edith Desirée; Eckman, Stephanie; Edwards, Brad; Kreuter, Frauke; Lyberg, Lars, eds. (6 February 2017). Total survey error in practice. Hoboken, New Jersey. ISBN 9781119041689. OCLC 971891428.
- ^ Bureau, US Census. "Coverage Error Models for Census and Survey Data". www.census.gov. Retrieved 2019-02-24.
- ^ 2010 census: follow-up should reduce coverage errors, but effects on demographic groups need to be determined: report to congressional requesters. U.S. Govt. Accountability Office. 2010. OCLC 721261877.