마이크로데이터(통계)

Microdata (statistics)

조사인구조사 데이터의 연구에서 마이크로데이터는 개별 응답자 수준의 정보다.[1] 예를 들어, 국가 인구 조사는 응답하는 모든 사람을 위해 별도로 기록되는 나이, 집 주소, 교육 수준, 고용 상태 및 기타 많은 변수를 수집할 수 있다. 이것은 마이크로데이터다.

이점

조사/감정 결과는 개인 정보 보호와 관련된 대량의 데이터 때문에 집계(예: 지역 수준고용률)로 가장 일반적으로 발표된다. 한 인구 조사의 마이크로데이터는 각각 수십 개의 데이터 항목을 가진 수백만 개의 기록을 쉽게 포함할 수 있다.

그러나 결과를 집계 수준으로 요약하면 정보 손실이 발생한다. 예를 들어 교육과 고용에 대한 통계를 별도로 집계하면 이 두 변수 사이의 관계를 탐색하는 데 사용할 수 없다. 마이크로데이터에 대한 접근은 연구자들이 그러한 상호작용을 조사하고 상세한 분석을 수행할 수 있는 훨씬 더 많은 자유를 준다.[1]

유용성

이 때문에 일부 통계기구는 연구목적으로 마이크로데이터에 대한 접근을 허용하고 있다. 통제는 일반적으로 이 데이터가 남용되거나 사생활 침해로 이어질 수 있는 위험을 제한하기 위해 부과된다. 를 들어, 통합공용 마이크로데이터 시리즈는 연구자가 보안 조치를 이행하고, 마이크로데이터의 재분배를 피하며, 비상업적 연구/교육 목적으로만 마이크로데이터를 사용하고, 기록된 개인을 식별하려는 어떠한 시도도 하지 않도록 요구한다. 이름과 미세한 수준의 지리적 데이터가 제거되고, 필요에 따라 일부 데이터 항목이 변경되어 개인을 식별할 수 없게 되며, 소수 민족 범주가 병합된다.[2]

국제가구조사네트워크는 관심 있는 통계기관이 마이크로데이터 관리 관행을 개선할 수 있도록 도구와 지침을 개발했다. 마이크로데이터 관리 툴킷은 현재 약 80개국에서 사용되고 있는 DDI 메타데이터 편집기로, PARIS21 사무국, 세계은행 및 기타 파트너사가 통계를 위한 Marrakech 실행 계획의 맥락에서 구현한 가속 데이터 프로그램의 지원을 받고 있다.

참조

  1. ^ a b "IPUMS-l: FAQ". IPUMS International.
  2. ^ "IPUMSl-Confidentiality". Minnesota Population Center, University of Minnesota. Archived from the original on 2007-08-23.