수정 가능한 영역 단위 문제
Modifiable areal unit problem수정 가능한 영역 단위 문제(MAUP)는 통계적 가설 검정 결과에 유의미한 영향을 미칠 수 있는 통계적 편향의 원천이다. MAUP는 예를 들어 인구 밀도나 질병률과 같은 공간 현상의 점 기반 측정치를 구역으로 통합할 때 결과에 영향을 미친다. 결과 요약 값(예: 합계, 비율, 비율, 밀도)은 집계 단위의 형태와 척도에 의해 영향을 받는다.[1]
예를 들어, 인구 조사 데이터는 카운티 지역, 인구 조사 지역, 우편 번호 지역, 경찰서 또는 기타 임의의 공간 분할로 통합될 수 있다. 따라서 데이터 통합의 결과는 지도 제작자가 분석에 사용할 "수정 가능한 영역 단위"의 선택에 따라 달라진다. 주 경계를 이용하여 인구밀도를 계산하는 인구조사 코로프 지도는 카운티 경계를 기준으로 밀도를 계산하는 지도와는 근본적으로 다른 결과를 산출할 것이다. 또한 인구 조사 구역 경계는 시간이 지남에 따라 변경될 수 있으므로 [2]과거 데이터를 현재 데이터와 비교할 때 MAUP를 고려해야 한다.
배경
이 문제는 1934년[3] 겔케와 비엘에 의해 처음 인정받았고 이후 오프닝쇼(1984)의 유명한 글과 아르비아(1988)의 책에 자세히 묘사되었다. 특히 오프닝쇼(1984)는 "많은 지리학 연구에 사용되는 영역 단위(지역 개체)는 임의적이고 수정이 가능하며, 누가 하든지 혹은 누가 하든지 간에 변덕과 환상을 겪게 된다"[4]고 관측했다. 문제는 특히 공간 역학, 공간 통계 또는 초인관계 지도에 대한 군집분석에 총체적 데이터를 사용할 경우, 이를 깨닫지 못하고 오역이 쉽게 이루어질 수 있다는 점이 뚜렷하다. 많은 과학 분야, 특히 인간 지리학은 집계된 데이터에 기반한 통계로부터 추론을 이끌어낼 때 MAUP를 무시하기 쉽다.[citation needed] MAUP는 생태학적 오류와 생태학적 편견이라는 주제와 밀접한 관련이 있다(Arbia, 1988).
MAUP에 의한 생태학적 편향은 집계된 데이터를 분석하는 동안 일반적으로 동시에 발생하는 두 개의 별도 효과로 문서화되었다. 첫째, 척도 효과는 서로 다른 집계 수준(방사 거리) 간에 통계적 결과의 변동을 일으킨다. 따라서 변수 간의 연관성은 데이터가 보고되는 영역 단위의 크기에 따라 달라진다. 일반적으로 면적 단위 크기가 증가함에 따라 상관관계가 증가한다. 구역 효과는 데이터를 동일한 척도(면적 모양)에서 서로 다른 구성으로 재그룹화함으로써 발생하는 상관관계 통계량의 변화를 설명한다.
1930년대 이후, 연구는 MAUP 때문에 통계 결과에서 추가적인 변화를 발견했다. 군내 및 군간 분산을 계산하는 표준 방법은 군집화가 변경됨에 따라 MAUP 연구에서 볼 수 있는 추가 분산을 설명하지 않는다. MAUP는 다중 공간 그룹 집합에 대한 평균 회귀 모수는 물론 상한과 하한을 계산하는 방법론으로 사용될 수 있다. MAUP는 관찰이든 실험이든 공간 연구에서 중요한 오류 원천이다. 이와 같이 특히 시계열 횡단면(TSCS) 맥락에서 단위 일관성은 필수적이다. 또한 대체 공간 집계에 대한 단위 민감도의 건전성 점검은 통계적 추정치에 대한 관련 편견을 완화하기 위해 정기적으로 수행되어야 한다.
제안 솔루션
회귀 분석 중 통합 편향을 줄이기 위해 문헌에서 여러 가지 제안이 나왔다. 연구자는 개별 수준 데이터의 표본을 사용하여 분산-공분산 행렬을 수정할 수 있다.[5] 또는 글로벌 회귀보다는 국지적 공간 회귀에 초점을 맞출 수 있다. 또한 연구자는 특정 통계적 결과를 최대화하기 위해 면적 단위를 설계하려고 시도할 수 있다.[4] 다른 이들은 여러 변수에 대해 최적의 통합 단위를 단일 집합으로 구성하기가 어려울 수 있으며, 각 집합은 서로 다른 방식으로 공간 전체에 걸쳐 비정지성 및 공간 자기 상관성을 나타낼 수 있다고 주장하였다. 다른 이들은 예측 가능한 방식으로 척도에 걸쳐 변화하는 통계자료를 개발할 것을 제안했으며, 아마도 프랙탈 치수를 공간 관계에 대한 척도 독립적인 척도로 사용할 것이다. 다른 이들은 베이지안 계층적 모델을 생태학적 추론을 위해 집계된 데이터와 개인 수준의 데이터를 결합하기 위한 일반적인 방법론으로 제시했다.
경험적 데이터에 기초한 MAUP의 연구는 다중 공간 변수들 간의 관계를 통제할 수 없기 때문에 제한된 통찰력을 제공할 수 있을 뿐이다. 개인 수준 데이터의 다양한 속성을 제어하기 위해서는 데이터 시뮬레이션이 필요하다. 시뮬레이션 연구는 변수의 공간 지원이 공간 데이터 집계에 의해 야기되는 생태학적 편향의 크기에 영향을 미칠 수 있다는 것을 입증했다.[6]
MAUP 민감도 분석
이 절은 일차 출처에 대한 참조에 너무 많이 의존한다. (2018년 8월) (이 과 시기 |
라르센은 일변량 데이터에 대한 시뮬레이션을 사용하여 공간 구성, 공간 연관성 및 데이터 집계의 영향을 조사하기 위해 분산 비율의 사용을 주장했다.[7] MAUP에 의한 통계 변동에 대한 자세한 설명은 데이터 값의 공간 배치와 공간 자기 상관성의 중요성을 보여주는 레이놀즈가 제시한다.[8] Reynold의 시뮬레이션 실험은 Swift에 의해 확장되었는데, Swift는 시뮬레이션 회귀 분석과 공간 경향으로 일련의 9가지 연습이 시작되었고, 이후 공간 역학학의 맥락에서 MAUP의 주제에 초점을 맞췄다. MAUP 민감도 분석 방법이 제시되어 MAUP가 전적으로 문제가 아니라는 것을 증명한다.[6] MAUP는 공간 이질성과 공간 자기 상관을 이해하는 데 도움이 되는 분석 도구로 사용될 수 있다.
어떤 경우에는 데이터 집계가 변수들 간의 강한 상관관계를 모호하게 하여 관계를 약하게 보이거나 심지어 부정적으로 보이도록 만들 수 있기 때문에 이 주제는 특히 중요하다. 반대로 MAUP는 무작위 변수가 유의미한 연관성이 있는 것처럼 나타나게 할 수 있다. 다변량 회귀 모수는 상관 계수보다 MAUP에 더 민감하다. MAUP에 대한 보다 분석적인 해결책이 발견될 때까지 생태학적 편향에 의한 상관관계 및 회귀계수의 불확실성을 추정하는 방법론으로 다양한 면적 단위를 이용한 공간 민감도 분석을 추천한다. ArcPy 라이브러리를 이용한 데이터 시뮬레이션 및 재분리의 예를 이용할 수 있다.[9] [10]
운송 계획에서, MAUP는 교통 분석 구역제(TAZ)와 연관되어 있다. 교통 분석의 문제점을 이해하는 데 있어서 주요한 출발점은 공간 분석이 공간의 탈각화와 관련된 몇 가지 한계를 가지고 있다는 인식이다. 그 중에서 수정 가능한 영역 단위와 경계 문제는 교통 분석 구역의 설계를 통한 운송 계획 및 분석과 직간접적으로 관련이 있는데, 대부분의 운송 연구는 직간접적으로 TAZ의 정의를 필요로 한다. 수정 가능한 경계와 척도 문제는 이러한 요인이 공간 패턴의 통계적 및 수학적 특성(수정 가능한 영역 단위 문제 - MAUP)에 미치는 영향 때문에 TAZ 규격화 중에 모두 특정한 주의를 기울여야 한다. 비에가스, 마르티네즈, 실바(2009, 2009b)[10]의 연구에서 저자들은 공간정보의 연구로부터 얻은 결과가 규모와 무관하지 않고, 지역경계의 선택에 집합적 효과가 내재되어 있는 방법을 제안한다. TAZ의 영역 경계는 교통 예측 모델에서 얻은 결과의 현실과 정확도에 직접적인 영향을 미친다. 본 논문에서 MAUP가 TAZ 정의 및 운송 수요 모델에 미치는 영향은 서로 다른 그리드(크기 및 원점 위치)를 사용하여 측정 및 분석한다. 이 분석은 상업용 GIS 소프트웨어에 통합된 애플리케이션을 구축하고 사례 연구(리스본 메트로폴리탄 지역)를 활용해 구현성과 성능을 테스트해 개발됐다. 그 결과는 통계적 정밀도와 지리적 정밀도 사이의 충돌과 교통계획 모델의 교통 할당 단계에서 정보의 손실과의 관계를 보여준다.[10]
참고 항목
일반 주제
특정 응용 프로그램
참조
- ^ "MAUP Definition – Esri Support GIS Dictionary". support.esri.com. Retrieved 2017-03-09.
- ^ Geography, US Census Bureau. "Geographic Boundary Change Notes". www.census.gov. Retrieved 2017-02-24.
- ^ 겔케 & 빌 1934년
- ^ a b 오프닝호 1983, 페이지 3
- ^ 홀트 D, 스틸 D, 트랜머 M, 리글리 N. (1996년) "지리적 기반 데이터에서의 분류 및 생태학적 영향" "지리학적 분석" 28:244{261
- ^ a b Swift, A, 류, L, Uber, J. (2008) "수질과 GI 질환 사이의 상관관계 통계의 MAUP 편중 감소" 컴퓨터, 환경 및 도시 시스템 32, 134–148
- ^ Larsen, J. (2000). "수정 가능한 면적 단위 문제: 문제인가 공간정보의 원천인가?" 오하이오 주립대학 박사학위 논문.
- ^ 레이놀즈, H. (1998) "수정 가능한 지역 단위 문제: 통계적 시뮬레이션을 통한 경험적 분석." 토론토 지리대학 박사논문 http://www.badpets.net/Thesis
- ^ 스위프트, A. (2017). "범죄 매핑 데이터 시뮬레이션", https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene
- ^ a b c Viegas, José Manuel; Martinez, L. Miguel; Silva, Elisabete A. (January 2009). "Effects of the Modifiable Areal Unit Problem on the Delineation of Traffic Analysis Zones". Environment and Planning B: Planning and Design. 36 (4): 625–643. doi:10.1068/b34033. S2CID 54840846.
원천
- Arbia, Giuseppe (1988). Spatial data configuration in then statistical analysis of regional economic and related problems. Dordrecht: Kluwer Academic Publishers.
이 글에는 Creative Commons Attribution 3.0 Unported(CC BY 3.0) 라이센스에 따라 이용 가능한 GIS Wiki의 Modifable Areal unit 문제 인용문이 수록되어 있다.
- Gehlke, C. E.; Biehl, Katherine (March 1934). "Certain effects of grouping upon the size of the correlation coefficient in census tract material". Journal of the American Statistical Association. 29 (185A): 169–170. doi:10.2307/2277827. JSTOR 2277827.
- Openshaw, Stan (1983). The modifiable areal unit problem. Norwick: Geo Books. ISBN 0860941345. OCLC 12052482.
- Unwin, D. J. (1996년). "GIS, 공간분석과 공간통계" 인문 지리학의 진보. 20: 540–551.
- 크레시, N. (1996년). "지지율 변경과 수정 가능한 면적 단위 문제" "지리학적 시스템" 3분 159–180.
- 비에가스, J, E.A. 실바, L. 마르티네스(2009a) "교통분석구역의 세분화에 대한 수정 가능한 면적단위 문제의 영향" "환경 및 계획 B – 계획 및 설계", 36(4) : 625–643.
- 비에가스, J, E.A. 실바, L. 마르티네스(2009a) "교통 분석 구역 정의: 새로운 방법론 및 알고리즘" "교통" 36 (5): 6", (5): 6.
추가 읽기
- Cressie, Noel A (1996). "Change of support and the modifiable areal unit problem". Geographical Systems. 3 (2–3): 159–180.
- Holt, David; Steel, David; Tranmer, Mark; Wrigley, Neil (July 1996). "Aggregation and ecological effects in geographically based data". Geographical Analysis. 28 (3): 244–261. doi:10.1111/j.1538-4632.1996.tb00933.x.
- Horner, Mark W.; Murray, Alan T. (January 2002). "Excess commuting and the modifiable areal unit problem" (PDF). Urban Studies. 39 (1): 131–139. doi:10.1080/00420980220099113. S2CID 56418131. Archived from the original (PDF) on 2017-04-22. Retrieved 2015-07-05.
- Kwan, Mei-Po (2012). "The uncertain geographic context problem" (PDF). Annals of the Association of American Geographers. 102 (5): 958–968. doi:10.1080/00045608.2012.687349. S2CID 52024592.
- Menon, Carlo (March 2012). "The bright side of MAUP: defining new measures of industrial agglomeration" (PDF). Papers in Regional Science. 91 (1): 3–28. doi:10.1111/j.1435-5957.2011.00350.x.
- Unwin, David J (December 1996). "GIS, spatial analysis and spatial statistics". Progress in Human Geography. 20 (4): 540–551. doi:10.1177/030913259602000408. S2CID 129487607.
- Wong, David (2009). "The modifiable areal unit problem (MAUP)". In Fotheringham, A Stewart; Rogerson, Peter (eds.). The SAGE handbook of spatial analysis. Los Angeles: Sage. pp. 105–124. ISBN 9781412910828. OCLC 85898184.
- Wrigley, Neil (1995). "Revisiting the modifiable areal unit problem and the ecological fallacy". In Cliff, Andrew D (ed.). Diffusing geography: essays for Peter Haggett. The Institute of British Geographers special publications series. 31. Oxford; Cambridge, Massachusetts: Blackwell. pp. 123–181. ISBN 0631195343. OCLC 30895028.
- Zhang, Ming; Kukadia, Nishant (January 2005). "Metrics of urban form and the modifiable areal unit problem". Transportation Research Record: Journal of the Transportation Research Board. 1902: 71–79. doi:10.3141/1902-09.