거리 샘플링

Distance sampling

거리 표본 추출은 모집단밀도 및/또는 풍부함을 추정하기 위해 밀접하게 관련된 방법의 널리 사용되는 그룹이다. 주요 방법은 선 트란섹트 또는 점 트란섹트를 기반으로 한다.[1][2] 이 표본 추출 방법에서 수집된 데이터는 무작위로 배치된 선이나 점으로부터 조사되는 물체의 거리이며, 목표는 지역 내 물체의 평균 밀도를 추정하는 것이다.[3]

기본 선횡단 방법론

선 트란섹트를 사용한 기본 거리 샘플링 조사 접근법. 현장 관찰자는 물체를 감지하고 transect 선까지의 거리 r과 각도 θ을 기록한다. 이를 통해 트란섹트(x)까지의 물체 거리를 계산할 수 있다. 설문 조사의 모든 x는 조사 대상 지역의 총 인구 밀도를 추정할 수 있는 트란섹트와의 거리에 따라 탐지성이 감소하는 방법을 모델링하는 데 사용된다.

거리 표본 추출에 대한 일반적인 접근방식은 선 트란섹트의 사용이다. 관찰자는 직선을 가로지른다(임의로 배치하거나 일부 계획된 분포를 따른다). 관심 대상(예: 조사 대상 유형의 동물)을 관찰할 때마다 현재 위치에서 대상(r)까지의 거리뿐만 아니라 검출 각도를 트란섹트 라인(trangle line)까지 기록한다. 그러면 물체에서 트란섹트까지의 거리는 x = r * sin(sin)으로 계산할 수 있다. 이러한 거리 x는 추가 모델링에서 분석될 감지 거리다.

사전 결정된 최대 감지 거리 w까지 물체가 감지된다. w 내의 모든 물체가 검출되는 것은 아니지만, 기본적인 가정은 영거리의 모든 물체(즉, 선상에 있는 물체)가 검출된다는 것이다. 따라서 전체 검출 확률은 선상에서 1이 될 것으로 예상되며 선으로부터의 거리가 증가함에 따라 감소할 것으로 예상된다. 관측된 거리의 분포는 주어진 거리에서 물체를 탐지할 확률을 설명하는 "탐지 함수"를 추정하는 데 사용된다. 다양한 기본 가정이 유지된다는 점에서, 이 함수는 선의 폭 w 내에 있는 물체를 탐지하는 평균 확률 P의 추정을 허용한다. 물체 밀도는 D = n / (P*a)로 추정할 수 있다. 여기서 n은 검출된 물체의 수이고 a는 대상 영역의 크기(트랑섹트(L)의 총 길이 2w를 곱한 값)이다.

요컨대, 탐지기능이 트란섹트로부터의 거리가 증가하면서 떨어지는 방법을 모델링하면 실제로 관찰된 숫자에 기초하여 관심 영역에 총 몇 개의 물체가 있는지 추정할 수 있다.[2]

점 횡단면에서의 조사 방법론은 약간 다르다. 이 경우 관찰자는 정지 상태를 유지하며, 측량은 트란섹트의 끝에 도달한 것이 아니라 미리 정해진 시간 후에 종료되며, 관찰자에 대한 측정된 거리를 횡단 거리로 변환하지 않고 직접 사용한다. 검출기능의 종류와 피팅도 어느 정도 다르다.[2]

탐지함수

검출 데이터의 PDF에 장착된 반정규 검출 기능(빨간색 선) 데이터는 거리 대역으로 취합되었다(그렇게 수집하거나 수집 후 결합하여 모델 피팅을 개선). 중심선으로부터의 거리(y = 0)에 따라 검출 확률이 감소한다.

검출 기능 g(y)를 사용하여 검출성(여기 y는 선으로부터의 거리)을 모델링. 이 함수는 확률밀도함수(PDF)로 대표되는 검출범위 분포에 적합하다. PDF는 수집된 거리에 대한 히스토그램으로 중심선에서 관찰자가 거리 y의 물체를 탐지할 확률을 설명하고, 선 자체에 대한 탐지(y = 0)가 확실하다고 가정한다(P = 1).

선호도에 따르면 g(y)는 현장 데이터의 경우처럼 분포 특성이 불분명하거나 약하게 정의된 데이터를 나타낼 수 있는 강력한 기능이다. 검출 데이터의 PDF의 일반적인 형태에 따라 몇 가지 유형의 기능이 일반적으로 사용된다.

탐지함수 형태
유니폼 1/w
반정규격 exposy2/2σ2)
위험률 1-확장(y/limit)-b
음수 지수 설명)

여기서 w는 전체 검출 잘라내기 거리이며 a, bσ은 기능별 매개변수다. 반정규 및 위험률 함수는 일반적으로 잘 제어된 조건에서 수집된 현장 데이터를 나타낼 가능성이 가장 높은 것으로 간주된다. 횡단선으로부터의 거리에 따라 증가하거나 일정하게 유지되는 것으로 보이는 검출 확률은 데이터 수집 또는 측량 설계에 문제를 나타낼 수 있다.[2]

공변량

시리즈 확장

데이터에 대한 검출 함수의 적합성을 개선하기 위해 자주 사용되는 방법은 직렬 팽창의 사용이다. 여기서 함수는 "키" 부분(위에서 다룬 유형의)과 "시리즈" 부분(즉, g(y) = 키(y)[1 + 시리즈(y)]로 나뉜다. 시리즈는 일반적으로 다항식(예: Hermite 다항식)의 형태를 취하며, 핵심 기능의 형태에 유연성을 더하여 데이터 PDF에 보다 가깝게 맞출 수 있도록 하기 위한 것이다. 이를 통해 밀도/부유 추정의 정밀도를 향상시킬 수 있지만, 데이터 세트가 탐지 거리 분포의 신뢰할 수 있는 추정치를 나타내기에 충분한 크기와 품질을 가진 경우에만 데이터 사용을 방어할 수 있다. 그렇지 않으면 데이터를 과도하게 적합시킬 위험이 있고 데이터 세트의 비대표적 특성이 적합 프로세스에 치우칠 수 있다.[2][4]

가정 및 치우침의 원인

거리 표본 추출은 비교적 복잡한 조사 방법이기 때문에, 모델 결과의 신뢰성은 다수의 기본적인 가정을 충족시키는 것에 달려 있다. 가장 기본적인 것들은 아래에 열거되어 있다. 이러한 가정을 하나 이상 위반하는 조사로부터 도출된 데이터는 분석 전 또는 분석 중에 어느 정도까지 수정될 수 있지만 항상은 아니다.[1][2]

거리 샘플링의 기본 가정
가정 위반 예방/사후 교정 데이터 예제
트란섹트 선상의 모든 동물이 검출된다(즉, P(0) = 1) 이는 지상조사에서 가정할 수 있는 경우가 많지만, 선상조사에서는 문제가 될 수 있다. 위반은 모형 추정치의 강한 편향으로 이어질 수 있음 이중 관찰자 조사에서, 한 명의 관찰자가 "중심선 지킴이" 임무를 수행할 수 있다.

포스트 호크 수정은 때때로 가능하지만 복잡할 수 있다.[1] 따라서 이러한 가정을 위반하는 것은 피할 가치가 있다.

동물들은 조사된 지역 전체에 무작위적으로 고르게 분포되어 있다. 편향의 주요 근원은 다음과 같다.

a) 군집화된 모집단(군집 등) 그러나 개별 탐지는 독립된 것으로 간주된다.

b) 트란섹트는 밀도의 구배(도로, 수문 등)와 독립적으로 배치되지 않는다.

c) 트란섹트가 너무 가까이 있다.

a) 개인이 아닌 군집 + 군집 크기를 기록한 다음 군집 크기 추정을 탐지 함수에 통합

b) 트란섹트를 임의로 또는 알려진 밀도 구배에 걸쳐 배치

c) 최대 검출 범위(w)가 트란섹트 간에 겹치지 않도록 주의

동물들은 발견하기 전에 움직이지 않는다. 움직임이 무작위라면 결과적 편향은 무시해도 좋다. 관찰자에 대한 반응의 움직임(피동성/관용)은 검출가능성에 음/양적 편향을 일으킬 것이다. 회피행위는 일반적이며 현장에서 예방하기 어려울 수 있다. 효과적인 호크 후 치료법은 탐지 내용을 간격으로 분할하고 탐지 기능을 어깨(예: 위험률)로 사용함으로써 데이터의 평균을 산출하는 것이다.
데이터에서 회피행위의 표시 - 탐지는 처음에는 트란섹트 선까지의 거리가 증가함에 따라 감소하지 않고 증가한다.
측정(앵글 및 거리)이 정확함 무작위 오류는 무시할 수 있지만, 체계적 오류는 편견을 초래할 수 있다. 이것은 종종 선호되는 ("원형") 값으로 각도 또는 거리를 반올림할 때 발생하며, 그 결과 특정 값에서 보온된다. 각도를 0으로 반올림하는 것은 특히 일반적이다. 범위 찾기기와 각도 보드를 사용하여 현장에서 사산하지 않도록 하십시오. 감지 간격으로 분할하여 데이터의 사후 평활화를 수행하면 사소한 편견을 해소하는 데 효과적임
데이터에서 각도 반올림을 0으로 표시 - 첫 번째 데이터 간격에서 예상보다 많은 탐지가 있음

소프트웨어 구현

참조

  1. ^ a b c Buckland, S. T., Anderson, D. R., Burnham, K. P., L. L. (1993년) 거리 표본 추출: 생물학적 모집단의 풍부성 추정. 런던: 채프먼과 홀이요 ISBN0-412-42660-9
  2. ^ a b c d e f Buckland, Stephen T.; Anderson, David R.; Burnham, Kenneth Paul; Laake, Jeffrey Lee; Borchers, David Louis; Thomas, Leonard (2001). Introduction to distance sampling: estimating abundance of biological populations. Oxford: Oxford University Press.
  3. ^ 에버릿, B. S. (2002) 케임브리지 통계사전, 제2판 CUP ISBN 0-521-81099-X(거리 샘플링 입력)
  4. ^ Buckland, S. T. (2004). Advanced distance sampling. Oxford University Press.

추가 읽기

외부 링크