디트렌드 대응 분석

Detrended correspondence analysis

디트렌딩 대응 분석(DCA)생태학자들이 생태 공동체 데이터를 전형적으로 보여주는 크고 종들이 풍부하지만 대개 희박한 데이터 매트릭스에서 주요 요인이나 구배를 찾기 위해 널리 사용되는 다변량 통계 기법이다. DCA는 그라데이션 데이터에 적용할 때 대부분의 다른 다변량 분석에 내재된 아티팩트를 억제하는 데 자주 사용된다.[1]

역사

DCA는 1979년 영국 육상생태연구소 마크 힐(현재의 생태수문학과 수문학 센터로 합병)에 의해 만들어졌으며, 대응 분석 방법인 DECORANA(Detterned Communications Analysis)라는 FORTRAN 코드 패키지에서 구현되었다. DCA는 때때로 DECARANA라고 잘못 언급되기도 하지만, DCA는 기본 알고리즘인 반면 DECARANA는 이를 구현하는 도구다.

해결된 문제

힐과 가우치에 따르면 DCA는 그라데이션 데이터에 적용될 때 대부분의 다른 다변량 분석에 내재된 두 개의 아티팩트를 억제한다.[2] 예를 들어, 새로운 서식지를 개척하는 일련의 식물 종들이 있다; 초기 성공 종들은 중간 성공 종으로 대체되고, 그 다음 늦은 성공 종으로 대체된다(아래 예 참조). 대응 분석과 같은 표준 서수로 그러한 데이터를 분석하는 경우:

  • 표본의 서열 점수는 '에지 효과'를 나타낼 것이다. 즉, 정기적인 종의 연속적인 시작과 끝에서 점수의 분산이 중간보다 상당히 작을 것이다.
  • 그래프로 표시할 때, 분석 중인 과정이 인간의 직관이 선형 추세로 보길 원하는 꾸준하고 지속적인 변화임에도 불구하고 점들은 직선이 아닌 말발굽 모양의 곡선을 따르는 것으로 보일 것이다.

곡선 투영은 다변량 공간에서 데이터의 모양을 정확하게 나타내기 때문에 생태학 외부에서는 구배 데이터를 분석할 때(예: 두 개의 서로 다른 지질 사이에서 실행되는 교차로를 따른 토양 특성 또는 개인의 수명 동안 행태 데이터) 동일한 아티팩트가 발생한다.

Ter Braak과 Fatrentice(1987, 페이지 121)는 2차원 종 패킹 모델을 분석한 시뮬레이션 연구를 인용하여 CA에 비해 DCA의 성능을 향상시켰다.

방법

DCA는 커뮤니티 생태계에서 데이터 탐색과 요약에 매우 신뢰할 수 있고 유용한 도구임을 스스로 보여준 반복 알고리즘이다(Shaw 2003). 데이터에 대한 표준 서열화(CA 또는 상호 평균화)를 실행하여 첫 번째 서열화 축이 두 번째 축으로 왜곡되는 초기 말-쇼 곡선을 생성한다. 그런 다음 첫 번째 축을 세그먼트(기본값 = 26)로 나누고, 두 번째 축에서 각 세그먼트의 평균 값이 0으로 다시 칼리브레이션하여 곡선을 평평하게 쪼인다. 그것은 또한 끝이 더 이상 중간과 비교하여 압축되지 않도록 축을 다시 계산하여 1 DCA 단위가 데이터를 통해 내내 동일한 회전율에 근사하게 된다: 경험 법칙은 4 DCA 단위는 커뮤니티에 총 회전율이 있었다는 것을 의미한다. 테르 브라크와 프렌티스(1987, 페이지 122)는 건전성 문제로 인한 축의 비선형 재스캐일링에 대해 경고하고, 폴리노멀(detrending-by-polynomial)만을 사용할 것을 권고한다.

단점

DCA에는 다른 (일반적으로 환경적) 변수의 선형 결합과 최적으로 상관하기 위해 다중 선형 회귀에 의해 축이 강제되는 제약(수평적) 버전의 DCA가 있지만, 는 몬테 카를로 순열 분석에 의한 null 모델의 시험을 가능하게 한다.

이 예는 이상적인 데이터 세트를 보여준다. 종 데이터는 행으로, 표본은 열에 있다. 경사를 따라 각 표본에 대해 새로운 종이 도입되지만 다른 종은 더 이상 존재하지 않는다. 결과는 희박한 행렬이다. 하나는 표본에 한 종의 존재를 나타낸다. 가장자리 부분을 제외하고 각 표본은 5종류를 포함한다.

(이상적) 데이터의 대응 분석과 대응 분석의 비교. CA의 아치 효과와 DCA의 솔루션을 확인하십시오.
이상적인 서열 데이터
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
SP1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP2 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP3 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP4 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP5 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0
SP6 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0
SP7 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0
SP8 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
SP9 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0
SP10 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0
SP11 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0
SP12 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0
SP13 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0
SP14 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0
SP15 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0
SP16 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0
SP17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0
SP18 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1
SP19 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1
SP20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1

우측에 있는 대응 분석 결과의 처음 두 축의 플롯은 가장자리 효과, 즉 점이 첫 번째 축의 가장자리에서 군집화되어 있는 것과 아치 효과의 단점을 분명하게 보여준다.

참고 항목

참조

  1. ^ 힐 앤 가우치 (1980년)
  2. ^ 힐 앤 가우치 (1980년)
  • 힐, 범행 수법(1979년). DECARANA Detrened Communications Analysis and Cercental Averaging(디트렌드 대응 분석 및 역평균화)을 위한 FORTRAN 프로그램. 52pp, 뉴욕 이타카, 코넬 대학교 생태학과 체계학부
  • M.O. 힐과 H.G. 고흐(1980년) 디트렌드된 대응 분석: 개선된 안수 기법. 채식주의자 42, 47–58.
  • 옥산엔J와 민친PR(1997년). 입력 데이터 순서 변경에 따른 순서 지정 결과의 불안정성: 설명 및 해결책. 제8권 제447호-454호
  • 쇼 PJA(2003년). 환경과학을 위한 다변량 통계. 런던: 호더 아놀드
  • 테르 브라크, C.J.F., 프렌티스, 아이씨(1988) 구배 분석 이론. 생태연구의 발전, 271–371. ISBN0-12-013918-9. 다시 인쇄된 위치: C.J.F. (1987년) 테르 브라크. 종과 환경을 연결하는 단일 모델. 와게닝엔: 박사 논문 농업 수학 그룹, 101–146.

외부 링크

  • PAST(PAlaeontological Statistics) — 옥산센과 민친(1997)에 따라 수정한 DCA를 포함한 무료 소프트웨어
  • WINBASP — Ter Braak 및 Fratterice(1988)에 따른 디트렌딩이 있는 DCA를 포함한 무료 소프트웨어
  • 비건: R — 기능을 포함한 무료 소프트웨어인 Community Ecology Package for R: 힐과 가우치의 대응 분석 및 기본 역수 평균(1980년)