커버 트리

표지 트리는 컴퓨터 공학에서 가장 가까운 이웃의 검색 속도를 높이기 위해 특별히 고안된 데이터 구조의 한 유형이다.그것은 항법망 데이터 구조를 정교하게 다듬은 것이며, 본질적으로 저차원 데이터를 인덱싱하기 위해 개발된 다양한 다른 데이터 구조와 관련이 있다.^[1]

트리는 루트 포인트를 포함하는 최상위 수준과 메트릭 공간의 모든 점을 포함하는 하위 수준을 가진 수준의 계층 구조로 생각할 수 있다.각 수준 C는 나무가 하강할 때 1씩 감소하는 정수 값 i와 연관된다.커버 트리의 각 레벨 C에는 다음과 같은 세 가지 중요한 특성이 있다.

중첩: $C_{i}\subseteq C_{i-1$
커버:For every point $p\in C_{i-1}$ , there exists a point $q\in C_{i}$ such that the distance from $p$ to $q$ is less than or equal to $2^{i}$ and exactly one such $q$ is a parent $[\displaystyle p}$ 의 $p$
분리:모든 포인트 $p,q\in C_{i}$ , $p,q\in C_{i}$ $p,q\in C_{i}$ $p,q\in C_{i}$ i ${\$ 에 대해 $p,q\in C_{i}$ $p$ $p$ 에서 $q$ $q$ 까지의 $p$ 거리는 $2^{i}$ $2^{i}$ ${\$ 2 $^{i}$ 보다 크다 $q$ $2^{i}$

복잡성

찾다

다른 메트릭 트리와 마찬가지로 커버 트리는 $O(\eta *\log {n})$ $O(\eta *\log {n})$ ∗ $O(\eta *\log {n})$ $O(\eta *\log {n})$ $){\displaystyle O(\eta *\log {n})$ 에서 가장 가까운 인접 검색을 허용하며, 여기서 $O(\eta *\log {n})$ $\eta$ $\eta$ 은 $\eta$ 데이터 집합의 차원성과 연관된 상수이고 n은 카디널리티입니다.비교하자면 기본 선형 검색에는 O ( $O(n)$ ) ${\displaystyle$ O $(n$ 이 필요하며, $n$ 는 n ${\displaystyle$ n $}$ 에 훨씬 더 심하게 의존한다. 그러나 $n$ 고차원 메트릭 공간에서는 $\eta$ ${\displaysty \eta }$ 상수가 $\eta$ 비삼각적이므로 복잡도 분석에서 무시할 수 없다.다른 메트릭 트리와 달리 커버 트리는 데이터 집합의 확장 상수 또는 두 배 상수(추정 NN 검색의 경우)를 기반으로 하는 상수에 이론적으로 바인딩되어 있다.검색 제한 시간은 $O(c^{12}\log {n})$ $O(c^{12}\log {n})$ $O(c^{12}\log {n})$ ) ${\displaystyle O(c^{12}\log {n})$ 이며, $c$ 서 $O(c^{{12}}\log {n})$ c $c$ 은 $c$ (는) 데이터 집합의 확장 상수입니다.

삽입하다

비록 커버 트리가 순진한 접근법보다 더 빠른 검색을 제공하지만, 이러한 이점은 데이터 구조를 유지하는데 드는 추가 비용에 의해 평가되어야 한다.순진한 접근방식에서 데이터 집합에 새로운 점을 추가하는 것은 순전히 순서가 보존될 필요가 없기 때문에 사소한 것이지만 표지 트리에서 $O(c^{6}\log {n})$ $O(c^{6}\log {n})$ $O(c^{6}\log {n})$ ) ${\displaystyle O(c^{6}\log {n})$ 시간이 $O(c^{6}\log {n})$ 걸릴 수 있다.그러나 이것은 상행선이며, 실제로 성과를 향상시키는 듯한 기법이 일부 구현되었다.^[2]

공간

표지 트리는 반복된 점을 추적하기 위해 암묵적 표현을 사용한다.따라서 O(n) 공간만 있으면 된다.

참고 항목

참조

메모들

^ 케네스 클락슨.가장 가까운 검색 및 메트릭 공간 치수.G. 샤크나로비치, T. 다렐, P. Indyk, 편집자, 학습 및 비전을 위한 가장 가까운 이웃 방법:이론과 실천, 15-59페이지 MIT 출판부, 2006년
^ "Cover Tree".

참고 문헌 목록

알리나 비겔지머, 샴 카케이드, 존 랭포드.가장 가까운 이웃을 위해 나무를 덮어라.Proc.기계학습 국제회의(ICML), 2006.
JL의 커버 트리 페이지.존 랭포드의 페이지는 서류와 코드로 연결된다.
GitHub에 C++ 커버 트리 구현.
Java의 커버 트리 구현.

[clarkson-1] 케네스 클락슨.가장 가까운 검색 및 메트릭 공간 치수.G. 샤크나로비치, T. 다렐, P. Indyk, 편집자, 학습 및 비전을 위한 가장 가까운 이웃 방법:이론과 실천, 15-59페이지 MIT 출판부, 2006년

[2] "Cover Tree".

[1]

[2]

v t 트리 데이터 구조
나무 검색 (이중 세트/관련 배열)	2–3 2–3–4 AA (a,b) AVL B B+ B* B^x (최적) 이진 검색 춤 HTree 간격 오더통계 (좌편향) 빨강-검은색 희생양 스플레이 T 트레프 UB 무게균형
힙스	이진수 이항체 브로달 피보나치 좌익 페어링 스큐 판 엠드 보아스 약한
시도하다	씨트리 C-트리(압축 ADT) 해시 라딕스 접미사 3차 검색 X-fast Y-fast
공간 데이터 분할 트리	볼 BK BSP 카르테시안 힐베르트 R k-d(일반적으로 k-d) M 미터법 MVP 옥트리 PH 우선 순위 R 쿼드 R R+ R* 세그먼트 부사장 X
다른 나무들	커버 지수적 펜윅 손가락 프랙탈 트리 지수 퓨전 해시 캘린더 아이 디스턴스 케이애리 왼손잡이 우시블링 링크/컷 로그 구조 병합 머클 p q. 범위 SPQR 톱

Search

커버 트리

네임스페이스

더

목차

복잡성

찾다

삽입하다

공간

참고 항목

참조