루트가 없는 이진 트리

Unrooted binary tree
방선박테리아 종 간의 유사성과 진화사를 나타내는 뿌리 없는 이진수 형태의 분해도.

수학과 컴퓨터 과학에서, 뿌리 없는 이진수 트리는 정점이 하나 또는 세 개의 이웃을 갖는 뿌리 없는 트리이다.

정의들

프리 트리 또는 비루트 트리는 주기가 없는 연결무방향 그래프입니다.인접 라우터가 1개인 정점은 트리의 이고 나머지 정점은 트리의 내부 노드입니다.정점의 정도는 인접하는 수이며, 여러 개의 노드가 있는 트리에서 잎은 1도의 정점이 됩니다.비루트 바이너리 트리는 모든 내부 노드의 등급이 정확히 3인 프리 트리입니다.

어떤 어플리케이션에서는 루트가 없는 바이너리 트리의 서브 타입을 구별하는 것이 타당할 수 있다: 트리의 평면 임베딩은 각 정점에서 에지에 대한 순환 순서를 지정하여 평면 트리로 만드는 것으로 고정될 수 있다.컴퓨터 과학에서 이진 트리는 종종 데이터 구조로 사용될 때 루트와 순서가 매겨지지만, 계층적 클러스터링진화적 트리 재구성의 비루트 이진 트리의 적용에서는 순서가 매겨지지 않은 트리가 더 [1]일반적입니다.

또한 모든 정점에 별도의 라벨이 있는 나무, 잎에만 라벨이 붙어 있는 나무, 노드에 라벨이 붙어 있지 않은 나무를 구분할 수 있습니다.n개의 잎을 가진 비근원 이진 트리에서 n - 2개의 내부 노드가 존재하므로 모든 노드에 라벨을 붙여야 할 경우 1 - 2n - 1의 정수 집합에서, 잎에만 라벨을 [1]붙여야 할 경우 1 - n의 정수 집합에서 라벨을 얻을 수 있습니다.

관련 구조

루트 바이너리 트리

비루트 바이너리 트리 T는 T루트 엣지 e를 선택하고, 새로운 루트 노드를 e의 중간에 배치하고, 그 결과 분할된 트리의 모든 엣지를 루트 노드로부터 멀어지는 것으로, 풀 루트 바이너리 트리(즉, 각 비리프 노드가 정확히 2개의 아이를 가지는 루트 트리)로 변환할 수 있다.반대로 풀루트 바이너리 트리는 루트 노드를 삭제하고, 그 두 아이 사이의 경로를 단일 무방향 에지로 대체하며, 그래프 내의 나머지 에지의 방향을 억제함으로써 비루트 바이너리 트리로 변환할 수 있다.이 때문에 n개의 [1]잎을 가진 풀루트 바이너리 트리가 n개의 잎을 가진 비루트 바이너리 트리보다 정확히 2n-3배 많다.

계층 클러스터링

오브젝트 집합의 계층적 클러스터링은 두 집합이 교차하지 않는 오브젝트 집합의 최대 패밀리로서 공식화될 수 있다.즉, 패밀리의 2개의 세트 S와 T에 대해 ST가 분리되거나 한쪽이 다른 쪽의 서브셋이며, 이 속성을 유지하는 동안에는 패밀리에 더 이상의 세트를 추가할 수 없습니다.T가 비루트 바이너리 트리인 경우, 리프의 계층적 클러스터링을 정의합니다.T의 각 에지(u, v)에는 v보다 u에 가까운 리프로 구성된 클러스터가 있으며, 이러한 세트는 빈 세트 및 모든 리프의 세트와 함께 최대 비교차 패밀리를 형성합니다.반대로, n개의 요소 세트에 걸친 임의의 최대 비교차 집합 패밀리로부터, 모든 [2]요소를 함께 커버하는 패밀리내의 3중(A,B,C) 마다 노드를 가지는 독자적인 비교차 이진 트리를 형성할 수 있다.

진화목

진화론의 단순한 형태에 따르면, 생명의 역사는 각 노드가 종을 묘사하고, 잎은 오늘날 존재하는 종을 나타내고, 가장자리는 종 사이의 조상-후예 관계를 나타내는 계통수로서 요약될 수 있다.이 나무는 조상부터 후손까지 자연배향과 공통 조상에 뿌리를 두고 있기 때문에 뿌리가 있는 나무입니다.그러나 이진 트리를 재구성하는 일부 방법에서는 이 트리의 노드와 가장자리만 재구성할 수 있으며 방향은 재구성할 수 없습니다.

예를 들어, 최대 절약같은 클래디스트 방법은 종의 특징을 설명하는 이진 속성 세트를 데이터로 사용합니다.이 방법들은 내부 노드에도 피쳐로 라벨이 붙여진 리프로서 지정된 종(種)을 가진 트리를 찾고 트리의 가장자리 2개의 엔드포인트 중 1개에만 일부 피쳐가 존재하는 횟수를 최소화하려고 시도합니다.각 피쳐에는 1개의 가장자리만 있는 것이 이상적입니다.트리의 루트를 변경해도 이 수의 에지 차이는 변경되지 않으므로, 근소한 값에 기반한 메서드는 트리 루트의 위치를 결정할 수 없으며 루트되지 않은 트리, 종종 루트되지 않은 이진 [3]트리를 생성합니다.

또한 뿌리 없는 이진수는 4엽종별로 이들 4종의 진화를 기술하는 뿌리 없는 이진수를 지정하는 4엽종 데이터에 기초하여 진화수를 추론하는 방법과 나무 [4]사이의 거리를 측정하는 4엽종 거리를 사용하는 방법에 의해 생성된다.

분기 분해

비루트 바이너리 트리는 또한 주어진 그래프의 가장자리를 나타내는 잎을 가진 비루트 바이너리 트리를 형성함으로써 그래프의 분기 분해를 정의하는 데 사용됩니다.즉, 분기 분해는 그래프 가장자리의 계층적 클러스터링으로 볼 수 있습니다.분기 분해와 관련된 수치인 분기 폭은 트리 폭과 밀접하게 관련되어 있으며 [5]그래프에서 효율적인 동적 프로그래밍 알고리즘의 기초를 형성한다.

열거

계층적 클러스터링에서의 애플리케이션 때문에, 비루트 바이너리 트리의 가장 자연스러운 그래프 열거 문제는 n개의 라벨이 붙은 잎과 라벨이 없는 내부 노드를 가진 트리의 수를 세는 것이다.n개의 라벨이 붙은 의 비근원 2진수 트리는 n번째 잎을 라벨이 붙은 잎의 비근원 2진수 트리의 가장자리 가운데에 있는 새로운 노드에 접속함으로써 형성될 수 있다.n번째 노드를 부착할 수 있는 가장자리는 2n-5개이므로 n잎의 나무 수는 n-1잎의 나무 수보다 2n-5배 많다.따라서 n개의 레이블이 지정된 잎에 있는 나무 수는 이중 요인입니다.

[6]

2, 3, 4, 5, ...라는 라벨이 붙은 나뭇잎의 나무 수는

1, 1, 3, 15, 105, 945, 10395, 135135, 2027025, 34459425, ...(OEIS의 시퀀스 A001147).

기본적인 동등성

고정 Unrooted Binary Tree(UBT; 비루트 바이너리 트리) T의 리프 투 리프 경로 길이는 특정 리프를 다른 리프로 연결하는 T의 고유 경로에 속하는 에지 수를 인코딩합니다.예를 들어 오른쪽 이미지에 나타난 UBT를 참조하면 리프1과 2 사이의 2인 반면 리프1과 3 사이의 (\ 3이 됩니다.고정 UBT T 상의 특정 리프로부터의 경로 길이 시퀀스는 지정된 리프에서 나머지 모든 리프까지의 경로 길이를 부호화합니다.예를 들어 오른쪽 그림에 표시된 UBT를 참조함으로써 리프 1로부터의 패스렝스 시퀀스는 ( ,, p,, , ( ,3) ( \ ( _ { 1, , p _ { 1,, ) ( _ { , 3 )= 3 , 3 ) T의 ng번째 시퀀스 수집.

네 개의 잎이 있는 루트가 없는 이진 트리의 예제

Danielle Catanzaro, Raffaele PesentiLaurence Wolsey[7] n개의 잎으로 주어진 UBT를 인코딩하는 경로 길이 시퀀스 컬렉션이 특정 동등성을 충족해야 한다는 것을 보여주었다.

  • i ( i [ 1, n](\displaystyle }= (모든 i) [](\ i
  • i , j ,{ style _ { , j } = p { , } 、 [ , n : \ i , \ 1, ] : \ j }
  • i + { i k모든i,j,[ 1 , ]): jk (i : k k \ \ \ neq \ \ k}
  • / p , = / \ _ { j=p _ { i , = 1 [,] (이것은 Kraft - Mc Millan 부등식의 변형)
  • i= n= 1 p , / i , j= n- 3 { \{ i= { i = { i , j } /^{{ , j } = 2 -3[7]

이러한 동등성은 경로 길이 [7]수집이 n개의 리프로 UBT를 인코딩하기 위해 필요하고 독립적인 것으로 증명되었습니다.그것들도 충분한지는 현재 알려져 있지 않다.

대체 이름

뿌리가 없는 이진수는 자유 이진수,[8] 입방수,[9] 삼원수[5],[10] 삼원수로도 불린다.그러나 "자유 이진 트리"라는 이름은 2단계 노드를[11] 가질 수 있는 루트 트리 및 순서 없는 하위 [12]노드를 가진 루트 이진 트리에도 적용되었으며, "삼원 트리"라는 이름은 노드당 하위 노드가 3개인 루트 트리를 의미하기 위해 더 자주 사용됩니다.

메모들

  1. ^ a b c 퍼나스(1984년).
  2. ^ 예를 들어,Eppstein(2009)은 클러스터와 트리 간에 동일한 대응관계를 가지지만 루트되지 않은 트리 대신 루트 이진 트리를 사용하여 루트 노드의 임의 선택을 포함한다.
  3. ^ Hendy & Penny (1989)
  4. ^ 세인트 존 외 (2003년).
  5. ^ a b Robertson & Seymour (1991)
  6. ^ 제모, 비숍 & 캐닝(2007)
  7. ^ a b c d Catanzaro D, Pesenti R, Wolsey L (2020). "On the Balanced Minimum Evolution Polytope". Discrete Optimization. 36: 100570. doi:10.1016/j.disopt.2020.100570. S2CID 213389485.
  8. ^ Czumaj & Gibbons (1996)
  9. ^ 엑수(1996년).
  10. ^ Cilibrasi & Vitanyi (2006년).
  11. ^ Harary, Palmer & Robinson(1992)
  12. ^ Przyticka & Larmore(1994년).

레퍼런스