컬러 코딩

컴퓨터 과학과 그래프 이론에서 컬러 코딩이라는 용어는 네트워크 모티브의 발견에 유용한 알고리즘 기법을 가리킨다. 예를 들어 특정 그래프에서 길이 $k$ 의 단순한 경로를 검출하는 데 사용할 수 있다. 전통적인 컬러 코딩 알고리즘은 확률론적이지만 러닝타임에 큰 오버헤드 없이 디랜덤화될 수 있다.

색상 코딩은 주어진 길이의 사이클 검출에도 적용되며, 보다 일반적으로 탐지하려는 서브그래프 패턴이 경계 트리폭을 가질 때 다항 시간 알고리즘을 산출하는 서브그래프 이형성 문제(NP-완전성 문제)에도 적용된다.

컬러 코딩 방식은 1994년 노가 알론, 라파엘 유스터, 우리 즈윅 등이 제안해 분석했다.^[1]^[2]

결과.

색상 코딩 방법을 통해 다음과 같은 결과를 얻을 수 있다.

모든 고정 상수 $k$ 에 대해 그래프 $G =$ ( $V,$ $E)$ 에 k $크기$ 의 단순한 주기가 포함된 경우, 그러한 주기는 다음에서 찾을 수 있다.
- $O(V^{\omega })$ ( $O(V^{\omega })$ $O(V^{\omega })$ ) ${\displaystyle O(V^{\omega }})$ 예상 $O(V^{\omega })$ 시간 또는
- $O(V^{\omega }\log V)$ $O(V^{\omega }\log V)$ $O(V^{\omega }\log V)$ $O(V^{\omega }\log V)$ $O(V^{\omega }\log V)$ ) $O(V^{\omega }\log V)$ 최악의 $O(V^{\omega }\log V)$ 경우, 여기서 $Ω$ 은 행렬 곱셈의 지수다.^[3]
모든 고정 상수 $k$ 와 비교 부 폐쇄 그래프 계열(예: 평면 그래프)에 있는 모든 $그래프$ G $=$ ( $V,$ $E)$ 에 대해 $G$ 가 단순한 크기 $k$ 사이클을 포함하는 경우, 다음에서 그러한 사이클을 찾을 수 있다.
- $O (V)$ 예상 시간 또는
- $O (V$ $로그$ V $)$ 최악의 경우.
그래프 $G =$ ( $V,$ $E)$ 에 $O (log$ $V)$ 정점이 있는 경계 트리 너비 그래프에 대해 이형성이 있는 하위 그래프가 포함된 경우 다항 시간에서 이러한 하위 그래프를 찾을 수 있다.

방법

To solve the problem of finding a subgraph $H=(V_{H},E_{H})$ in a given graph $G = (V, E)$ , where $H$ can be a path, a cycle, or any bounded treewidth graph where $V_{H} =O(\log V)$ , the method of color-coding begins by randomly coloring each vertex of G( $k=|V_{H}|$ = $k=|V_{H}|$ H $displaystyle k= V_{H}}$ 컬러를 $k=|V_{H}|$ 가진 다음 컬러 $G$ 에서 $화려한$ 색상의 H 카피를 찾으려고 한다. 여기서, 그 안에 있는 모든 꼭지점이 뚜렷한 색으로 색칠되면 그래프가 다채롭다. 이 방법은 (1) 무작위로 그래프를 색칠하고 (2) 대상 서브그래프의 화려한 사본을 찾아내는 것을 반복하는 방식으로 작동하며, 결국 그 과정을 충분히 반복하면 대상 서브그래프를 찾을 수 있다.

$G$ 에서 $H$ 의 복사본이 0이 아닌 확률 $p$ 와 함께 다채로워진다고 가정하자. 그것은 즉시는 만일 가장 임의에 색을 내는 것 반복되.mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output.sfrac.tion,.mw-parser-output.sfrac .tion{디스플레이:inline-block, vertical-align:-0.5em, font-size:85%;text-align:센터}.mw-parser-output.sfrac .num,.mw-parser-output.sfrac .den{디스플레이:블록, line-height:1em, 마진:00.1em}.m 따른다.W-parser-output.sfrac .den{border-top:1px 고체}.mw-parser-output .sr-only{국경:0;클립:rect(0,0,0,0), 높이:1px, 마진:-1px, 오버 플로: 숨어 있었다. 패딩:0;위치:절대, 너비:1px}1/p번, 이 복사본 한 때 다채롭게 될 것으로 예상된다. $p$ 는 작지만, $|V_{H}|=O(\log V)$ H = $|V_{H}|=O(\log V)$ V $|V_{H}|=O(\log V)$ ) $|V_{H}|=O(\log V)$ {\ $displaystyle V_{H}$ = $O(\log$ V $|V_{H}|=O(\log V)$ , $p$ 는 다항식적으로 작을 뿐임을 알 수 있다. $G$ 의 각 꼭지점을 $K$ 색상 중 하나에 매핑하는 그래프 $G$ 와 색상이 주어진 경우, 어떤 런타임 $O (r$ ) 내에서 화려한 $H$ 의 복사본을 찾는 알고리즘이 존재한다고 가정하자 $.$ 그런 $다음$ $G$ 에서 H 사본을 찾을 것으로 예상되는 $O({\tfrac {r}{p}})$ 은 O $O({\tfrac {r}{p}})$ ( $O({\tfrac {r}{p}})$ p ) $O({\tfrac {r}{p}})$ {\ $displaystyle O({\tfrac {r}{p}})}$ 입니다 $O({\tfrac {r}{p}})$

때로는 좀 더 제한된 버전의 화려함을 사용하는 것도 바람직하다. 예를 들어 평면 그래프의 사이클을 찾는 맥락에서 양호한 색상의 사이클을 찾는 알고리즘을 개발할 수 있다. 여기서, 주기는 그것의 정점이 연속된 색으로 색칠되면 잘 색칠된다.

예

그래프 $G =$ ( $V,$ $E$ )에서 길이 $k$ 의 단순한 주기를 찾는 것이 그 예일 것이다 $.$

무작위 색소법을 적용하면 각 단순주기는 $k!/k^{k}>e^{-k}$ / $k!/k^{k}>e^{-k}$ > $k!/k^{k}>e^{-k}$ - $k!/k^{k}>e^{-k}$ ${\$ $k$ $!/k^{$ $k}}}}$ $주기$ 에 k $k^{k}$ $정점$ 을 색칠하는 $k^{k}$ 이 $k^{k}$ 있고, 그 중에는 $k!$ ${\displaysty k^!}$ 의 $k!$ 색소 발생이 있기 때문에 k $!$ / k > e - k > e - displaysty sty colornow. 그런 다음 알고리즘(다음 설명)을 사용하여 시간 $O(V^{\omega })$ $O(V^{\omega })$ ) ${\displaystyle O(V^{\omega$ $O(V^{\omega })$ 의 랜덤 색상 그래프 $G$ 에서 다채로운 주기를 찾을 수 있으며, 여기서 $\omega$ ${\displaystyle$ \ $omega }$ 은 $\omega$ 행렬 곱셈 상수다. 따라서 $G$ 에서 길이 $k$ 의 단순한 주기를 찾으려면 전체 $e^{k}\cdot O(V^{\omega })$ 시간 $e^{k}\cdot O(V^{\omega })$ $e^{k}\cdot O(V^{\omega })$ k $e^{k}\cdot O(V^{\omega })$ o O $e^{k}\cdot O(V^{\omega })$ Ω $e^{k}\cdot O(V^{\omega })$ {\ $displaystyle e^{k}\cdot$ O $(V^{\omega })$ 가 소요된다.

컬러풀한 사이클 탐색 알고리즘은 $먼저$ 길이 $k$ - 1의 단순한 경로로 연결된 $V$ 의 모든 꼭지점 쌍을 찾아 각 쌍의 두 꼭지점이 연결되어 있는지 확인하는 방식으로 작동한다. 컬러 그래프 $G$ 에 색상 함수 $c$ → ${1$ , $...,$ k $}$ 을(를) 지정하면 색상 집합 { $1, ...,$ $k}$ 의 모든 파티션을 각각 k/ $k/2$ $k/2$ 의 $k/2$ $C 2,$ 2 ${\displaystyle k/2$ }의 $k/2$ 두 하위 $집합$ 으로₁ 열거하십시오 $k/2$ 이에 따라 $V$ 는 $V$ 와₁ $V$ 로₂ 나눌 수 있으며, $G$ 와₁₂ G는 $각각 1$ $V$ 와₂ V가 유도하는 서브그래프를 나타내도록 한다. $그런 1$ 다음 $k/2-1$ 와 $k/2-1$ $k/2-1$ 에서 $k/2-1$ k $k/2-1$ / 2 $k/2-1$ 1의 $다채로운 경로$ 를 재귀적으로 찾는다 $.$ 부울 행렬 $A$ 와₁ $A$ 가₂ 각각 다채로운 경로에 $의해 1$ G와 $G$ 의₂ 각 꼭지점 쌍의 연결을 $나타내며$ , $B$ 를₁ V의 꼭지점과 $V$ 의₂ 꼭지점 사이의 인접 관계를 설명하는 행렬로 가정하자, 부울 제품 $A_{1}BA_{2}$ $A_{1}BA_{2}$ B $A_{1}BA_{2}$ 2 ${\$ $BA_{2}}:$ $V$ 의 모든 꼭지점 쌍은 길이 $k$ - $1$ 의 화려한 경로로 연결된다 $A_{1}BA_{2}$ . Thus, the recursive relation of matrix multiplications is $t(k)\leq 2^{k}\cdot t(k/2)$ , which yields a runtime of $2^{O(k)}\cdot V^{\omega }=O(V^{\omega })$ . Although this algorithm finds only the end points of the colorful path, a알론과 나오르가^[4] 직접 다채로운 경로를 찾아내는 노처 알고리즘이 그 안에 통합될 수 있다.

디랜도믹스

색상 코딩의 디랜도믹스는 더 이상 색상 $G$ 의 무작위성이 필요하지 않도록 그래프 $G$ 의 가능한 색상을 열거하는 것을 포함한다. $G$ 의 대상 서브그래프 $H$ 를 발견할 수 있으려면, $열거$ 에 H가 다채로운 경우를 적어도 하나 이상 포함해야 한다. 이를 위해서는 ${1, ..., V$ }에서 ${$ 1, $...,$ k $}$ 까지의 해시함수의 k-퍼펙트 패밀리 $F$ 를 열거하면 충분하다. 정의에 따르면, { $1, ..., V$ }의 모든 부분 집합 $S$ 에 $|S|=k$ , S = $|S|=k$ k = $|S|=k$ {\ $displaystyle$ S = $k$ $F$ 에h : $S$ → {1, ..., $k}$ 이(가) 완벽하다는 해시함수 $h$ 가 존재한다면 $F$ 는 k-완벽하다. 즉, 주어진 $k$ 정점에 $k$ 구별되는 색상으로 색칠하는 해시함수가 $F$ 에 존재해야 한다.

이러한 k-퍼펙트 해시 패밀리를 구성하기 위한 몇 가지 접근법이 있다.

최고의 명시적 구성은 모니나오르, 레너드 J. 슐만, 아라빈드 스리니바산(Aravind Srinivasan)에 의해 이루어지며,^[5] 여기서 크기 $e^{k}k^{O(\log k)}\log |V|$ $e^{k}k^{O(\log k)}\log |V|$ $e^{k}k^{O(\log k)}\log |V|$ $e^{k}k^{O(\log k)}\log |V|$ ) $e^{k}k^{O(\log k)}\log |V|$ $displaystyle e^{k}k^{O(\log k)}\log$ V $}$ 를 얻을 수 있다 $e^{k}k^{O(\log k)}\log |V|$ . 이 구조는 원래 서브그래프 문제점에 대상 서브그래프가 존재할 필요가 없다.
지넷 P의 또 다른 노골적인 건축. 슈미트와 앨런 시겔은^[6] 크기가 $2^{O(k)}\log ^{2}|V|$ $2^{O(k)}\log ^{2}|V|$ ( $2^{O(k)}\log ^{2}|V|$ ) $2^{O(k)}\log ^{2}|V|$ 2 $2^{O(k)}\log ^{2}|V|$ V $displaystyle 2^{O(k)}\log ^{2$ } $V$ }인 패밀리를 산출한다 $2^{O(k)}\log ^{2}|V|$
노가 알론 외 ^[2]원지에 등장하는 또 다른 구조는 먼저 {1, $..., V$ }을(를) ${$ 1, $...,$ $...,$ $k 2}$ 을(를) 맵핑하는 k-퍼펙트 패밀리를 구축한 다음 {1, $...,$ $k 2$ $}$ 을(를 $)$ 맵핑하는 또 다른 k-퍼펙트 패밀리를 구축함으로써 얻을 수 있다. 첫 번째 단계에서는 $거의$ 2log k-wise 독립된 $2nlog$ k $랜덤$ 비트를 가진 그러한 패밀리를 구성할 수 있으며,^[7]^[8] 그러한 랜덤 비트를 생성하는 데 필요한 샘플 공간은 k $k^{O(1)}\log |V|$ 1 ) $k^{O(1)}\log |V|$ V $displaystyle$ k $^{O(1)}\log$ V $}$ 만큼 작을 수 있다 $k^{O(1)}\log |V|$ 두 번째 단계에서는 제넷 P가 보여주었다. Schmidt and Alan Siegel^[6] that the size of such $k$ -perfect family can be $2^{O(k)}$ . Consequently, by composing the $k$ -perfect families from both steps, a $k$ -perfect family of size $2^{O(k)}\log V$ that maps from ${1, ..., V}$ to ${1, ..., k}$ can be obtained.

서브그래프의 각 꼭지점이 연속적으로 색칠되는 웰컬러링의 경우 $, {$ 1, $..., V$ }부터{ $1$ , $...,$ $k!}$ 까지의 k-완벽한 해시함수 계열이 필요하다. ${1$ , $..., V$ }에서 ${$ 1, $...,$ $k k}$ 까지 매핑되는 충분한 k-퍼펙트 패밀리는 위의 접근 3(첫 번째 단계)과 유사한 방법으로 구성할 수 있다. 특히 $klog$ $k$ 에 거의 독립적인 $nklog$ $k$ 랜덤비트를 사용하여 수행되며, 결과 k-perfect 패밀리의 $k^{O(k)}\log |V|$ 는 k $k^{O(k)}\log |V|$ k ) 로그 $k^{O(k)}\log |V|$ $k^{O(k)}\log |V|$ {\ $displaystyle k^{O(k)}\log$ V $k^{O(k)}\log |V|$ }가 된다 $k^{O(k)}\log |V|$

컬러 코딩 방식의 디랜도메이션을 쉽게 병렬화할 수 있어 효율적인 NC 알고리즘이 가능하다.

적용들

최근 생물정보학 분야에서 컬러 코딩이 많은 관심을 끌고 있다. 단백질-단백질 상호작용(PPI) 네트워크에서 신호 경로 검출이 한 예다. 또 다른 예는 PPI 네트워크에서 모티브의 수를 발견하고 세는 것이다. 신호 경로와 모티프를 모두 연구하면 유기체들 사이의 많은 생물학적 기능, 과정, 구조들의 유사점과 차이점을 더 깊이 이해할 수 있다.

수집할 수 있는 유전자 데이터의 양이 많기 때문에 경로나 모티브를 찾는 데 많은 시간이 소요될 수 있다. 단, 컬러 코딩 방법을 활용함으로써, $k=O(\log n)$ 이 $n$ 인 네트워크 $G$ 에서 k $k=O(\log n)$ = O $k=O(\log n)$ $k=O(\log n)$ $k=O(\log n)$ $k=O(\log n)$ 정점을 $k=O(\log n)$ 가진 모티브나 신호 경로를 다항식 시간대에 매우 효율적으로 찾을 수 있다. 그러므로, 이것은 PPI 네트워크에서 더 복잡하거나 더 큰 구조를 탐구할 수 있게 해준다.

추가 읽기

Alon, N.; Dao, P.; Hajirasouliha, I.; Hormozdiari, F.; Sahinalp, S. C. (2008). "Biomolecular network motif counting and discovery by color coding". Bioinformatics. 24 (13): i241–i249. doi:10.1093/bioinformatics/btn163. PMC 2718641. PMID 18586721.
Hüffner, F.; Wernicke, S.; Zichner, T. (2008). "Algorithm Engineering for Color-Coding with Applications to Signaling Pathway Detection". Algorithmica. 52 (2): 114–132. CiteSeerX 10.1.1.68.9469. doi:10.1007/s00453-007-9008-7.

참조

^ 알론, N, 유스터, R, 그리고 Zwick, U. 1994. 색상 코드: 큰 그래프 내에서 간단한 경로, 주기 및 기타 작은 하위 그래프를 찾는 새로운 방법. 컴퓨팅 이론에 관한 제26회 ACM 연례 심포지엄의 진행에서 (1994년 5월 23~25일, 캐나다 퀘벡 주 몬트리얼) STOC 94. ACM, 뉴욕, 뉴욕 326–335 DOI= http://doi.acm.org/10.1145/195058.195179
^ ^a ^b 1995년 알론, N, 유스터, R, Zwick, 컬러 코딩 J. ACM 42, 4 (1995년 7월), 844–856. DOI= http://doi.acm.org/10.1145/210332.210337
^ 코퍼스미스-위노그라드 알고리즘
^ Alon, N. and Naor, M. 1994 Derandomization, Boolean Matrix 곱셈과 완벽한 해시함수의 구축을 위한 증인. 기술 보고서. UMI 주문 번호: CS94-11, 이스라엘의 바이즈만 사이언스 프레스.
^ Naor, M, Schulman, L. J, 그리고 Srinivasan, A. 1995. 스플리터 및 최적화에 가까운 디랜도메이징. 제36회 컴퓨터 과학의 기초에 관한 심포지엄의 진행 (1995년 10월 23일~25일)에서. FOCS. IEEE 컴퓨터 협회, 워싱턴 DC, 182.
^ ^a ^b Schmidt, J. P.; Siegel, A. (1990). "The spatial complexity of oblivious k-probe Hash functions". SIAM J. Comput. 19 (5): 775–786. doi:10.1137/0219054.
^ Naor, J., Naor, M. 1990. 소규모의 확률 공간: 효율적인 구성 및 적용. 컴퓨터 이론에 관한 22차 연례 ACM 심포지엄의 진행에서(Baltimore, Maryland, Maryland, 1990년 5월 13-17일) H. 오르티즈, 에드. STOC 90 ACM, 뉴욕, 뉴욕 213-223 DOI= http://doi.acm.org/10.1145/100216.100244
^ 알론, N, 골드리히, O, 헤스타드, J, 페랄타, R. 1990. 거의 k-wise 독립 랜덤 변수의 단순한 구성. 제31회 컴퓨터 과학의 기초에 관한 연례 심포지엄의 진행 (1990년 10월 22일–24일)에서. SFCS. IEEE 컴퓨터 협회, 워싱턴 DC, 544-553 vol.2. doi:10.1109/FSCS. 1990.89575

[1] 알론, N, 유스터, R, 그리고 Zwick, U. 1994. 색상 코드: 큰 그래프 내에서 간단한 경로, 주기 및 기타 작은 하위 그래프를 찾는 새로운 방법. 컴퓨팅 이론에 관한 제26회 ACM 연례 심포지엄의 진행에서 (1994년 5월 23~25일, 캐나다 퀘벡 주 몬트리얼) STOC 94. ACM, 뉴욕, 뉴욕 326–335 DOI= http://doi.acm.org/10.1145/195058.195179

[orig-2] 1995년 알론, N, 유스터, R, Zwick, 컬러 코딩 J. ACM 42, 4 (1995년 7월), 844–856. DOI= http://doi.acm.org/10.1145/210332.210337

[3] 코퍼스미스-위노그라드 알고리즘

[4] Alon, N. and Naor, M. 1994 Derandomization, Boolean Matrix 곱셈과 완벽한 해시함수의 구축을 위한 증인. 기술 보고서. UMI 주문 번호: CS94-11, 이스라엘의 바이즈만 사이언스 프레스.

[5] Naor, M, Schulman, L. J, 그리고 Srinivasan, A. 1995. 스플리터 및 최적화에 가까운 디랜도메이징. 제36회 컴퓨터 과학의 기초에 관한 심포지엄의 진행 (1995년 10월 23일~25일)에서. FOCS. IEEE 컴퓨터 협회, 워싱턴 DC, 182.

[SS90-6] Schmidt, J. P.; Siegel, A. (1990). "The spatial complexity of oblivious k-probe Hash functions". SIAM J. Comput. 19 (5): 775–786. doi:10.1137/0219054.

[7] Naor, J., Naor, M. 1990. 소규모의 확률 공간: 효율적인 구성 및 적용. 컴퓨터 이론에 관한 22차 연례 ACM 심포지엄의 진행에서(Baltimore, Maryland, Maryland, 1990년 5월 13-17일) H. 오르티즈, 에드. STOC 90 ACM, 뉴욕, 뉴욕 213-223 DOI= http://doi.acm.org/10.1145/100216.100244

[8] 알론, N, 골드리히, O, 헤스타드, J, 페랄타, R. 1990. 거의 k-wise 독립 랜덤 변수의 단순한 구성. 제31회 컴퓨터 과학의 기초에 관한 연례 심포지엄의 진행 (1990년 10월 22일–24일)에서. SFCS. IEEE 컴퓨터 협회, 워싱턴 DC, 544-553 vol.2. doi:10.1109/FSCS. 1990.89575

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Search

컬러 코딩

네임스페이스

더

목차

결과.

방법

예

디랜도믹스

적용들

추가 읽기

참조