분할 기반 개체 분류
Segmentation-based object categorization영상 분할 문제는 영상을 균질성 기준에 따라 여러 영역으로 분할하는 것과 관련이 있습니다.이 문서에서는 주로 최소 컷 또는 최대 컷을 통해 그래프 분할을 적용하는 이미지 분할에 대한 그래프 이론적 접근법에 대해 설명합니다.분할 기반 객체 분류는 영상 분할에 적용된 스펙트럼 클러스터링의 특정 사례로 볼 수 있습니다.
이미지 세그멘테이션 응용 프로그램
- 이미지 압축
- 이미지를 균일한 구성요소로 분할하고 각 구성요소에 가장 적합한 압축 알고리즘을 사용하여 압축을 개선합니다.
- 의료 진단
- 암 부위를 식별하기 위한 MRI 영상의 자동 분할.
- 매핑 및 측정
- 관심 영역을 식별하고 측정하기 위해 위성의 원격 감지 데이터를 자동으로 분석합니다.
- 교통.
- 트랜스포트 네트워크를 분할하면, 동종의 트래픽 [1]상태에 의해서 특징지어지는 영역을 식별할 수 있습니다.
정규화된 절단을 사용한 분할
그래프 이론 공식
임의 특징 공간의 점 세트는 가중치 무방향 완전 그래프 G = (V, E)로 나타낼 수 있으며, 여기서 그래프의 노드는 특징 공간의 점들이다.엣지 의 E ( E는 i(\ i와 jj의 유사함수입니다.이 경우 이미지 분할 문제를 분할 문제를 분할에 대한 그래프로 나타낼 수 있습니다. V({ V의 1, 、 k\ _ {1 \ , {} 。어떤 측정에 따르면 임의의 정점은 높은 유사성을 가지며, 2개의 { 의 정점은 유사성이 있습니다
정규화된 절단
G = (V, E, w)를 가중 그래프라고 하자.디스플레이 스타일 와 B B를 정점의 2개의 서브셋으로 .
다음 중 하나를 선택해주세요.
G{G\displaystyle}에 상처(S, S¯){\displaystyle(S,{\overline{S}})}에 대한 정규화된 삭감 approach,[2]에서ncut(S, S¯){\displaystyle \operatorname{ncut}(S,{\overline{S}})}일 경우 다른 부분 사이의 유사성을 측정하고 nassoc(S, S¯){\displaystyle \operatorname{nassoc}. (S,{\은는) 동일한 부품에 있는 정점의 총 유사도를 측정합니다.
( , S ) - ( , ) \ { } ( S , \} ) =- \{ ( , { \ )、 。 {S은는 ( S , ){ } ( {S을 최대화합니다
)、 S ¯、 ) ) { \ ( S { \ { }} { \ displaystyle \{ } ( 、 { \ { S} ) } } }} that that that that n n n n n n n n that n n n n n n n n n n n n n n 그러나 다항식 시간에는 스펙트럼 기법을 사용하여 작은 정규화 무게( S의 절단 { {\ {displaystyle ( {\을 찾을 수 있다.
ncut 알고리즘
다음 중 하나를 선택해주세요.
또한 D를n× d의 대각행렬로 하고 WW를 }=의n × W)의 대각행렬로 .
몇 가지 대수적 조작 후 다음과 같은 결과를 얻을 수 있습니다.
다음과 같은 제약에 따릅니다.
- i {, - { y _ { } \ \ { , - \}, 일정기간 동안- { - b }
T (- W ) Y Y(\{y}( {y^{y은(는) NP-hard입니다.문제를 다루기 쉽게 하기 위해 제약을 완화하고 실제 값을 취할 수 있도록 합니다이완된 문제는 두 번째로 작은 일반화 고유값의 일반화 고유값 문제- ) D \ = \ Dy }를 풀면 해결할 수 있다.
분할 알고리즘:
- 기능 세트가 지정되면 가중 G ( ,) { G = ( , ) 를 설정하고 각 모서리의 무게를 계산하여 D{\ D W {\ W 로 를 요약합니다.
- 두 번째로 작은 고유값을 갖는 고유 벡터에 대해 해결 - ) y \ =\ Dy
- 두 번째로 작은 고유값을 가진 고유 벡터를 사용하여 그래프를 양분합니다(예: 부호에 따라 그룹화).
- 현재 파티션을 세분화할지 여부를 결정합니다.
- 필요한 경우 분할된 부품을 반복적으로 분할합니다.
계산의 복잡성
모든 고유 벡터의 표준 고유값 문제(예를 들어 QR 알고리즘 사용)를 해결하려면 O { O시간이 됩니다.n n이영상의 픽셀 수인 영상 애플리케이션에는 적합하지 않습니다.
두 번째로 작은 일반화 고유값에 대응하는 고유벡터 1개만 미컷 알고리즘에 의해 사용되므로 예를 들어 Lancz에서 행렬 W를 명시적으로 조작하거나 계산하지 않고 대응하는 고유값 문제를 행렬이 없는 방식으로 해결하면 효율을 극적으로 향상시킬 수 있다.os 알고리즘.행렬이 없는 방법은 모든 반복에서 주어진 벡터에 대해 행렬 벡터 곱을 수행하는 함수만 필요로 합니다.이미지 분할의 경우 매트릭스 W는 일반적으로 0이 아닌 O {n { O(n)} { O 이 걸립니다
고해상도 영상의 경우 두 번째 고유값이 종종 잘못된 조건을 충족하므로 Lanczos 알고리즘과 같은 반복 고유값 솔버의 수렴이 느려집니다.프리컨디셔닝은 예를 들어 매트릭스 프리 LOBPCG 방법에서 컨버전스를 가속화하는 핵심 기술입니다.최적으로 사전 조정된 행렬이 없는 방법을 사용하여 고유 벡터를 계산하려면 O( ) { O ( )} 시간이 되며, 이는 고유 벡터에는n개의 { n개의 구성요소가 때문에 최적의 복잡도입니다.
소프트웨어 구현
Scikit-learn은[3] 에서 처음 제안되고 실제 [6]및 에서 테스트된 것처럼 스펙트럼 그래프 분할을 통해 이미지 분할을 수행하는 그래프 라플라시안의 고유값 문제를 해결하기 위해 대수적 멀티그리드 사전 조건과 함께 SciPy의 LOBPCG를 사용한다.
OBJ 컷
OBJ[7] CUT은 객체를 자동으로 분할하는 효율적인 방법입니다.OBJ CUT 메서드는 일반적인 메서드이므로 모든 오브젝트카테고리 모델에 적용할 수 있습니다.이미 알려진 오브젝트 카테고리의 인스턴스, 예를 들어 소를 포함하는 화상 D가 주어졌을 때, OBJ CUT 알고리즘은 오브젝트의 분할을 계산한다.즉, 라벨 세트 m을 추론한다.
m을 바이너리 라벨 세트, { 를 쉐이프 파라미터로 합니다( { \ Theta}는 LPS 모델의 라벨 앞에 있는 쉐이프입니다).에너지 E ( ,) { E ( , \ ) }는 다음과 같이 정의됩니다.
- ( , ( m ) + x ( x ) + y ( m , y) + ( , ) E ( m , \ ) = \ \ _ { x} ( D }
( x) + ( m ){ _ {} ( D mx } ) + \ _ x} ( _ \Theta )는 단항이라고 불리며, y (, ) + , )단항은 색상에 따른 우도 x ( ) \ style \ { } ( D m { ) from from from from from from a a a a ( _ { \ )로 구성됩니다. style.y _ 및 x y입니다.
The best labeling minimizes , where is the weight of the parameter .
- _ (2)
알고리즘.
- 이미지 D가 주어지면 소나 말 등의 오브젝트 카테고리가 선택된다.
- 대응하는 LPS 모델이 D에 매칭되어 1, s \ \ {1}, \ \ { s}가 취득됩니다.
- 식 (2)에서 주어진 목적 함수는 E i { E_{를 계산하고 i {}=_{ Z를 하여 구한다.
- 분할 m을 얻기 위해 단일 MINCUT 연산을 사용하여 목적 함수를 최소화합니다.
기타 접근법
- 직소[8] 어프로치
- 이미지 해석
- 인터리브 세그멘테이션
- 위치
- 레이아웃 CRF
- 최소 스패닝 트리 기반 세그멘테이션
레퍼런스
- ^ Lopez, Clélia; Leclercq, Ludovic; Krishnakumari, Panchamy; Chiabaut, Nicolas; Van Lint, Hans (25 October 2017). "Revealing the day-to-day regularity of urban congestion patterns with 3D speed maps". Scientific Reports. 7 (14029): 14029. doi:10.1038/s41598-017-14237-8. PMC 5656590. PMID 29070859.
- ^ Jianbo Shi와 Jitendra Malik(1997): "정규화된 절단 및 이미지 분할", 컴퓨터 비전과 패턴 인식에 관한 IEEE 컨퍼런스, 페이지 731-737
- ^ "Spectral Clustering — scikit-learn documentation".
- ^ Knyazev, Andrew V. (2003). Boley; Dhillon; Ghosh; Kogan (eds.). Modern preconditioned eigensolvers for spectral image segmentation and graph bisection. Clustering Large Data Sets; Third IEEE International Conference on Data Mining (ICDM 2003) Melbourne, Florida: IEEE Computer Society. pp. 59–62.
- ^ Knyazev, Andrew V. (2006). Multiscale Spectral Image Segmentation Multiscale preconditioning for computing eigenvalues of graph Laplacians in image segmentation. Fast Manifold Learning Workshop, WM Williamburg, VA. doi:10.13140/RG.2.2.35280.02565.
- ^ Knyazev, Andrew V. (2006). Multiscale Spectral Graph Partitioning and Image Segmentation. Workshop on Algorithms for Modern Massive Datasets Stanford University and Yahoo! Research.
- ^ M. P. 쿠마, P. H. S. 토르, A.지저맨.오비컷샌디에이고, 컴퓨터 비전과 패턴 인식에 관한 IEEE 회의의 진행(Presidings of Computer Vision and Pattern Recognition), 2005년 18~25페이지.
- ^ E. Borenstein, S. Ulman:클래스 고유의 하향식 세그먼트화.덴마크 코펜하겐에서 열린 제7차 유럽 컴퓨터 비전 회의의 속행(Presidings of the 7th European Conference on Computer Vision), 109~124쪽, 2002년.
- ^ Z. Tu, X. Chen, A. L. Yuille, S. C. Zhu: 이미지 해석: 세그먼트화, 검출, 인식의 통합.카테고리 레벨 객체 인식 2006: 545 ~576
- ^ B. Leibe, A.레너디스, B실레:결합된 객체 분류 및 분할을 위한 암묵적 형상 모델입니다.카테고리 레벨 객체 인식 2006: 508~524
- ^ J. 윈, N. JoijicLocus: 감독되지 않은 분할을 사용하는 학습 객체 클래스입니다.「IEEE 국제 컴퓨터 비전 회의의 속행」, 2005년.
- ^ J. M. 윈, J. 쇼튼:부분적으로 가려진 객체를 인식 및 분할하기 위한 레이아웃 일관성 랜덤 필드입니다.CVPR (1) 2006: 37 ~44
