블럽 검출

Blob detection

컴퓨터 비전에서 블럽 검출 방법은 디지털 이미지에서 주변 영역과 비교하여 밝기나 색상 등의 특성이 다른 영역을 검출하는 것을 목적으로 합니다.비공식적으로 블럽은 일부 특성이 일정하거나 거의 일정한 이미지의 영역입니다. 블럽의 모든 점은 어떤 의미에서 서로 유사하다고 볼 수 있습니다.BLOB 검출의 가장 일반적인 방법은 컨볼루션입니다.

이미지상의 위치 함수로 표현되는 관심 특성이 주어졌을 때, 블럽 검출기에는 (i) 위치에 관한 함수의 파생물에 기초한 미분 방법과 (ii) 함수의 국소 최대값과 최소값을 찾는 데 기초하는 국소 극단값 기초한 방법 두 가지 주요 클래스가 있다.현장에서 사용된 최신 용어를 사용하여 이러한 검출기를 관심점 연산자 또는 관심 영역 연산자로 지칭할 도 있다(관심점 검출코너 검출 참조).

블롭 검출기를 연구하고 개발하는 데는 몇 가지 동기가 있다.한 가지 주된 이유는 에지 검출기 또는 코너 검출기에서 얻을 수 없는 영역에 대한 보완 정보를 제공하기 위함이다.이 영역의 초기 작업에서는 블롭 검출을 사용하여 추가 처리를 위한 관심 영역을 확보했습니다.이러한 영역은 객체 인식 및/또는 객체 추적에 대한 응용 프로그램으로 이미지 도메인에서 객체 또는 객체의 일부의 존재를 알릴 수 있습니다.히스토그램 분석과 같은 다른 영역에서는 분할 적용 시 피크 검출에도 블럽 기술자를 사용할 수 있습니다.BLOB 기술자의 또 다른 일반적인 용도는 텍스처 분석 및 텍스처 인식의 주요 프리미티브로 사용됩니다.보다 최근의 연구에서 BLOB 기술자는 로컬 이미지 통계에 기초한 외관 기반 객체 인식을 위한 정보 이미지 기능의 존재를 알리기 위해 광범위한 베이스라인 스테레오 매칭을 위한 관심 포인트로 점점 더 많이 사용되고 있다.또한 길쭉한 물체의 존재를 알리는 능선 검출의 관련 개념도 있다.

가우스의 라플라시안

가장 일반적인 최초의 블럽 검출기 중 하나는 가우스(LoG)의 라플라시안(Laplacian)을 기반으로 합니다.입력 f ,) { f가 지정되면 이 이미지는 가우스 커널에 의해 컨볼루션됩니다.

특정 에서L( , ; ) ( , , ) f( , ) f ( x , y ) \ L ( ; t=( x , y, t )* f ( x , y ) g ( x , y ) 。그러면 라플라시안 연산자를 적용한 결과

계산되며, 이는 일반적으로 t {\ r2차원 영상의 r {\ r 어두운 블롭에 대해 강한 양성 반응을 보이고 유사한 크기의 밝은 블롭에 대해 강한 음성 반응을 나타낸다.그러나 이 연산자를 단일 스케일로 적용할 때 가장 큰 문제는 연산자 응답이 이미지 영역 내 블럽 구조의 크기와 사전 평활에 사용되는 가우스 커널 크기 사이의 관계에 크게 의존한다는 것입니다.따라서 이미지 도메인에서 크기가 다른(알 수 없는) 블럽을 자동으로 캡처하려면 멀티스케일 접근법이 필요합니다.

자동 스케일 선택으로 멀티 스케일 블럽 검출기를 얻는 간단한 방법은 스케일 정규화된 라플라시안 연산자를 고려하는 것이다.

그리고 공간과 스케일에 대해θ r L(\ _}^{2 국소 최대/미니마스케일 공간 최대/미니마를 검출한다(Lindeberg 1994, 1998).따라서 이산 2차원 입력 f { f)} {displaystyle f(x, )} { y t { L(x, y, {displaystyle L, t)} {displaysty} 이 지점의 값이 인접 26의 값보다 크면 밝은(작은) 블럽으로 간주됩니다.따라서 관심 포인트 , , {\ t 동시에 선택할 수 있습니다.

, ; ) ( , ;) (, ;t) ( { \ { } , { \ { y } ; { \ hat { t} ; { \ \{} _ {}_ { r } ( \ ) _ { la )

이 블럽 개념은 "블럽" 개념에 대한 간결하고 수학적으로 정확한 운영 정의를 제공하므로 블럽 검출을 위한 효율적이고 강력한 알고리즘으로 직접 연결됩니다.정규화된 라플라시안 연산자의 축척 공간 최대값에서 정의된 블럽의 몇 가지 기본 특성은 반응이 영상 영역의 변환, 회전 및 재스케일링과 공변한다는 것입니다. ( x 0, 0 ; ){( , _ { } ; t { } )포인트에서 스케일 공간 최대값을 가정한 경우, 계수 s { \ s}에 의한 이미지 재스케일링 아래에서는 ( x , y ; 0 ), s 0 ; t_\ s \ s\x style s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\ s\right))를 표시합니다(Lindeberg 1998).실제로 매우 유용한 속성은 라플라시안 블롭 검출의 특정 주제 외에도 스케일 정규화된 라플라시안의 국소 최대값/미니마가 스케일 불변 특성 변환의 코너 검출, 스케일 적응 특성 추적(브레츠너 및 린데버그 1998)과 같은 다른 맥락에서 스케일 선택에 사용된다는 것을 의미한다.(Lowe 2004) 및 이미지 매칭 및 객체 인식을 위한 기타 이미지 기술자.

라플라시안 연산자 및 기타 근접 스케일 공간 관심점 검출기의 스케일 선택 특성은 (Lindeberg 2013a)[1]에서 상세하게 분석한다.(Lindeberg 2013b, 2015)[2][3]에서는 로컬 SIFT 유사 영상 기술자를 사용한 영상 기반 매칭에 대해 라플라시안 연산자 또는 가우시안 차이 근사보다 더 나은 성능을 발휘하는 헤시안 연산자의 행렬식과 같은 다른 스케일 공간 관심점 검출기가 존재하는 것으로 나타났다.

가우시안적 접근의 차이

축척공간 L ( , ,) {L ( , )}이 확산방정식을 만족한다는 사실로부터

따라서 가우스 연산자 2 ( , ,) { L , ) }의 라플라시안은 두 가우스 평활 이미지 간의 차이의 한계 사례(스케일 공간 표현)로도 계산할 수 있다.

r 2L( , ; t ) ( , ; + ) -L(, ;t ) \ \_ {} } , y ; ) { t } \

컴퓨터 비전 문헌에서 이 접근방식은 가우시안(DoG) 접근방식의 차이라고 한다.그러나 사소한 기술 이외에도 이 연산자는 본질적으로 라플라시안과 유사하며 라플라시안 연산자의 근사치로 볼 수 있다.라플라시안 블롭 검출기와 유사한 방법으로 가우스어 차이의 스케일 공간 극단에서 블럽을 검출할 수 있다. 가우스어 연산자와 척도 정규화된 라플라시안 연산자 간의 명시적 관계는 (린데버그 2012, 2015)[3][4]를 참조한다.이 접근방식은 Scale-Invariant Feature Transform(SIFT; 스케일 불변 기능 변환) 알고리즘에서 사용되는 예를 들어 Lowe(2004)를 참조하십시오.

헤시안 결정인자

Monge-Amper 연산자로도 불리는 헤시안 척도 정규화 행렬식을 고려함으로써,

L{ 척도 공간 L { L 헤시안 매트릭스를 나타내며, 이 연산자의 척도 공간 최대치를 검출하면 안장에 반응하는 자동 척도 선택 기능을 가진 또 다른 직선 미분 블롭 검출기를 얻을 수 있다(Lindeberg 1994, 1998).

, ; ) local ( , ; ) ( n r )(, y; t ) style ( \ { } , { \ { y } ; { \ { t} ; { \ hat { t} } = \ local } { ; t } ; } ; { { { { } \ math } } } } ( \ {

The blob points and scales are also defined from an operational differential geometric definitions that leads to blob descriptors that are covariant with translations, rotations and rescalings in the image domain.척도 선택 측면에서 헤시안(DoH) 결정 인자의 척도 공간 극단에서 정의된 블럽은 비유클리드 아핀 변환에서 보다 일반적으로 사용되는 라플라시안 연산자(Lindeberg 1994, 1998, 2015)[3]보다 약간 더 나은 척도 선택 특성을 가진다.단순화된 형태에서는 Haar 웨이브릿에서 계산한 헤시안 스케일 정규화 행렬식을 이미지 매칭 및 객체 인식을 위한 SURF 기술자(Bay 등 2006)의 기본 관심점 연산자로 사용한다.

(Lindeberg 2013a)[1]에서는 헤시안 연산자 및 기타 근접 스케일 공간 관심점 검출기의 결정요인의 선택특성의 상세한 분석이 제시되어 헤시안 연산자의 결정요인이 라플라시안 연산자보다 아핀 화상변환 하에서 더 나은 스케일 선택특성을 갖는 것으로 나타났다.(Lindeberg 2013b, 2015년)[2][3]에서 그 헤세의 사업을 결정하는 상당히 좋은 결과는Laplacian 연산자 또는 그 difference-of-Gaussians 근사보다, 뿐만 아니라 해리스나 Harris-Laplace 통신사보다,image-based 일치하는 지역 SIFT-like 또는SURF-like 이미지 설명자를 사용하여, hig기 위해 더 좋은 공연을 하고 나타나 있다.여기서ficiency 값과 낮은 1-cors 점수.

혼성 라플라시안 및 헤시안 연산자의 행렬식(헤시안-라플라스)

라플라시안과 헤시안 블롭 검출기의 결정인자 사이의 하이브리드 연산자도 제안되었다. 여기서 공간 선택은 헤시안 결정인자에 의해 수행되고 스케일 선택은 스케일 정규화된 라플라시안(Mikolajczyk 및 Schmid 2004)을 사용하여 수행된다.

이 연산자는 이미지 매칭, 객체 인식 및 텍스처 분석에 사용되었습니다.

아핀적응차동블롭검출기

자동 스케일 선택으로 이러한 블럽 검출기에서 얻은 블럽 기술자는 공간 영역의 변환, 회전 및 균일한 재스케일링에 불변한다.그러나 컴퓨터 비전 시스템에 대한 입력을 구성하는 이미지는 투시 왜곡될 수 있습니다.원근법 변환에 보다 강력한 블럽 기술자를 얻기 위해, 자연적 접근법은 아핀 변환에 불변한 블럽 검출기를 고안하는 것이다.실제로 아핀 불변 관심점은 아핀 형상 적응을 블롭 기술자에 적용함으로써 얻을 수 있으며, 블롭 주위의 국소 화상 구조에 맞추어 평활 커널의 형상이 반복적으로 왜곡되거나 평활 커널 형상이 회전 상태를 유지하면서 국소 화상 패치가 반복적으로 왜곡된다.lly symmetric(1997년 Lindeberg와 Garding, 1997년 Baumberg 2000년, Mikolajczyk와 Schmid 2004년, Lindeberg 2008년).이러한 방법으로, 우리는 Hessian 및 Hessian-Lapace 연산자의 결정 요인인 Laplacian/Gausian 연산자의 차이의 아핀 적응 버전을 정의할 수 있다(Harris-AffineHessian-Affine 참조).

시공간 블럽 검출기

헤시안 연산자의 행렬식은 Willems 등 및 Lindeberg에 의해 결합 시공간으로 확장되어 다음과 같은 척도 정규화 미분식으로 이어졌다.

Willems 등의 [5]연구에서는 1 (\ _}= (\ _ }= 대응하는 보다 간단한 표현을 사용했다.Lindeberg,[6]에서 γ의 5/4{\displaystyle \gamma_{s}=5/4}과γ τ)5/4{\displaystyle \gamma_{\tau}=5/4})는 의미에서 나은 수준 선택 속성은 선택한 규모 수준 공간 범위 s와 시공간 가우스 blob를 통해 입수한 의미를 내포하고 그거 0{\displaystyle s=s_{0공개되었다.}} 시간 범위 0 { \ = \ _ { } 은 미분식의 시공간 범위 및 시간 지속 시간과 완벽하게 일치하며, 축척 선택은 시공간 극단을 감지하여 수행됩니다.

Laplacian 연산자는 [6]Lindeberg에 의해 시공간 비디오 데이터로 확장되어 다음과 같은 2개의 시공간 연산자로 이어졌다. 이 두 연산자는 또한 LGN에서 비시공간 뉴런 대 시공간 뉴런 수용장 모델을 구성한다.

첫 번째 연산자의 경우 공간 범위와 시간적 듀라티를 반영하는 시공간적 스케일에서 시공간적 스케일보다 최대값을 가정하려면 스케일 선택 속성에서 {\ } 사용해야 합니다.가우스 블럽의 시작입니다.두 번째 연산자의 경우 공간 범위와 시간 경색을 반영하는 시공간적 스케일에서 시공간적 스케일보다 최대값을 가정하려면 스케일 선택 속성에서 \ }=3/4및 δ = 3 \displaystyle } =3/4을 사용해야 합니다.점멸하는 가우스 블롭의 발생.

회색 수준 블럽, 회색 수준 블럽 트리 및 축척 공간 블럽

블럽을 검출하는 자연스러운 방법은 명암(어두운) 블럽을 강도 풍경에서 각 로컬 최대값(최소값)과 연관짓는 것입니다.그러나 이러한 접근법의 주요 문제는 국소 극단이 소음에 매우 민감하다는 것이다.이 문제를 해결하기 위해, 린데버그(1993, 1994)는 스케일 공간에서 여러 척도의 범위로 국소 최대치를 검출하는 문제를 연구했다.유역 유추에서 정의된 공간적 범위가 있는 영역은 각 국소 최대값과 관련지어졌으며, 소위 구분 안장점에서 정의된 국소 대조도 있었다.이러한 방식으로 범위가 정의된 국소 극단을 그레이 레벨 블럽이라고 합니다.또한 구분 안장점을 넘어 유역 유추를 진행함으로써 그레이 레벨 블롭 트리가 정의되어 영상 영역의 아핀 변형과 단조 강도 변환에 불변하는 방식으로 강도 풍경에서 레벨 세트의 중첩 위상 구조를 포착했다.이러한 구조가 어떻게 규모가 커짐에 따라 진화하는지를 연구함으로써 스케일 공간 블럽의 개념을 도입했다.이러한 축척 공간 블럽은 로컬 대비와 범위를 넘어 축척 공간 수명을 측정하여 영상 구조가 축척 공간에서 얼마나 안정적인지도 측정했습니다.

이러한 방식으로 얻은 관심 영역과 척도 기술자는 다른 초기 시각 처리를 유도하기 위해 블롭 강도의 최대값을 가정한 척도에서 정의된 관련 척도 수준을 사용하여 제안되었다.이러한 관심 영역과 척도 기술자가 능동적 비전 시스템의 관심 초점을 지시하기 위해 사용된 단순 비전 시스템의 초기 프로토타입을 개발했다.이러한 프로토타입에 사용된 특정 기법은 컴퓨터 비전에 대한 현재 지식으로 상당히 개선될 수 있지만, 전체적인 일반적인 접근법은 여전히 유효하다. 예를 들어, 스케일 정규화된 라플라시안 연산자의 스케일에 대한 국소 극단이 다른 시각 p에 스케일 정보를 제공하는 데 사용되는 방식에서 그렇다.동작합니다.

린데버그의 유역 기반 그레이 레벨 블럽 검출 알고리즘

유역 유추로부터 그레이 레벨의 블럽(확장이 있는 국소 극단)을 검출하기 위해서, 린데버그는, 같은 강도를 가지는 대체적으로 접속된 영역인 픽셀을, 명암치의 내림차순으로 사전 정렬 하는 것에 근거하는 알고리즘을 개발했다.그런 다음 픽셀 또는 연결된 영역의 가장 가까운 이웃 간에 비교가 이루어졌다.

알기 쉽게 하기 위해 밝은 회색 수준의 블럽을 검출하는 경우를 고려하여 "high neighbor" 표기법을 "높은 회색 수준의 값을 가진 인접 픽셀"을 나타냅니다.그런 다음 알고리즘의 모든 단계(강도 값의 내림차순으로 전달됨)는 다음 분류 규칙에 기초합니다.

  1. 영역에 상위 인접 라우터가 없는 경우 로컬 최대값으로 블럽의 씨앗이 됩니다.BLOB가 커질 수 있도록 플래그를 설정합니다.
  2. 그렇지 않으면 적어도1개의 상위 네이버(배경)가 있는 경우, 그 네이버는 blob의 일부가 될 수 없으며 백그라운드로 해야 합니다.
  3. 그렇지 않으면 둘 이상의 상위 인접 라우터가 있고 그 상위 인접 라우터가 다른 블럽의 일부일 경우 블럽의 일부가 될 수 없으며 백그라운드여야 합니다.상위 네이버 중 하나라도 계속 확장할 수 있는 경우 플래그를 클리어하여 확장할 수 있도록 합니다.
  4. 그렇지 않으면 하나 이상의 상위 인접 관계를 가지며, 이들은 모두 같은 블롭의 일부입니다.이 블럽이 계속 증가할 수 있는 경우 현재 영역을 해당 블럽의 일부로 포함해야 합니다.그렇지 않으면 영역을 백그라운드로 설정해야 합니다.

다른 유역 방법과 비교하여 이 알고리즘의 플래딩은 강도 레벨이 로컬 최대값과 관련된 소위 구분 안장점의 강도 값 아래로 떨어지면 중지됩니다.그러나 이 접근방식을 다른 유형의 유역 시공으로 확장하는 것은 비교적 간단합니다.예를 들어 첫 번째 구분 안장점을 넘어 진행함으로써 "그레이 레벨 블롭 트리"를 구성할 수 있다.또한 그레이 레벨 블롭 검출 방법은 축척 공간 표현에 포함되어 모든 축척 수준에서 수행되었으며, 그 결과 축척 공간 원시 스케치라고 불리는 표현이 생성되었다.

컴퓨터 비전에 응용한 이 알고리즘은 린데버그의 논문과[7] 부분적으로 그 연구를 바탕으로 한 스케일 공간[8] 이론에 관한 논문에 더 자세히 기술되어 있다.이 알고리즘의 이전 프레젠테이션은 에서 확인할 수도 있습니다.그레이 레벨 블럽 검출의 응용에 대한 자세한 처리와 컴퓨터 비전 및 의료 이미지 분석에 대한 스케일 공간 프리미얼 스케치는 에 나와 있습니다.

최대 안정 극한 영역(MSER)

마타스 등(2002)는 투시 변환 하에서 강력한 이미지 기술자를 정의하는 데 관심이 있었다.그들은 강도 경관의 수준 집합을 연구했고 강도 치수를 따라 얼마나 안정적인지 측정했다.이 아이디어를 바탕으로 그들은 최대한 안정적인 극단 영역의 개념을 정의하고 이러한 이미지 기술자가 스테레오 매칭을 위한 이미지 기능으로 어떻게 사용될 수 있는지를 보여주었다.

이 개념과 위에서 언급한 회색 수준의 블롭 트리 개념 사이에는 밀접한 관계가 있습니다.최대 안정 극단 영역은 그레이 레벨 블롭 트리의 특정 서브셋을 추가 처리를 위해 명시적으로 만드는 것으로 볼 수 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b 린데버그, 토니(2013) "일반화된 스케일-공간 관심점 검출기의 척도 선택 특성", 수학적 이미징 및 비전 저널, 제46권, 제2호, 177-210페이지.
  2. ^ a b 린데버그(2013) "일반화된 축척-공간 관심점을 이용한 이미지 매칭", 컴퓨터 비전의 축척 공간과 변이 방법, 컴퓨터 사이언스 Volume 7893 2013, 페이지 355-367.
  3. ^ a b c d T. 린데버그, "일반화된 축척 공간의 관심점을 이용한 이미지 매칭", 수학 이미징 및 비전 저널, 52권, 1번, 3-36쪽, 2015년.
  4. ^ T. 린데버그는 "스케일 불변 피쳐 변환, Scholarpedia, 7(5):10491, 2012.
  5. ^ a b Geert Willems, Tinne Tuytelaars and Luc van Gool (2008). "An efficient dense and scale-invariant spatiotemporal-temporal interest point detector". European Conference on Computer Vision. Springer Lecture Notes in Computer Science. Vol. 5303. pp. 650–663. doi:10.1007/978-3-540-88688-4_48.
  6. ^ a b c Tony Lindeberg (2018). "Spatio-temporal scale selection in video data". Journal of Mathematical Imaging and Vision. Vol. 60, no. 4. pp. 525–562. doi:10.1007/s10851-017-0766-9.
  7. ^ Lindeberg, T.(1991) 이산 스케일-공간 이론 및 스케일-공간 프리미얼 스케치, 박사 논문, 왕립 공과대학, S-100 44 스톡홀름, 1991년 5월(ISSN 1101-2250).ISRN KTH NA/P--91/8--SE) (그레이 레벨 블럽 검출 알고리즘은 섹션 7.1에서 설명합니다.)
  8. ^ Kluwer Academic Publishers, Tony, 컴퓨터 비전의 스케일 공간 이론, 1994 ISBN 0-7923-9418-6
  9. ^ T. 린데버그와 J.O.Eklundh, "스케일 공간 프리미얼 스케치로부터의 스케일 검출 및 영역 추출", Proc. 제3회 컴퓨터 비전 국제회의(일본, 오사카), 페이지 416-426, 1990년 12월(유역 기반 그레이 레벨 블롭 검출 알고리즘의 기본 정의는 부록 A.1 참조)
  10. ^ T. 린데버그와 J.O.Eklundh, "스케일 공간 프리미얼 스케치 계산에 대하여", 비주얼 커뮤니케이션이미지 표현 저널, vol. 2, 페이지 55-78, 1991년 3월.
  11. ^ 린데버그, T:볼록한 방울 모양의 이미지 구조와 그 스케일을 스케일 공간 프리미얼 스케치로 검출하는 방법: 주목의 초점, 국제 컴퓨터 비전 저널, 11(3), 283-318, 1993.
  12. ^ Lindeberg, T, Lidberg, Par 및 Roland, P. E.: "3D 스케일 공간 원시 스케치를 사용한 뇌 활성화 패턴 분석", 인간 뇌 매핑, vol 7, no 3, 페이지 166-194, 1999.
  13. ^ 장프랑수아 망갱, 데니스 리비에르, 올리비에르, 시릴 푸퐁, 아르노 카키아, 얀 코인트파스, 장밥티스트 폴리네, 데니스 르 비한, 장 레기스, 디미트리 파파도풀로스-파노르-파노르-파노르드에 근거: 의학인공지능 30 (2): 177-197(2004) Wayback Machine에 2011년 7월 21일 아카이브

추가 정보