통합 채널 기능
Integral channel featureICF(Integrated Channel Features)는 ChnFtrs라고도 하며 컴퓨터 비전에서의 객체 검출 방법입니다.또한 통합된 영상을 사용하여 여러 등록된 영상 채널에서 로컬 합계, 히스토그램 및 Haar와 같은 피쳐를 추출합니다.이 방법은 2009년 [1]BMVC에서 처음 기술된 보행자 탐지를 위한 작업에서 돌라르 등에 의해 크게 활용되었다.
방법의 개요
- 선형 및 비선형 변환을 사용하여 입력 이미지에서 여러 개의 등록된 이미지 채널 계산
- 각 채널에서 직사각형 채널 영역의 합계와 같은 특징을 추출합니다.다양한 채널에서 추출된 기능을 통합 채널 기능이라고 합니다.
- AdaBoost 분류자를 교육합니다.돌라르 외더 빠른 학습을 제공하는 부스팅 기술을 사용했지만, 훈련은 서포트 벡터 머신과 같은 다른 사용 가능한 방법으로 수행될 수 있습니다.
- 마지막으로, 훈련받은 분류기는 물체를 감지하는 데 사용됩니다.
이미지 및 채널
일반적으로 "채널"은 디지털 이미지에서 픽셀 값을 정의하는 특정 구성요소를 나타냅니다.예를 들어 컬러 이미지는 3개의 채널(빨간색, 녹색 및 파란색)의 집약입니다.이미지의 색상 데이터는 채널이라고 하는 세 가지 값의 배열에 저장됩니다."채널"의 정의는 다양한 영역에서 널리 받아들여지고 있지만, 컴퓨터 비전에는 더 넓은 정의가 존재하며, 이를 통해 색상 정보 외에 이미지의 다른 특징을 이용할 수 있습니다.이러한 정의 중 하나는 출력 화소가 어떤 선형 [1]또는 비변환에 의해 입력 화소에 매핑되는 원본 화상의 등록 맵으로서의 채널을 참조한다.이 채널 개념에 따르면 입력 화상으로부터 한 번에 하나의 특정 색정보점을 추출하여 얻은 출력 화상으로서 화상의 색채널을 재정의할 수 있다.마찬가지로 그레이스케일 입력 화상의 채널은 그레이스케일 입력 화상과 동일합니다.아래 간단한 MATLAB 구현은 입력 이미지에서 컬러 채널과 그레이스케일 채널을 추출하는 방법을 보여줍니다.
I = 읽다('I_RGB.png'); % 입력 컬러 이미지 % Output_image = color_channel(I), %(컬러 채널은 빨강, 초록 또는 파랑).3개의 출력 이미지 다음과 같이 입력 이미지에서 %를 추출합니다. red_채널 = I(:, :, 1); 녹색 채널 = I(:, :, 2); blue_channel(파란색_channel) = I(:, :, 3); % 출력 이미지 = grayscale_image(I). % 입력 이미지 I이 이미 그레이스케일 이미지, 그레이스케일 채널인 경우 주의해 주십시오. %는 단순히 입력 이미지와 같았을 것입니다. 즉, 회색 채널 = I 회색 채널 = rbg2픽셀(I);
위의 예에서 단순히 원본 이미지에서 특정 정보를 추출하거나 원하는 채널을 얻기 위해 입력 이미지를 조작함으로써 채널을 생성할 수 있음을 알 수 있습니다.Dollar 등은 채널 생성 함수를 δ로 정의했으며,[1] 채널(즉 출력 화상)을 원본 화상과 관련짓는 데 다음과 같이 사용할 수 있다.
- 𝐶 = ω ( ) ) 。여기서 C는 채널, I는 입력 이미지입니다.
다음 섹션에서는 Dollar 등의 원본 문서에서 언급한 다른 비교적 복잡한 채널 유형에 대해 논의한다. 일부 채널에 대한 MATLAB 구현이 제공된다.
다양한 채널 타입
- 색상 및 그레이스케일: 위에서 설명한 바와 같이 이미지에서 색상 및 그레이스케일 채널을 쉽게 추출할 수 있습니다.색상 채널은 RGB, LUV 또는 HSV일 수 있습니다.LUV 색상 채널은 모든 색상 공간 중에서 가장 유용한 것으로 나타났습니다.
- 선형 필터:이것은 채널을 생성하는 간단한 방법입니다.이미지의 다양한 측면을 캡처할 수 있는 다양한 선형 필터가 있습니다.Gabor 필터와 Gaussians 차이(DoG)가 몇 가지 예입니다.Gabor 필터 및 DoG 캡처 엣지 정보 및 이미지의 텍스처니스.다음은 MATLAB에서 DoG를 구현하기 위한 샘플 코드입니다.
% 출력 이미지 = DoG(I) 입력 이미지에 적용된 가우스의 차이(%) H1 = fspecial(fspecial(특수)('실패', 25, 0.5); %는 신호 0.5로 가우스 생성 H2 = fspecial(fspecial(특수)('실패', 25, 3); %는 신호 3으로 가우스 생성 DoG_필터 = H1 - H2; DoG 작성 비율(%) 이미지 = 이중으로 하다(rbg2픽셀(읽다('RGB_1.jpg'))); DoG_채널 = 컨벤트2(이미지,DoG_필터,'똑같다); 입력 이미지 포함 컨볼브 DoG(%)
- 비선형 채널:비선형 채널이 많이 있습니다.가장 인기 있는 것은 캐니 에지 검출기와 구배 크기이다.캐니는 에지 정보를 제공하는 반면, 그라데이션 크기는 에지 강도를 제공합니다.
- 점 단위 변환:이름에서 알 수 있듯이 점 단위 변환은 개별 픽셀에서 작동합니다.예를 들어 로그 연산자와 지수 연산자가 있습니다.로그 연산자는 낮은 명암 픽셀을 향상시키는 반면 지수는 그 반대입니다.
- 그라데이션 히스토그램:그라데이션 각도에 의해 빈이 결정되는 영상의 히스토그램입니다.각 화소는 투표하고 무게는 그 구배 크기에 의해 결정된다.HOG(Histogram of Oriented Gradient) 설명자는 Dalal 및 Triggs에서 개발한 일반적인 설명자입니다.
이러한 채널은 단독으로 사용할 수도 있고 서로 조합하여 사용할 수도 있습니다.
기능 추출
입력 화상으로부터 채널을 취득하면, 이러한 채널로부터 다양한 특징을 추출할 수 있다.이러한 기능은 채널피처라고 불리며 크게 다음 두 가지 [1]유형으로 분류할 수 있습니다.
- 1차 채널 기능:고정된 직사각형 영역의 픽셀을 합산하여 단일 채널에서 추출된 특징입니다.이것들은 「」(C)로 표시됩니다.이미지 픽셀이 아닌 통합 이미지에서 로컬 합계를 추출하는 것이 계산상 비용이 적게 든다는 점에 유의하십시오.실제로 Dollarr 등은 그들의 작업에 통합된 이미지를 사용하여 특징을 추출했다.
- 고차 채널 기능:2개 이상의 1차 채널피쳐를 조합하여 얻을 수 있는 피쳐.예를 들어 Haar 기능.
통합 채널 기능 구현
ChnFtrs 메서드를 사용하면 다양한 채널에서 풍부한 기능을 캡처하는 기능을 풀링할 수 있습니다.Dollarr, 등은 2차 [1]특징에 의한 부가가치가 많지 않았기 때문에 1차 특징에 기초한 실험 결과를 기반으로 했다.채널은 스케일 공간 전체를 나타낼 수 있는 채널 기능 풀을 추출하기 위해 여러 스케일로 재계산됩니다.ChnFtrs 방법을 구현하기 위한 지침으로 사용할 수 있는 MATLAB 도구 상자가 있다.또한 OpenCV는 ChnFtrs를 [2][3]완전히 구현하고 있습니다.
성능
ChnFtrs의 성능 연구하기 위해서 Dollár(알. 때부터 개별적으로 사용된 다양한 채널의 효율성을 평가했다.중심적인 경사치의 채널 연구되었다 히스토그램(절대), 기울기 히스토그램 채널(Hist), 기울기 크기(그라드), 색상 채널(RGB, 단순 포진 바이러스, LUV)과 흑백 채널이다.공연은 보행자 검출률이 10-4fppw(봉창에 긍정적인)의 기준점에서 평가되었다.절대 채널이 나머지 부분 비교할 가장 유익한 채널로 밝혀졌다.절대의 적발률이 89%이다.또한, 색상 채널(RGB, 단순 포진 바이러스와 LUV)중 LUV55.8%의 최고의 탐지율을 보였다.그레이 스케일 채널 least만 30.7%의 적발률과 유익했다.다음에 그들은 다양한 채널 조합으로 구성되는데 그것은 그들이 제안된 메서드는 성능을 평가했다.LUV, Hist고 점차로 채널의 조합 91.9%의 높은 탐지율을 보였다.이 채널은 조합 더 INRIA고 칼텍 데이터 셋을 그들이 실험에 사용되었다.
대략 30000의 첫번째 주문 기능AdaBoost 선형 분급기 훈련시키는 데 사용되었다.그 ChnFtrs+AdaBoost 검출기 INRIA고 칼텍 데이터 집합을 통해 충분한 이미지에 테스트를 받았다.공연은 절대, 가장 일반적인 방법 등 기타 12개 탐지기와 비교되었다.ChnFtrs 모든 LatSvm을 제외한 것.INRIA의 데이터에 ChnFtrs의 적발률이 86%, 좀 더 도전적인 칼텍의 데이터에서 60%이다.
추가 개발
후에 일 처음에 달러(al.에 의해 출판되었다 그 혈관 내 혈액 응고 및 섬유소 용해 법(ChnFtrs)은 컴퓨터 비전의 연구진들에 의해 악용되고 있다.사실, 그것은 검증된 효율성과 합리적인 성능으로 인해 현재 기준 검출기로 사용되고 있다.몇몇 저자들은 다양한 방법으로 기능 풀을 확장하거나 분류자를 신중하게 선택하고 더 큰 데이터 세트로 훈련함으로써 훨씬 더 나은 성능을 얻었습니다.장 외 연구진의 연구도 보행자 [4]탐지를 위한 Informed Haar 검출기 개발에 필수적인 채널 기능을 이용했다.이들은 돌라르 등과 동일한 채널 조합을 사용했지만 기준 ChnFtrs 방법보다 약 20% 더 높은 성능을 달성할 수 있었다.성능이 추가된 것은 검출기에 [4]더 나은 사전 지식을 제공했기 때문이다.분석 결과 2차 특성이 검출률 0.6% 증가에 거의 추가되지 않았기 때문에 Dollar 등은 1차 채널 기능만을 사용하여 결과를 입증한 반면,[1] 에 기술된 용어에 따라 2차 기능인 정보에 근거한 Haar 유사 기능을 사용했다는 점도 중요하다.또한, Benenson 등은 입력 [5]영상의 크기를 조정할 필요성을 피함으로써 기준선 ChnFtrs 방법의 검출 속도를 높일 수 있었다.
ChnFtrs는 여러 채널에서 기능을 추출할 수 있는 다용도 방식이며, 따라서 단일 입력 이미지에서 다양한 정보를 캡처할 수 있습니다.Dollarr 등이 개발한 베이스 검출기의 성능.보다 큰 데이터셋으로 보다 나은 사전 지식 및 교육을 추가함으로써 향상된 것으로 나타났습니다.
레퍼런스
- ^ a b c d e f P. 돌라, Z.Tu, P. Perona, S.귀속 "통합 채널 기능", BMVC 2009
- ^ "Piotr's Matlab Toolbox".
- ^ "Integral Channel Features Detector — OpenCV 3.0.0-dev documentation".
- ^ a b S. 장, C.Baukhage와 A.크레이머.정보에 근거한 Haar와 같은 기능은 보행자 감지를 개선합니다.컴퓨터 비전 및 패턴 인식(CVPR), 2014 IEEE Conference on, 947-954페이지.IEEE, 2014
- ^ R. 베넨슨, M. 마티아스, R.티모프테, 그리고 L. V. 굴.초당 100프레임의 보행자 감지CVPR, 2012년