하르와 같은 특징
Haar-like feature하르와 같은 특징은 물체 인식에 사용되는 디지털 이미지 기능이다.이들은 하르 웨이블렛과의 직관적인 유사성 때문에 이름을 지었으며, 최초의 실시간 얼굴 감지기에 사용되었다.[1]
역사적으로 영상 강도(즉, 영상의 각 및 모든 픽셀에서 RGB 픽셀 값)만 사용하여 작업하면 형상 계산 작업이 계산적으로 비싸졌다.Papageorgiou 등의 출판물은 일반적인 이미지 강도가 아닌 Har wavelet을 기반으로 한 대체 기능 세트로 작업하는 것에 대해 논의하였다.[2]폴 비올라와 마이클 존스는[1] 하르 웨이블렛을 사용하는 아이디어를 개작하여 이른바 하르와 같은 특징을 개발하였다.하르 형상은 검출 창의 특정 위치에서 인접한 직사각형 영역을 고려하고, 각 영역의 픽셀 강도를 요약하고, 이러한 합계의 차이를 계산한다.이 차이는 이미지의 하위 부분을 분류하는 데 사용된다.예를 들어, 사람의 얼굴을 가지고, 모든 얼굴들 중에서 눈의 부위가 볼 부위보다 더 어둡다는 것은 일반적인 관찰이다.따라서 얼굴 감지를 위한 일반적인 하어 기능은 눈 위와 뺨 부위 위에 놓여 있는 두 개의 인접한 직사각형 세트다.이러한 직사각형의 위치는 대상 물체(이 경우 얼굴)에 대한 경계 상자처럼 작용하는 탐지 창에 상대적으로 정의된다.
Viola-Jones 객체 감지 프레임워크의 검출 단계에서 입력 이미지 위로 대상 크기의 창이 이동되며, 이미지의 각 하위 섹션에 대해 Haar 유사 기능이 계산된다.그런 다음 이 차이를 비 객체와 객체를 구분하는 학습된 임계값과 비교한다.그러한 하르와 같은 특징은 학습자나 분류자가 약한 것일 뿐이기 때문에(그 검출 품질이 무작위 추측보다 약간 낫다) 충분한 정확도로 사물을 설명하기 위해서는 많은 수의 하르와 같은 특징이 필요하다.따라서 비올라-존스 물체 감지 프레임워크에서 하르 유사 형상은 분류기 계단식이라고 하는 것으로 구성되어 강력한 학습자 또는 분류기를 형성한다.
대부분의 다른 특징에 비해 하르 형상의 주요 장점은 계산 속도다.일체형 이미지를 사용하기 때문에 어떤 크기의 Haar와 같은 형상은 일정한 시간(두 가지 직각 형상에 대한 약 60개의 마이크로프로세서 지침)으로 계산할 수 있다.
직사각형 하르 형상
단순한 직사각형 하르 형상은 직사각형 안에 있는 영역의 픽셀 합계의 차이로 정의될 수 있으며, 이는 원래 이미지 내의 어떤 위치와 축척에 있을 수 있다.이 수정된 형상 세트를 2-직각 형상이라고 한다.Viola와 Jones는 또한 3-직각 형상과 4-직각 형상을 정의했다.이 값은 영상의 특정 영역의 특정 특성을 나타낸다.각 형상 유형은 이미지에서 가장자리나 질감 변화와 같은 특정 특성의 존재(또는 부재)를 나타낼 수 있다.예를 들어, 2-직각 형상은 어두운 지역과 밝은 지역 사이의 경계선을 나타낼 수 있다.
Har 유사 피쳐의 빠른 계산
비올라와 존스가 기여한 것 중 하나는 통합 이미지라고 부르는 합계 면적 테이블을 사용하는 것이었다.[3]적분 영상은 원본 이미지의 크기가 같은 매트릭스 형태의 2차원 조회 테이블로 정의할 수 있다.적분된 영상의 각 요소에는 원본 영상의 왼쪽 위 영역에 위치한 모든 픽셀의 합계가 포함되어 있다(요소의 위치와 관련).이렇게 하면 네 가지 룩업만 사용하여 어떤 위치 또는 척도에서도 영상의 직사각형 영역 합계를 계산할 수 있다.
여기서 점 , , C, 은(는) 그림에 표시된 것처럼 이미지 I 에 속한다.
각 하르와 유사한 기능은 정의 방법에 따라 4개 이상의 조회가 필요할 수 있다.비올라와 존스의 2-직각 기능은 6개, 3-직각 기능은 8개, 4-직각 기능은 9개의 룩업이 필요하다.
기울어진 하르 형체
리엔하트와 메이트는[4] 기울어진(45°)의 개념을 소개했다.하르와 같은 특징이것은 이미지에서 물체의 탐지를 개선하기 위한 시도로 형상 집합의 치수성을 증가시키기 위해 사용되었다.이러한 특징들 중 일부는 대상을 더 나은 방식으로 설명할 수 있기 때문에 이것은 성공적이었다.예를 들어, 2-직각 기울어진 하르 형상은 45°에서 가장자리가 존재함을 나타낼 수 있다.
메솜과 바크작[5](Barczak)은 이 아이디어를 일반적인 회전식 하르 형상으로 확장했다.비록 그 생각은 수학적으로 건전하지만, 실제적인 문제들은 어떤 각도에서든 하르와 같은 특징을 사용하는 것을 막는다.검출 알고리즘은 빠른 속도를 위해 반올림 오류를 일으키는 저해상도 영상을 사용한다.이러한 이유로 회전식 하르 형상은 일반적으로 사용되지 않는다.
참조
- ^ a b Viola 및 Jones, "간단한 기능의 증가된 캐스케이드를 사용한 신속한 객체 감지", Computer Vision and Pattern Incognition, 2001
- ^ 파파게오르지우, 오렌, 포기오, "물체 감지를 위한 일반적인 틀" , 1998년 컴퓨터 비전 국제회의.
- ^ Crow, F, 18(3):207–212, 1984년 SIGGRAPH의 "질감 매핑을 위한 요약 영역 테이블"
- ^ 리엔하르트, R., 메이드트, J. "급격한 물체 감지를 위한 하르와 유사한 기능의 확장 세트", ICIP02, pp.I: 900–903, 2002
- ^ C.H.와 A.L.C. Barczak, "회전 일체형 이미지를 사용한 빠르고 효율적인 회전식 회전식 회전식 하어 형상", 호주 로봇 및 자동화 회의(ACRA2006), 페이지 1-6, 2006.
- 하아 A. 수르 테오리가 직교한 펑크티오넨스스템임, Mathatische Annalen, 69, 페이지 331–371, 1910.