소벨 연산자

Sobel operator
증기 엔진의 컬러 사진
Sobel 연산자가 해당 이미지에 적용됨

때로는 소벨-펠드만 연산자 또는 소벨 필터로 불리는 소벨 연산자이미지 처리컴퓨터 비전, 특히 이미지를 강조하는 가장자리 감지 알고리즘 내에서 사용된다.스탠포드 인공지능 연구소(SAIL)의 동료인 어윈 소벨게리 펠드먼의 이름을 따서 지은 것이다.소벨과 펠드만은 1968년 SALE에서 열린 강연에서 "등방성 3 × 3 이미지 그라데이션 운영자"의 아이디어를 제시했다.[1]기술적으로는 영상 강도 함수의 그라데이션 근사치를 계산하는 이산 분화 연산자다.영상의 각 지점에서 Sobel-Feldman 연산자의 결과는 해당 그라데이션 벡터 또는 이 벡터의 표준이다.Sobel-Feldman 연산자는 가로 방향과 세로 방향에서 작고 분리 가능하며 정수 값의 필터가 있는 영상을 경련하는 것에 기초하고 있으며 따라서 계산 측면에서 비교적 저렴하다.반면, 특히 영상의 고주파 변동의 경우, 그것이 생성하는 구배 근사치는 비교적 조잡하다.

공식화

운영자는 두 개의 3×3 커널을 사용하여 원래 이미지와 합치하여 파생상품의 근사치를 계산한다. 하나는 수평적 변화용이고 다른 하나는 수직적 변화용이다.A를 소스 이미지로 정의하고 G와 Gx 각각y 수평 및 수직 파생 모델 근사치를 포함하는 두 개의 이미지인 경우 계산은 다음과 같다.[2]

여기서 (는) 2차원 신호 처리 컨볼루션 작업을 의미한다.

소벨 커널은 평균화 및 분화 커널의 산물로 분해될 수 있기 때문에 스무딩으로 경사를 계산한다.예를 들어 는 다음과 같이 쓸 수 있다.

여기서 x 좌표는 "오른쪽" 방향으로 증가하는 것으로 정의되며, y 좌표는 "아래쪽" 방향으로 증가하는 것으로 정의된다.영상의 각 지점에서 결과 구배 근사치를 조합하여 구배 크기를 부여할 수 있으며, 다음과 같이 사용할 수 있다.

이 정보를 사용하여 구배 방향도 계산할 수 있다.

여기서(: { 오른쪽에 더 밝은 수직 에지에 대한 }은(는 0이다(atan2 참조).

좀 더 형식적으로

디지털 이미지의 명암 함수는 이산점에서만 알려져 있기 때문에, 영상 지점에서 샘플링된 근본적인 차별성 명암 함수가 있다고 가정하지 않는 한, 이 기능의 파생상품은 정의할 수 없다.일부 추가적인 가정으로, 연속 강도 함수의 파생물은 샘플링된 강도 함수의 함수로 계산될 수 있다. 즉, 디지털 이미지.특정 지점의 파생상품은 거의 모든 이미지 지점의 강도 값의 함수인 것으로 밝혀졌다.그러나 이러한 파생상품 함수의 근사치는 정확도가 낮거나 높을 때 정의할 수 있다.

Sobel-Feldman 연산자는 영상 그라데이션의 다소 부정확한 근사치를 나타내지만, 여전히 많은 용도에서 실용화하기에 충분한 품질을 가지고 있다.보다 정확하게는 각 영상 포인트 주변의 3×3 영역에서만 강도 값을 사용하여 해당 영상 그라데이션에 근사치를 적용하며, 영상 강도의 가중치를 갖는 계수에 정수 값만 사용하여 그라데이션 근사치를 생성한다.

다른 차원으로 확장

소벨-펠드만 운영자는 두 개의 분리 가능한 운영으로 구성된다.[3]

  • 필터를 사용하여 파생 모델 방향에 수직으로 평활: (- 1)= ,h( 0)= , ( )= 1 }
  • 파생 방향의 단순 중심 차이 : (- 1)= , ( )= , ( )=- (1)=0,h(

, , , { ,- , x :

: ( x)= (

2D: ( , )= ( ) ( )

2D: ( , )= h( ) ( y )

3D: h ( x, , )= ( x) h( ) ( ) h ( )

3D: ( x, , )= ( ) ( ) h() ( )

3D: , , z)= ( x) h () ( )

4D: ( t)= ( ) ( y) ( ) ( ) h ( )

따라서 3D Sobel-Feldman 커널(z-방향)을 예로 들 수 있다.

기술적 세부사항

그것의 정의의 결과로서, 소벨 연산자는 하드웨어와 소프트웨어 모두에서 간단한 방법으로 구현될 수 있다: 해당하는 결과를 계산하기 위해서는 한 점 주위의 8개의 영상 지점만 필요하며, 그라데이션 벡터 근사치를 계산하기 위해서는 정수 산술만 필요하다.또한 위에서 설명한 두 개의 이산 필터는 모두 분리할 수 있다.

따라서 두 파생상품 Gx Gy 다음과 같이 계산할 수 있다.

어떤 구현에서는 이러한 분리 가능한 계산이 각 영상 포인트에 대해 산술 연산이 적다는 것을 의미하기 때문에 유리할 수 있다.

픽셀 그룹 P에 콘볼루션 K를 적용하면 다음과 같이 유사코드로 나타낼 수 있다.

N(x,y) = {K(i,j)의 합계.i에 대한 P(x-i,y-j)},j는 -1에서 1로 실행된다.

N(x,y)은 Convolution KP에 적용한 후 나온 새로운 매트릭스를 나타내며, 여기서 P는 픽셀 매트릭스다.

Sobel-Feldman 연산자의 결과는 각 지점의 그라데이션에 대한 2차원 맵이다.높은 경사도(가능성이 있는 가장자리) 영역이 흰색 선으로 보이는 등 그 자체가 이미지인 것처럼 처리하고 볼 수 있다.다음의 이미지는 단순한 영상에 Sobel-Feldman 연산자의 계산을 보여줌으로써 이것을 보여준다.

벽돌 벽 및 자전거 랙의 그레이스케일 테스트 이미지
Sobel-Feldman 연산자의 정규화된 그라데이션 크기
Sobel-Feldman 연산자에서 정규화된 x-gradient
Sobel-Feldman 연산자의 정규화된 y-gradient

아래 이미지는 그레이스케일 원의 그라데이션 방향 변화를 보여준다. ()G y {\ \}}}의 부호가 같을 때 그라데이션의 각도는 양이고, 다를 때는 음이다.아래의 예에서 원의 가장자리에 있는 빨간색과 노란색은 양각을 나타내고, 파란색과 청록색은 음각을 나타낸다.원 왼쪽과 오른쪽의 수직 가장자리는 에 국소적인 변화가 없기 때문에 0의 각도를 가지며 원 위와 아래쪽의 수평 가장자리는 -의 각도를 가진다./2π/2 G x 상단 가장자리에 대한 음각은 밝은 영역에서 어두운 영역으로, 하단 가장자리에 대한 양각은 어두운 영역에서 밝은 영역으로의 전환을 의미한다 모든 픽셀은 G 또는 에 국지적으로 변경되지 않아 검은색으로 표시되므로 각도가 정의되지 않는다.각도는 G \mathbf 화소 비율의 함수이므로, 변화율이 작은 {G_{x}}} 화소들은 여전히 큰 각도 응답을 가질 수 있다.결과적으로 소음은 일반적으로 원하지 않는 큰 각도 응답을 가질 수 있다.이미지 처리 응용 프로그램에 그라데이션 각도 정보를 사용할 때는 이러한 잘못된 응답을 줄이기 위해 이미지 노이즈를 제거하도록 노력해야 한다.

흰색 바탕에 검은색 원의 그레이스케일 이미지.
Sobel 연산자의 경사로 방향.

대체 연산자

Sobel-Feldman 연산자는 순수한 중심 차이 연산자와 관련된 아티팩트를 줄이면서도 회전 대칭(오차의 약 1°)이 잘 나타나지 않는다.샤르는 주어진 특정 숫자 정밀도(1D, 2D, 3D)와 치수(1D, 2D, 3D)에 최적화된 커널을 생산하여 이 속성을 최적화하는 것을 검토했다.[4][5]5 x 5 x 5 x 5 크기까지의 최적화된 3D 필터 커널이 제공되었지만 가장 자주 사용되는 오차는 약 0.2°이다.

이 요인도 이와 유사하게 다음과 같다.

샤르 연산자는 푸리에 도메인에서 가중 평균 제곱 각 오차를 최소화하는 최적화에서 비롯된다.이 최적화는 결과 필터가 숫자로 일관된다는 조건에서 수행된다.따라서 그것들은 단순히 대칭 구속조건을 유지하는 것이 아니라 파생적 커널이다.샤르의 이론에서 비롯된 최적의 8비트 정수 3x3 필터는

유사한 최적화 전략과 결과 필터도 Farid와 Simoncelli에 의해 제시되었다.[6][7]그들은 또한 고차원의 파생상품 계획도 조사한다.샤르의 작업과 대조적으로, 이러한 필터들은 수적으로 일관되도록 강제되지 않는다.

파생 필터 설계 문제는 예를 들어 Kroon에 의해 다시 검토되었다.[8]

임의의 세제곱 스플라인에 기초한 파생 필터는 헤스트에 의해 제시되었다.[9]그는 길이 7의 필터를 제공하는 이중 필터링 접근법에 의해 입방 또는 삼각 스플라인을 사용하여 1차 및 2차 파생상품을 어떻게 정확하게 계산할 수 있는지를 보여주었다.

원래 소벨 연산자로부터 생성된 또 다른 유사한 연산자는 완벽한 회전 대칭 기반 콘볼루션 필터 3x3인 카얄리 연산자다.[10]

방향-최적 파생 커널은 광학 흐름 추정에서 체계적 추정 오류를 획기적으로 줄인다.훨씬 더 높은 정확도를 가진 더 큰 계획과 확장된 광학 흐름 추정을 위한 최적화된 필터 패밀리가 샤르의 후속 연구에서 제시되었다.[11]2차 파생 필터 세트는 투명한 움직임 추정에 대해 조사되었다.[12]결과 커널이 클수록 가우스 필터의 파생상품에 더 가깝다는 것이 관찰되었다.

비교 예제

여기에서 시험 영상의 경사 크기를 추정하기 위해 4개의 다른 경사 연산자를 사용한다.

벽돌 벽 및 자전거 랙의 그레이스케일 테스트 이미지
Sobel-Feldman 연산자의 그라데이션 크기
샤르 연산자의 그라데이션 크기
로버츠 크로스 연산자의 그라데이션 크기
Prewitt 연산자의 그라데이션 크기

매트랩 구현

function sobel(A : as two dimensional image array)  Gx = [-1 0 1; -2 0 2; -1 0 1]  Gy = [-1 -2 -1; 0 0 0; 1 2 1]    rows = size(A, 1)  columns = size(A, 2)  mag = zeros(A)  for i=1:rows-2  for j=1:columns-2  S1 = sum(sum(Gx.*A(i:i+2, j:j+2)) S2 = 합(Gy).*A(i:i+2, j:j+2)) mag(i + 1, j + 1) = sqrt(S1)^2 + S2.^2) 임계값용 = 애플리케이션 [0–192] 출력_이미지 = 최대(매거진, 임계값) 출력_이미지(output_image = 라운드(round) = 0; return output_image end 함수)에 따라 70% 달라짐

매트랩 코드 입니다.

참고 항목

참조

  1. ^ 어윈 소벨, 2014년 소벨 운영자역사와 정의
  2. ^ 피쳐 디텍터 – 소벨 가장자리 디텍터
  3. ^ K. Engel (2006). Real-time volume graphics. pp. 112–114.
  4. ^ 샤르, 한노, 2000년 논문(독일어), 디지털 이미지 처리의 최적 연산자.
  5. ^ B. 예네, H. 샤르, S. 쾨르켈.필터 설계의 원리.컴퓨터 비전 및 응용 프로그램 핸드북.1999년 아카데미 출판사
  6. ^ H. Farid와 E. P. Simoncelli, Optimally-Equivariant 방향 유도 유도 커널, Int'l Conf 컴퓨터 분석 이미지 및 패턴, 페이지 207–214, 1997년 9월.
  7. ^ H. Farid 및 E. P. Simoncelli, 이산 다차원 신호차별화, IEEE 트랜스 이미지 처리, vol.13(4), 페이지 496–508, 2004년 4월.
  8. ^ D. Kroon, 2009, 단기 논문 대학 20e, 커널 기반 이미지 파생 모델의 수치 최적화.
  9. ^ A. Haste, "복중 필터링 접근법에 의한 1, 2차 파생상품에 대한 단순 필터 설계", Vol. 42, No.1, 6월 1일, 페이지 65–71. 2014.
  10. ^ Dim, Jules R.; Takamura, Tamio (2013-12-11). "Alternative Approach for Satellite Cloud Classification: Edge Gradient Application". Advances in Meteorology. 2013: 1–8. doi:10.1155/2013/584816. ISSN 1687-9309.
  11. ^ Scharr, Hanno (2007). "Optimal Filters for Extended Optical Flow". Complex Motion. Lecture Notes in Computer Science. Vol. 3417. Berlin, Heidelberg: Springer Berlin Heidelberg. pp. 14–29. doi:10.1007/978-3-540-69866-1_2. ISBN 978-3-540-69864-7.
  12. ^ 샤르, 한노, 2007년 9월 3-7일, 폴란드 포즈난, 제 15차 유럽 신호 처리 회의(EUSIPCO 2007)를 위한 최적의 2차 주문 파생 필터 제품군 파생 필터 제품군

외부 링크