기하학적 특징 학습
Geometric feature learning기하학적 특징 학습은 시각 작업을 해결하기 위해 기계 학습과 컴퓨터 비전을 결합한 기술입니다.이 방법의 주요 목표는 이미지에서 기하학적 특징을 수집하고 효율적인 기계 학습 방법을 사용하여 학습함으로써 물체를 나타낼 기하학적 형태의 대표 특징 집합을 찾는 것이다.인간은 시각적인 일을 해결하고 그들이 보는 것에서 지각적인 정보를 추출함으로써 환경에 빠르게 반응할 수 있다.연구자들은 컴퓨터 시력 문제를 해결하기 위해 사물을 인식하는 인간의 능력을 시뮬레이션합니다.예를 들어 M. Mata 등(2002)은 장애물을 피하기 위해 모바일 로봇 내비게이션 작업에 기능 학습 기법을 적용했다.그들은 특징을 배우고 물체(그림)를 인식하기 위해 유전 알고리즘을 사용했다.기하학적 특징 학습 방법은 인식 문제를 해결할 수 있을 뿐만 아니라 순차적 입력 감각 이미지 세트를 분석함으로써 후속 행동을 예측할 수 있다. 대개 이미지의 일부 추출 특징.학습을 통해 다음 동작에 대한 가설이 제시되고 각 가설의 확률에 따라 가장 가능성이 높은 동작을 제시합니다.이 기술은 인공지능 분야에서 널리 사용되고 있다.
서론
기하학적 특징 학습 방법은 이미지에서 독특한 기하학적 특징을 추출합니다.기하학적 피쳐는 점, 선, 곡선 또는 표면과 같은 기하학적 요소 집합으로 구성된 객체의 피쳐입니다.이러한 특징은 모서리 형상, 모서리 형상, 블롭, 능선, 돌출점 영상 텍스처 등이 될 수 있으며, 이는 형상 감지 방법으로 탐지할 수 있습니다.
기하학적 특징
- 기본 기능
- 모서리: 모서리는 매우 단순하지만 사물의 중요한 기능입니다.특히 복잡한 개체는 일반적으로 서로 다른 모서리 특징을 가집니다.물체의 모서리는 모서리 검출을 통해 추출할 수 있습니다.Cho와 Dunn은 두 직선 세그먼트 사이의 거리와 각도로 코너를 정의하는 다른 방법을 사용했습니다.이는 피쳐를 여러 구성요소의 매개 변수화된 구성으로 정의하는 새로운 방법입니다.
- 엣지: 엣지는 이미지의 1차원 구조 기능입니다.이들은 서로 다른 영상 영역의 경계를 나타냅니다.물체의 윤곽은 가장자리 검출 기법을 사용하여 가장자리를 찾는 것으로 쉽게 검출할 수 있습니다.
- 블럽: 블럽은 이미지의 영역을 나타내며 블럽 검출 방법을 사용하여 검출할 수 있습니다.
- 능선: 실용적인 관점에서 능선은 대칭의 축을 나타내는 1차원 곡선으로 생각할 수 있습니다.능선검출방법-능선검출 참조
- 요점 - 카디르-브래디 염도 검출기 참조
- 이미지 텍스처
- 복합[3] 기능
- 기하학적 구성
기하학적 컴포넌트 피쳐는 몇 가지 기본 피쳐의 조합으로 가장자리, 모서리 또는 블럽과 같은 기본 피쳐를 항상 2개 이상 구성합니다.위치 x에서의 기하학적 특징 벡터 추출은 아래 표시된 참조점에 따라 계산할 수 있습니다.
x는 피쳐의 위치, \ \는 방향, textstyle \은 고유 축척을 나타냅니다.
- 부울 구성
부울 복합 피쳐는 원시 피쳐 또는 복합 피쳐일 수 있는2개의 서브 피쳐로 구성됩니다.부울 기능에는 2가지 타입이 있습니다.값이 2개의 서브 기능의 산물인 접속 피쳐와 2개의 서브 기능의 최대값인 접속 피쳐입니다.
피처 스페이스
Segen은 [4]컴퓨터 비전 영역에서 특징 공간을 먼저 고려했다.그는 다단계 그래프를 사용하여 국소 피쳐의 기하학적 관계를 표현했습니다.
학습 알고리즘
이미지에서 물체의 특징적인 특징을 찾는 것을 배우는 데 적용할 수 있는 많은 학습 알고리즘이 있습니다.학습은 증분할 수 있습니다. 즉, 오브젝트 클래스는 언제든지 추가할 수 있습니다.
기하학적 특징 추출 방법
기능 학습 알고리즘
1. 새로운 교육 이미지 "I"를 획득합니다.
2.인식 알고리즘에 따라 결과를 평가한다.결과가 참이면 새 개체 클래스가 인식됩니다.
- 인식 알고리즘
인식 알고리즘의 핵심은 모든 클래스의 모든 기능 중에서 가장 독특한 기능을 찾는 것입니다.따라서 다음 방정식을 사용하여 max})를 최대화합니다.
의 값 f m x\ \\ x \\\ { 를 측정하여 피쳐를 현지화합니다.
서 ff () () { : {0, ( ) ( x )( ( x ) (x ) ‖ f ( x ) f ( ) ‖{\ f _ _ { f _ { f _ { f _ f _ f _ f _ f _ f _ f _ f _ f _ f _ f _ f _ { p ( i ( } } ( x ) } ( x ) } (
- 평가하기
특성을 인식한 후, 그 결과를 평가하여 분류를 인식할 수 있는지 여부를 결정해야 한다. 인식 결과에는 5가지 평가 범주가 있다. 정답, 틀림, 모호함, 혼란 및 무지이다.평가가 올바르면 새로운 트레이닝 이미지를 추가하여 트레이닝합니다.인식에 실패했을 경우 기능 노드는 Kolmogorov-Smirno 거리(KSD)에 의해 정의되는 고유 전력을 최대화해야 합니다.
3. 특징 학습 알고리즘 어떤 특징이 인식된 후, 그 특징을 테스트하기 위해 특징 학습 알고리즘을 사용하여 이미지를 인식하기 위해 베이지안 네트워크에 적용해야 합니다.
- 기능 학습 알고리즘의 주된 목적은 샘플 이미지에서 새로운 기능을 찾아 클래스가 인식되는지 여부를 테스트하는 것입니다.두 가지 경우를 고려해야 합니다. 샘플 이미지에서 각각 진정한 클래스의 새로운 기능과 잘못된 클래스의 새로운 기능을 검색하는 것입니다.True 클래스의 새로운 기능이 검출되어도 잘못된 클래스가 인식되지 않으면 클래스가 인식되고 알고리즘이 종료됩니다.샘플 이미지에서 true 클래스의 피쳐가 검출되지 않고 false 클래스의 피쳐가 검출된 경우 false 클래스의 인식을 방지하고 해당 피쳐를 베이지안 네트워크에서 삭제해야 합니다.
- 베이지안 네트워크를 사용하여 테스트 프로세스 실현
PAC 모델 기반 기능 학습 알고리즘
학습 프레임워크
D는 대략적으로 올바른(PAC) 모델을 적용했습니다.Roth(2002)는 이 [5]모델을 기반으로 배포 없는 학습 이론을 개발하여 컴퓨터 비전 문제를 해결하였다.이 이론은 기능 효율적인 학습 접근법의 개발에 크게 의존했습니다.이 알고리즘의 목적은 이미지에서 몇 가지 기하학적 특징에 의해 표현되는 객체를 학습하는 것입니다.입력은 피쳐 벡터이며 출력은 1 이며, 그렇지 않으면0 이 됩니다.이 학습 접근방식의 핵심은 함수를 통해 객체를 나타낼 수 있는 대표 요소를 수집하고 이미지에서 객체를 인식하여 높은 확률로 표현하도록 테스트하는 것이다.학습 알고리즘은 학습된 T(X ) \ \f_)}가 클래스에 속하는지 여부를 예측하는 것을 목적으로 합니다.여기서 X는 파라미터로 구성된 인스턴스 공간입니다.그리고 예측이 맞는지 테스트합니다.
평가 프레임워크
기능을 학습한 후에는 학습 알고리즘을 평가하기 위한 몇 가지 평가 알고리즘이 있어야 합니다.D. Roth는 두 가지 학습 알고리즘을 적용했다.
- 1. Winnows(SNoW) 시스템의 희박 네트워크
- SNoW-트레인
- 번째 단계: 모든대해 타겟 t에 링크된 F t {\ \{t}=\의 집합을 초기화합니다. T는 1 { \ ~ style }의 요소를 가진 객체 타겟 세트입니다.
- 세트 T의 각 타깃오브젝트가 액티브한 기능의 리스트에 속해 있는 경우는, 피쳐를 타겟에 링크 해, 초기 웨이트를 동시에 설정합니다.
- 타겟을 평가합니다.타깃 i \\ \ e } w _ { sum } w _ { } { 와 t { {} { } 。여기서 는 의 위치에 대한 가중치입니다.\theta_{t}는 t가 아닌 타겟의 임계값입니다.
- 평가 결과에 따라 중량을 갱신한다.두 경우:부정적인 예(나는 나는 을 하루에 500파운드,θ지{\displaystyle \textstyle{\underset{i\in e}{\sum}}w_{나는}^{t}>\theta_{t}}과 목표물에 적극적인 형상의 목록에 있지 않습니다 ew∈ ∑)에 긍정적인(예를 들∑ 나는 ∈ e맞춤 나는 하루에 500파운드≤θ지{\displaystyle \textst에 부정적인 예측했다 긍정적인 예상이다.yle{\ e}} _ 이며 타겟은 활성 기능 목록에 있습니다
- SNoW 평가
- 위에서 소개한 것과 동일한 기능을 사용하여 각 대상을 평가합니다.
- 예측:주요 활성 대상 노드를 선택할지 결정합니다.
SVM의 주요 목적은 샘플(yi를 분리하는 하이퍼플레인(을 찾는 것입니다.서 xidisplaystyle \는 입력 벡터이며, xi})는 x R} 및 {displaystyle {의 특징 선택입니다.style 는 의 라벨입니다.하이퍼플레인 형식은 과 같습니다 (x ) ( i l k ( , ) + ) { , 、 p s n p s- , e n \ styleft \ f ( x ) = left sum )
\i})는 커널 함수입니다.
두 알고리즘 모두 선형 함수를 찾아 교육 데이터를 분리합니다.
적용들
레퍼런스
- ^ M. Mata와 J. M. Armingol과 A.De La Escalera와 M. A. Salichs, "모바일 로봇 내비게이션의 시각적 랜드마크 학습", 2002년 국제자동제어연맹 제15회 세계회의 속행
- ^ Cho, K., Dunn, S.M. "형상 수업 배우기"IEEE 패턴 분석 및 머신 인텔리전스에 관한 트랜잭션 16,9(1994), 882-888
- ^ Justus H Piater, 비주얼 기능 학습(2001년 1월 1일).UMass Amherst의 전자 박사 학위 논문.용지 AAI3000331
- ^ Segen, J. 모양의 그래프 모형을 학습합니다.제5회 기계학습 국제회의의 진행(Ann Arbor, 1988년 6월 12일~14일)에서 J. Larid, Ed, Morgan Kaufmann
- ^ D. Roth, M-H. Yang, N.아하하. 3차원 물체를 인식하는 법을 배우고 있어.Neural Computation, 14(5): 1071–1104, 2002.
- ^ M. Mata, J. M. Armingol, 모바일 로봇 내비게이션용 시각적 랜드마크 학습, 시스템 엔지니어링 및 자동화 부문, 스페인 마드리드, 2002
- ^ I. A. Rybak, BMV: 시각지각과 인식의 행동모델, 인간의 시각, 시각처리 및 디지털 디스플레이 IV
- ^ P. Fitzpatrick, G. Metta, L. Natale, S. Rao 및 G. Sandini, IEEE Int.의 "행동을 통한 물체에 대한 학습 - 인공 인식을 위한 초기 단계"로봇공학 및 자동화에 관한 회의, 2003, 3140–3145페이지.
- ^ J.M. 페리맨, A.D.Worrall, S.J. Maybank.차량 추적을 위한 향상된 3D 모델을 학습합니다.1998년 영국 기계 비전 회의 대리