포즈(컴퓨터 비전)

Pose (computer vision)

컴퓨터 및 컴퓨터 비전 분야에서 포즈(또는 공간 포즈)는 일반적으로 [1]3차원으로 물체의 위치방향을 나타냅니다.포즈는 변환 [2][3]행렬로 내부에 저장되는 경우가 많습니다."포즈"라는 용어는 "변신"이라는 용어와 대체로 동의어이지만, 변형은 종종 규모를 포함할 수 있지만,[4][5] 포즈는 그렇지 않습니다.

컴퓨터 비전에서 객체의 자세는 종종 자세 추정 과정에 의해 카메라 입력으로부터 추정됩니다.이 정보는 예를 들어, 로봇이 물체를 조작할 수 있게 하거나 환경에서 인지된 위치와 방향에 따라 물체 안으로 이동하는 것을 방지하는 데 사용될 수 있습니다.다른 응용 분야로는 골격 작용 인식이 있습니다.

포즈추정

이미지(또는 스테레오 이미지, 이미지 시퀀스)에서 객체의 포즈를 결정하는 특정 작업을 포즈 추정이라고 합니다.포즈 추정 문제는 이미지 센서 구성 및 방법론 선택에 따라 다양한 방법으로 해결할 수 있습니다.방법론의 세 가지 클래스를 구분할 수 있습니다.

  • 분석 또는 기하학적 방법: 이미지 센서(카메라)가 보정되고 장면의 3D 지점과 이미지의 2D 지점으로부터의 매핑이 알려져 있는 경우.객체의 기하학적 구조도 알려진 경우, 카메라 영상에 투영된 객체의 이미지가 객체의 포즈에 대한 잘 알려진 기능임을 의미합니다.객체(일반적으로 모서리 또는 다른 특징점) 상의 제어점 세트가 식별되면, 포인트의 3차원 좌표와 2차원 영상 좌표를 연관시키는 방정식 세트에서 포즈 변환을 해결할 수 있습니다.점들 간의 대응 관계가 아직 알려지지 않은 경우, 다른 점 구름에 대한 구름의 자세를 결정하는 알고리즘을 점 집합 등록 알고리즘이라고 합니다.
  • 유전 알고리즘 방법:물체의 자세를 실시간으로 계산할 필요가 없는 경우 유전자 알고리즘을 사용할 수 있습니다.이 접근 방식은 특히 영상이 완벽하게 보정되지 않은 경우에 강력합니다.이 경우 포즈는 유전적 표현을 나타내며 객체 제어점의 투영과 이미지 사이의 오차는 적합도 함수입니다.
  • 학습 기반 방법:이러한 방법은 2D 이미지 특징에서 변환 포즈를 취하기 위해 매핑을 학습하는 인공 학습 기반 시스템을 사용합니다.즉, 학습 단계 동안 다양한 포즈로 충분히 큰 객체 이미지 세트가 시스템에 제공되어야 한다는 것을 의미합니다.학습 단계가 완료되면, 시스템은 객체의 이미지가 주어진 객체의 자세에 대한 추정치를 제시할 수 있어야 합니다.

카메라 포즈

카메라 절제는 주어진 사진 또는 비디오를 생성한 카메라에 근접하는 핀홀 카메라 모델의 파라미터를 추정하는 과정이며, 어떤 입사 광선이 결과 이미지의 각 픽셀과 연관되어 있는지를 결정합니다.기본적으로 핀홀 카메라의 자세를 결정하는 과정입니다.

일반적으로 카메라 파라미터는 카메라 매트릭스라고 하는 3×4 프로젝션 매트릭스로 표시됩니다.외부 매개 변수는 카메라 포즈(위치 및 방향)를 정의하고, 고유 매개 변수는 카메라 영상 형식(초점 길이, 픽셀 크기 및 이미지 원점)을 지정합니다.

이 프로세스는 종종 기하학적 카메라 보정 또는 단순히 카메라 보정이라고 불리지만, 이 용어는 광도 측정 카메라 보정을 의미하거나 고유 파라미터의 추정에만 제한될 수도 있습니다.외부 방향과 내부 방향은 각각 외부 매개변수와 고유 매개변수만을 결정하는 것을 말합니다.

기존 카메라 보정에는 장면에 특수 물체가 필요하며, 카메라 자동 보정에서는 이 물체가 필요하지 않습니다.

카메라 절제는 두 카메라의 카메라 투영 행렬을 사용하여 두 카메라가 모두 보는 점의 3D 세계 좌표를 계산하는 스테레오 비전의 응용 분야에서 종종 사용됩니다.

참고 항목

참고문헌

  1. ^ Hoff, William A.; Nguyen, Khoi; Lyon, Torsten (1996-10-29). Casasent, David P. (ed.). "Computer-vision-based registration techniques for augmented reality". Intelligent Robots and Computer Vision XV: Algorithms, Techniques,Active Vision, and Materials Handling. SPIE. 2904: 538–548. Bibcode:1996SPIE.2904..538H. doi:10.1117/12.256311. S2CID 6587175.
  2. ^ "Pose (Position and Orientation)".
  3. ^ "Transformation matrices to geometry_msgs/Pose - ROS Answers: Open Source Q&A Forum".
  4. ^ "Drake: Spatial Pose and Transform".
  5. ^ "Apple Developer Documentation".