얼굴 인식 그랜드 챌린지

Face Recognition Grand Challenge
Final Large logo.png

안면인식 그랜드 챌린지(FRGC)는 안면인식 기술의 홍보와 발전을 위해 진행됐다.얼굴 인식 공급업체 테스트의 후속 제품이었다.

개요

FRGC의 1차 목표는 미국 정부의 기존 얼굴 인식 노력을 지원하기 위해 고안된 얼굴 인식 기술을 촉진하고 발전시키는 것이었다.FRGC는 새로운 얼굴 인식 기법과 프로토타입 시스템을 개발하면서 성능을 대폭 향상시켰다.FRGC는 기업, 학계, 연구기관의 인정 연구자와 개발자를 대면할 수 있도록 개방되었다.FRGC는 2004년 5월부터 2006년 3월까지 운영되었다.

FRGC는 점진적으로 어려운 도전 문제로 구성되었다.각각의 도전 문제는 얼굴 이미지의 데이터 세트와 정의된 실험 세트로 구성되었다.얼굴 인식 개선의 장애물 중 하나는 데이터 부족이다.FRGC 도전 문제는 이러한 장애를 극복하기에 충분한 데이터를 포함한다.일련의 정의된 실험은 연구자와 개발자들이 새로운 성과 목표를 달성하는데 있어 진전을 이루는데 도움을 준다.

얼굴 인식 알고리즘 개선에는 고해상도 영상, 3차원(3D) 얼굴 인식, 새로운 전처리 기법 등 3가지 주요 경쟁사가 있다.FRGC는 동시에 추구하고 있으며 세 가지 기법 모두의 장점을 평가할 것이다.현재의 얼굴 인식 시스템은 비교적 작은 정적인 얼굴 이미지에서 작동하도록 설계되었다.얼굴 크기를 측정하는 전통적인 방법은 눈의 중심 사이의 픽셀 수입니다.현재 이미지에서는 눈의 중심 사이에 40~60픽셀(얼굴에 10,000~20,000픽셀)이 있다.FRGC에서 고해상도 이미지는 평균적으로 눈의 중심 사이에 250픽셀을 가진 얼굴 이미지로 구성된다.FRGC는 고해상도 영상에 내재된 추가 정보를 활용하는 새로운 알고리즘 개발을 촉진할 것이다.

3차원(3D) 얼굴 인식 알고리즘은 사람의 얼굴 3D 모양에서 얼굴을 식별한다.기존 안면인식 시스템에서는 조명(조명)과 안면 자세의 변화가 성능을 떨어뜨린다.얼굴 모양은 조명이나 자세의 변화에 영향을 받지 않기 때문에 3D 안면인식은 이러한 조건에서 성능을 향상시킬 수 있는 잠재력을 가지고 있다.

지난 몇 년 동안 컴퓨터 그래픽과 컴퓨터 조명에 대한 시각의 발전이 있었고 얼굴 이미지의 변화도 있었다.이러한 발전은 조명에 대해 자동으로 수정하고 얼굴 이미지에 변화를 줄 수 있는 새로운 컴퓨터 알고리즘의 개발로 이어졌다.이러한 새로운 알고리즘은 얼굴 인식 시스템을 통해 처리되기 전에 얼굴 이미지를 사전 처리하여 조명과 포즈를 수정하는 방식으로 작동한다.FRGC의 전처리 부분은 새로운 전처리 알고리즘이 인식 성능에 미치는 영향을 측정한다.

FRGC는 명확하게 명시된 목표와 도전 문제를 가진 실험을 통해 자동 얼굴 인식 시스템의 기능을 개선했다.연구자와 개발자는 FRGC 목표를 충족하는 새로운 알고리즘과 시스템을 개발할 수 있다.새로운 알고리즘과 시스템의 개발은 FRGC 도전 문제에 의해 촉진된다.

안면인식 그랜드 챌린지의 구조

FRGC는 연구자들이 FRGC 성능 목표를 달성하도록 도전하도록 고안된 도전 문제를 중심으로 구성된다.

FRGC의 세 가지 측면은 얼굴 인식 커뮤니티에 새로운 것이 될 것이다.첫 번째 측면은 데이터 측면에서 FRGC의 크기다.FRGC 데이터 세트에는 50,000개의 기록이 포함되어 있다.두 번째 측면은 FRGC의 복잡성이다.이전의 얼굴 인식 데이터 세트는 정지 영상으로 제한되었다.FRGC는 다음과 같은 세 가지 모드로 구성된다.

  • 고해상도 스틸 이미지
  • 3D 영상
  • 다인종

세 번째 새로운 측면은 인프라다.FRGC를 위한 인프라는 컴퓨터 실험을 기술하고 문서화하기 위한 XML 기반의 프레임워크인 BEE에 의해 제공될 것이다.BEE는 실험의 설명과 배포, 실험의 원시 결과를 공통 형식으로 기록, 원시 결과를 공통 형식으로 분석 및 표시, 그리고 실험 형식을 공통 형식으로 문서화할 수 있다.컴퓨터 실험 환경이 얼굴 인식이나 생체 인식에서 도전 문제를 지원하는 것은 이번이 처음이다.

FRGC 데이터 세트

FRGC 데이터 분포는 세 부분으로 구성된다.첫 번째는 FRGC 데이터 세트다.두 번째 부분은 FRGC BEE이다.BEE 분포는 6가지 실험을 수행하고 점수를 매기기 위한 모든 데이터 세트를 포함한다.세 번째 부분은 실험 1부터 4까지의 기준 알고리즘 집합이다.세 가지 구성 요소를 모두 갖추면 원시 이미지 처리부터 수신기 작동 특성(ROC) 생성까지 실험 1부터 4까지를 실행할 수 있다.

FRGC용 데이터는 교육용 파티션과 유효성 검사 파티션으로 구분된 50,000개의 기록으로 구성된다.훈련 파티션은 알고리즘 훈련용으로 설계되고 검증 파티션은 실험실 환경에서 접근방식의 성능을 평가하기 위한 것이다.검증 파티션은 4,003개 주제 세션의 데이터로 구성된다.대상 세션은 사람의 생체 데이터가 수집될 때마다 촬영되는 사람의 모든 이미지를 집합한 것으로, 제어되지 않은 정지화상 4개, 제어되지 않은 정지화상 2개, 3차원화상 1개로 구성된다.제어된 이미지는 스튜디오 환경에서 촬영되었으며, 두 개의 조명 조건과 두 개의 얼굴 표정(스마일링 및 중립)으로 촬영된 전면 얼굴 이미지다.제어되지 않은 이미지는 복도, 아트리움 또는 외부와 같은 다양한 조명 조건에서 촬영되었다.각각의 통제되지 않는 이미지 세트에는 웃음과 중성이라는 두 가지 표현이 들어 있다.3D 영상은 제어된 조명 조건에서 촬영되었다.3D 영상은 범위와 텍스처 이미지로 구성된다.3D 영상은 Minolta Vivid 900/910 시리즈 센서에 의해 획득되었다.

FRGC 분포는 6가지 실험으로 구성된다.실험 1에서, 갤러리는 한 사람의 제어된 스틸 이미지로 구성되고 각각의 탐침은 하나의 제어된 스틸 이미지로 구성된다.실험 1은 제어 실험이다.실험 2는 사람의 여러 스틸 이미지를 사용하는 것이 성능에 미치는 영향을 연구한다.실험 2에서 각 생체 샘플은 실험 세션에서 촬영된 사람의 네 개의 통제된 이미지로 구성된다.예를 들어, 갤러리는 모든 이미지가 동일한 주제 세션에서 촬영되는 각 인물의 4개의 이미지로 구성되어 있다.마찬가지로, 탐사는 현재 한 사람의 네 개의 이미지로 구성되어 있다.

실험 3은 3D 얼굴 인식 성능을 측정한다.실험 3에서 갤러리 및 프로브 세트는 사람의 3D 영상으로 구성된다.실험 4는 제어되지 않는 영상에서 인식 성능을 측정한다.실험 4에서 갤러리는 하나의 제어된 정지 이미지로 구성되고, 프로브 세트는 제어되지 않은 정지 이미지 하나로 구성된다.

실험 5와 6은 3D 영상과 2D 영상을 비교한다.두 실험 모두에서 갤러리는 3D 영상으로 구성된다.실험 5에서, 프로브 세트는 제어된 단일 스틸로 구성된다.실험 6에서, 프로브 세트는 제어되지 않은 하나의 정지상태로 구성된다.

후원자,

참조

Public Domain이 문서에는 국립표준기술원(National Institute of Standards and Technology) 문서의 공용 도메인 자료가 통합되어 있다."NIST Face Recognition Grand Challenge".

외부 링크