OpenSMILE
OpenSMILE| 개발자 | 오디오 Gmbh |
|---|---|
| 초기 릴리즈 | 2010년 9월, 전( |
| 안정된 릴리스 | 3.0.1[1] / 2022년 1월 , 전( |
| 기입처 | C++ |
| 플랫폼 | Linux, macOS, Windows, Android, iOS |
| 유형 | 기계 학습 |
| 면허증. | 소스 사용 가능, 독자 사양 |
| 웹 사이트 | audeering.com |
openSMILE은 오디오 신호에서 기능을 자동으로 추출하고 음성과 음악 신호를 분류하기 위한 소스 사용 가능한 소프트웨어입니다."SMILE"은 "Speech & Music Interpreteration by Large-Space Extraction"의 약자입니다.이 소프트웨어는 주로 자동 감정 인식 영역에 적용되며 감성 컴퓨팅 연구 커뮤니티에서 널리 사용되고 있습니다.오픈스마일 프로젝트는 2008년부터 존재하며 2013년부터 독일 audEERING GmbH사가 운영하고 있습니다.openSMILE은 연구 목적 및 개인 사용을 위해 소스 이용 가능한 라이센스로 무료로 제공됩니다.이 툴을 상업적으로 사용하기 위해 AudEERING에서는 커스텀 라이선스 옵션을 제공하고 있습니다.
응용 프로그램 영역
openSMILE은 실시간 음성 및 음악 신호를 자동으로 분석하기 위해 학술 연구 및 상업 용도로 사용됩니다.음성 신호로부터 음성 컨텐츠를 추출하는 자동 음성 인식과는 대조적으로, openSMILE은 주어진 음성 또는 음악 세그먼트의 특성을 인식할 수 있습니다.인간의 언어에서 코드화된 그러한 특징의 예로는 화자의 감정,[3] 나이, 성별, 성격뿐만 아니라 우울증, 중독 또는 발성 병리 장애와 같은 화자의 상태가 있다.이 소프트웨어는 코러스 세그먼트, 키, 코드, 템포, 미터, 댄스 스타일 및 장르를 자동 음악 분류 및 인식하기 위한 음악 분류 기술을 포함합니다.
오픈SMILE 툴킷은 Interspech ComParE,[4] AVEC,[5] [6]MediaEval,[7] EmotiW 등의 다양한 연구 대회에서 벤치마크로 사용됩니다.
역사
오픈스마일 프로젝트는 2008년 유럽연합(EU)의 연구 프로젝트인 SEMAIN 내 뮌헨 공과대학의 Florian Eyben, Martin Wölmer 및 Björn Schuller에 의해 시작되었습니다.SEMAIN 프로젝트의 목표는 감성 및 사회적 지능을 갖춘 가상 에이전트를 개발하는 것이었습니다.이 시스템에서는 말 및 감정의 실시간 분석을 위해 openSMILE이 적용되었습니다.최종 SEMAIN 소프트웨어 릴리스는 오픈을 기반으로 합니다.스마일 버전 1.0.1
2009년, 감정 인식 툴킷(openEAR)은 오픈을 기반으로 발행되었다.스마일. 'EAR'는 'Emotion and Affect Recognition'의 줄임말이에요.
2010년에는 openSMILE 버전 1.0.1이 발표되어 ACM 멀티미디어 오픈 소스 소프트웨어 챌린지에서 소개되어 수상되었습니다.
2011년부터 2013년까지 오픈 테크놀로지는FLORian Eyben과 Felix Weninger는 뮌헨 공과대학 박사학위 논문을 통해 스마일 확장 및 개선하였습니다.이 소프트웨어는 유럽 연합의 자금 지원을 받은 ASC-Inclusion 프로젝트에도 적용되었습니다.이 프로젝트를 위해 Erik Marchi는 자동 감정 인식과 시각화를 기반으로 자폐아들에게 감정 표현을 가르치기 위해 소프트웨어를 확장했습니다.
2013년, AudEERING은 뮌헨 기술 대학으로부터 코드 베이스에 대한 권리를 취득해, 소스 이용 가능한 연구 라이센스로 버전 2.0을 공개했습니다.
openSMILE은 2016년까지 전 세계에서 5만 건 이상 다운로드되어 감정인식 표준 툴킷으로 자리매김하고 있습니다.
어워드
openSMILE은 2010년 ACM 멀티미디어 오픈 소스 경연대회에서 수상되었습니다.이 소프트웨어 도구는 자동 감정 인식에 관한 수많은 과학 출판물에 적용되어 있습니다.openSMILE 및 그 내선번호 오픈EAR는[9] 지금까지 1000개 이상의 과학 출판물에서 인용되고 있다.
레퍼런스
- ^ "Release openSMILE 3.0.1". Retrieved 5 January 2022.
- ^ F. Eyben, M. Wölmer, B.슐러: ★오픈스마일 - 뮌헨의 범용 고속 오픈 소스 오디오 기능 추출기, In Proc.ACM 멀티미디어(MM), ACM, 이탈리아 플로렌스, ACM, 1459-1462, 2010년 10월
- ^ B. 슐러, B.블라센코, F. 아이벤, M. 뵐머, A.스툴사츠, A.Wendemuth, G. Rigoll, "Cross-Corpus 음향 감정 인식: ACII 2015 Proc'에서 중국 시안(西安)은 영향 컴퓨팅에 관한 IEEE 거래에서 가장 영향력 있는 기사에 관한 특별 세션에 초대되었습니다.
- ^ B. 슐러, S. 스티들, A. 배틀라이너, J. 히르슈버그, J. K. 버군, A.Elkins, Y. Zhang, E. Coutinhu: "Interspeech 2016 Computational Paralinguistics Challenge: "The Interspeech 2016 Computational Paralinguistics Challenge: Defession & Integrity Archived 2017-06-09 at the Wayback Machine," Proceedings INTSPEECH 2016, ISCA, San Francisco, 2016, 2016.
- ^ F. Ringeval, B.2015년 10월 제23회 ACM 국제멀티미디어회의의 프로시딩스, M. Valstar, R. Cowie, M. Pantic, "AVEC 2015 - The 5th International Audio/Visual Emotion Challenge and Workshop"에서 슐러, M. Valstar, M. Pantic, ACM, 2015년 10월.
- ^ M. 에스케비치, R.알리, D.Racca, R. Ordelman, S.Chen, G. J. Jones, "MediaEval 2014에서 검색 및 하이퍼링크 작업"
- ^ F. Ringeval, S. Amiriparian, F.아이벤, K셰러, BSchuller, ICMI 2014 EmotiW – 야생 도전 및 워크숍(EmotiW 2014), 제16회 ACM 국제회의 위성, "자연에서의 감정 인식: 다중 모달 의사결정 수준 퓨전에서의 음성 및 입술 활동 통합"480, ACM, 2014년 11월
- ^ Eyben, Florian; Wöllmer, Martin; Schuller, Björn (26 April 2018). "Opensmile: the munich versatile and fast open-source audio feature extractor". ACM. pp. 1459–1462 – via Google Scholar.
- ^ Eyben, Florian; Wöllmer, Martin; Schuller, Björn (26 April 2018). "OpenEAR—introducing the Munich open-source emotion and affect recognition toolkit". IEEE. pp. 1–6 – via Google Scholar.