키워드 스팟팅
Keyword spotting키워드 스팟팅(또는 더 단순하게, 단어 스팟팅)은 음성 처리의 맥락에서 역사적으로 처음 정의한 문제다.[1][2] 음성 처리에서 키워드 식별은 말에서 키워드를 식별하는 것을 다룬다.
키워드 스팟팅도 문서 이미지 처리의 맥락에서 별개지만 관련성이 있는 문제로 정의된다.[1] 문서 이미지 처리에서 키워드 스팟팅은 검색된 문서 이미지에 존재하는 쿼리 단어의 모든 인스턴스를 완전히 인식하지 못한 채 찾는 문제다.
스피치 프로세싱에서
키워드 스팟팅의 첫 작품은 1980년대 후반에 등장했다.[2]
키워드 스팟팅의 특별한 사례는 알렉사나 시리 등 개인 디지털 도우미가 이름을 말할 때 '깨어난다'는 의미로 사용하는 웨이크 워드(핫 워드라고도 함) 검출이다.
미국에서는 국가안보국이 적어도 2006년부터 키워드 스팟팅을 활용하고 있다.[3] 이 기술은 분석가들이 대량의 녹음된 대화를 검색하고 의심스러운 키워드를 언급하는 것을 분리할 수 있게 해준다. 녹화는 인덱싱될 수 있고 분석가는 관심 있는 대화를 찾기 위해 데이터베이스를 통해 쿼리를 실행할 수 있다. IARPA는 바벨 프로그램의 키워드 발견에 대한 연구에 자금을 지원했다.
이 작업에 사용되는 알고리즘은 다음과 같다.
문서 이미지 처리 중
문서 이미지 처리에서 키워드를 포착하는 것은 콘텐츠 기반 이미지 검색(CBIR)의 보다 일반적인 문제의 한 예라고 볼 수 있다. 쿼리가 주어질 경우, 검색된 문서 모음에서 가장 관련성이 높은 단어 인스턴스를 검색하는 것이 목표다.[1] 쿼리는 텍스트 문자열(열별 키워드 스팟팅) 또는 단어 이미지(예: 쿼리 키워드 스팟팅)일 수 있다.
참조
- ^ a b c Giotis, A.P; Sfikas, G.; Gatos, B.; Nikou, C. (2017). "A survey of document image word spotting techniques". Pattern Recognition. 68: 310–332. doi:10.1016/j.patcog.2017.02.023.
- ^ a b Rohlicek, J.; Russell, W.; Roukos, S.; Gish, H. (1989). "Continuous hidden Markov modeling for speaker-independent word spotting". Proceedings of the 14th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). 1: 627–630.
- ^ Froomkin, Dan. "THE COMPUTERS ARE LISTENING". The Intercept. Retrieved 20 June 2015.
- ^ Sainath, Tara N and Parada, Carolina (2015). "Convolutional neural networks for small-footprint keyword spotting". Sixteenth Annual Conference of the International Speech Communication Association. arXiv:1711.00333.CS1 maint: 여러 이름: 작성자 목록(링크)
