음성 검색

Voice search

음성 지원이라고도 불리는 음성 검색은 사용자음성 명령을 사용하여 인터넷, 웹 사이트 또는 앱을 검색할 수 있도록 합니다.

보다 넓은 정의에 따르면 음성 검색에는 Google 음성 검색, Cortana, SiriAmazon Echo 등 인터넷 상의 모든 정보에 대한 open-domain 키워드 쿼리가 포함됩니다.

음성 검색은 대부분의 경우 인터랙티브하며, 시스템에서 해명을 요구할 수 있는 여러 라운드의 상호 작용이 수반됩니다.음성 검색은 대화 시스템의 한 종류입니다.

음성 검색은 입력된 검색을 대체하는 것이 아닙니다.오히려 검색어, 경험치 및 사용 사례는 입력 유형에 따라 크게 다를 수 있습니다.

방법

음성 검색은 사용자가 입력이 아닌 음성 명령을 사용하여 검색할 수 있는 검색 방법입니다.검색은 음성 입력이 있는 모든 장치에서 수행할 수 있습니다.음성 검색을 유효하게 하기 위한 일반적인 방법에는, 다음의 3가지가 있습니다.

  1. 음성 명령 아이콘을 클릭합니다.
  2. 가상 어시스턴트의 이름을 호출합니다.
  3. 홈 버튼 또는 인터페이스 제스처를 클릭합니다.

가상 어시스턴트를 활성화합니다.

애플: 안녕, 시리

구글: OK, 구글

아마존: 이봐, 알렉사

Microsoft:이봐, 코타나

삼성:안녕 빅스비

지원되는 언어

언어는 시스템이 이해하는 가장 중요한 요소이며 사용자가 검색하는 것의 가장 정확한 결과를 제공합니다.언어, 사투리 및 억양을 모두 이해할 수 있는 음성 비서가 필요하기 때문에 언어, 사투리 및 억양을 모두 지원합니다.

구어와 문자는 다르지만 음성 검색은 음성을 텍스트로 변환하고 도움말 음성 인식을 사용하여 일반 텍스트 검색을 수행하는 대신 자연스러운 구어를 지원해야 합니다.

예를 들어, 입력된 검색에서는 eCommerce 사용자가 영숫자 제품 코드를 쉽게 복사하여 검색 필드에 붙여넣을 수 있지만, 말할 때는 "Samsung의 새로운 Bluetooth 헤드폰을 보여 주세요"와 같이 검색어가 크게 다를 수 있습니다.

구조

텍스트 검색과 음성 검색의 차이는 입력 유형뿐만이 아닙니다.메커니즘은 입력을 위한 자동 음성 인식(ASR)을 포함해야 하지만 "What's the United States for the United States"와 같은 자연스러운 음성 검색 질의에 대한 자연 언어 이해를 포함할 수도 있습니다.

TTS(Text-to-Speech) 또는 출력 모달리티의 일반 디스플레이를 포함할 수 있습니다.사용자가 웨이크 워드를 사용하여 검색을 활성화해야 할 수 있습니다.

그러면 검색 시스템은 사용자가 사용하는 언어를 탐지합니다.그런 다음 문장의 키워드와 맥락을 탐지합니다.마지막으로 디바이스는 출력에 따라 결과를 반환합니다.화면이 있는 단말기는 결과를 표시하는 반면 화면이 없는 단말기는 검색기에 결과를 회신합니다.

「 」를 참조해 주세요.

레퍼런스