음성 웹

Speech Web은 하이퍼링크된 음성 어플리케이션 모음으로 최종 사용자 디바이스에서 실행되는 음성 브라우저를 통해 원격으로 액세스합니다.링크는 음성 명령을 통해 활성화됩니다.

음성으로 웹서핑을 하는 발상은 적어도 1995년 Hemphill and Thrift가 개발한 시스템으로 거슬러 올라간다.HTML 페이지는 클라이언트 측 컴퓨터에서 다운로드 및 처리되어 웹 페이지 콘텐츠에 대한 음성 액세스와 음성 명령어를 통한 하이퍼링크의 활성화가 가능했다.

또한 1990년대 중반 AT&T의 연구원들은 일반 전화를 통해 웹에 접속할 수 있는 새로운 마크업 언어의 개발에 대해 논의하고 있었다.1995년부터 1999년까지 AT&T, Lucent, Motorola 및 IBM은 모두 전화 및 음성 마크업 언어를 자체 개발했습니다.이들 회사는 VoiceXML Forum을 만들고 Voice Markup Language VXML을 공동으로 설계하여 2000년에 W3C 위원회에서 승인했습니다.VXML은 일반적으로 하이퍼링크 음성 어플리케이션을 ^[2]작성하기 위해 사용됩니다.VXML 페이지에는 사용자 음성 입력 프롬프트, 인식 문법 호출, 합성 음성 출력, 코드 블록을 통한 반복, 로컬 JavaScript 호출 및 기존 웹에서 HTML 페이지 링크와 유사한 방식으로 다운로드된 다른 원격 VXML 페이지로의 하이퍼링크가 포함됩니다.

VXML의 등장과 거의 동시에 캐나다 윈저 대학의 연구 그룹은 웹에 배치된 음성 어플리케이션을 클라이언트 측 음성 브라우저에 의해 액세스 할 수 있는 대체 접근법을 개발하고 있었다.이러한 접근법은 애플리케이션을 다운로드함으로써 음성 인식 기능을 제공하는 클라이언트 측 음성 브라우저에 의해 이용된다.리모트 음성 어플리케이션의 Web 사이트에서, 이온 고유의 인식 문법을 참조해 주세요.클라이언트측 브라우저가 인식한 입력은 리모트서버로 송신되어 리모트서버는 이를 처리하고 브라우저에 텍스트 결과를 반환하여 합성음성으로 출력합니다.SpeechWeb이라는 용어는 1999년에 ^[3]이 아키텍처에서 하이퍼링크된 음성 애플리케이션의 컬렉션을 설명하기 위해 사용되었습니다.최초의 SpeechWeb 브라우저는 AAAI 16번째 인공지능 국가 ^[4]회의에서 시연되었다.

"스피치웹"이라는 용어는 또한 1990년대부터 언어, 언어 및 언어 병리학에 관한 정보의 웹 기반 네트워크를 설명하기 위해 다른 맥락에서 사용되어 왔다.또, 커뮤니케이션 장애의 영향을 받고 있는 전문가와 상담하는 장소도 제공되고 싶다고 생각하고 있습니다."speech Web"이라는 용어는 현재 HP가 소유하고 있는 Pipe Beach 회사에 의해 상표로 등록되었으며 전화 네트워크와 기존 웹 서버를 연결하는 소프트웨어 제품을 의미합니다.

2005년에는 VXML의 성숙에도 불구하고 인터넷을 통해 대중이 이용할 수 있는 음성 애플리케이션이 매우 적다는 것이 인정되었습니다.또한 이용 가능한 거의 모든 VXML 애플리케이션은 상공업 종사자들에 의해 구축되고 있는 것으로 관찰되었습니다.이것은 전통적인 웹의 거대한 성장, 국민의 생명과 HTML의 개발이 오직 몇년 후에 일반 웹 페이지의 개발에서 이 거대한 개입이 대조적. 이 관찰은 대중에게 연설 플러그 인을 지닌 기존의 웹 브라우저(을 통해 접근할 수 있는 Public-Domain SpeechWeb[5]의 호출하게 만들었다.)또한 일반 웹에서 HTML 페이지를 만들고 배포하는 것과 유사한 방식으로 일반에 의해 작성 및 배포되는 하이퍼링크된 음성 애플리케이션을 포함합니다.Public-Domain SpeechWeb용 브라우저는 2007년 ^[6]캐나다 밴프에서 열린 제16회 국제 월드 와이드 웹 컨퍼런스에서 시연되었습니다.브라우저는 무료로 제공되는 Opera에서 IBM 음성 인식 플러그인을 사용하여 실행되는 작은 X+V 페이지입니다.

두 연구 그룹은 비전문가의 SpeechWeb 애플리케이션 구축 및 배포를 촉진하기 위한 소프트웨어를 개발하고 있습니다.

Windsor 대학의 「MySpeechWeb」연구 그룹은, SpeechWeb 애플리케이션에의 액세스나 작성에 도움이 되는 문서와 소프트웨어를 개발했습니다.이 그룹은 또한 포털을 통해 이용할 수 있는 음성 애플리케이션의 예를 포함하는 Public-Domain SpeechWeb 프로토타입을 만들었다.
일본 와카야마 대학 청각 미디어 연구소의 "w3voice frecale" 연구 그룹은 일본어를 위한 음성 애플리케이션의 구축과 전개를 용이하게 하는 소프트웨어를 개발했습니다.

레퍼런스

^ 제3회 ACM 국제멀티미디어컨퍼런스(샌프란시스코 1995), 1995년, 페이지: 215 ~ 222 의 「보이스에 의한 Web 서핑」.
^ 루카스, B"웹 기반 분산 대화 애플리케이션을 위한 VoiceXML"커뮤니케이션. ACM 43, 9, 연도: 2000, 페이지: 53 ~57 。
^ PACLING '99, The Conference of the Pacific Association for Computational Languageology, Canada, Waterloo, Ontario, University of Waterloo, Canada, 1999년, "대규모 지식 기반에 자연스러운 언어 접근을 제공하기 위한 새로운 접근법" 프로시저:
^ 프로스트, R. A. "전적으로 실행 가능한 사양으로 구성된 자연 언어 음성 인터페이스"미국 플로리다주 올랜도, 제16회 인공지능 전국회의 및 제11회 인공지능 혁신적 응용에 관한 회의의 진행 1999년, 페이지: 908 - 909.
^ 프로스트, R.A. "퍼블릭 도메인 스피치 웹에 대한 요청" 커뮤니티. ACM 48, 11, 2005, 페이지: 45 ~49 。
^ Frost, R. A., Ma, X. 및 Shi, Y. "퍼블릭 도메인 Speech Web을 위한 브라우저." World Wide Web Conference, Banff, Canada Year: 2007, 페이지: 1307 ~1308.

외부 링크

My Speech Web - 윈저 대학 연구 그룹
Public Domain Speech Web 비디오 시연

[HemphillThrift1995-1] 제3회 ACM 국제멀티미디어컨퍼런스(샌프란시스코 1995), 1995년, 페이지: 215 ~ 222 의 「보이스에 의한 Web 서핑」.

[Lucas2000-2] 루카스, B"웹 기반 분산 대화 애플리케이션을 위한 VoiceXML"커뮤니케이션. ACM 43, 9, 연도: 2000, 페이지: 53 ~57 。

[FrostChitte1999-3] PACLING '99, The Conference of the Pacific Association for Computational Languageology, Canada, Waterloo, Ontario, University of Waterloo, Canada, 1999년, "대규모 지식 기반에 자연스러운 언어 접근을 제공하기 위한 새로운 접근법" 프로시저:

[Frost1999-4] 프로스트, R. A. "전적으로 실행 가능한 사양으로 구성된 자연 언어 음성 인터페이스"미국 플로리다주 올랜도, 제16회 인공지능 전국회의 및 제11회 인공지능 혁신적 응용에 관한 회의의 진행 1999년, 페이지: 908 - 909.

[Frost2005-5] 프로스트, R.A. "퍼블릭 도메인 스피치 웹에 대한 요청" 커뮤니티. ACM 48, 11, 2005, 페이지: 45 ~49 。

[FrostMaShi2007-6] Frost, R. A., Ma, X. 및 Shi, Y. "퍼블릭 도메인 Speech Web을 위한 브라우저." World Wide Web Conference, Banff, Canada Year: 2007, 페이지: 1307 ~1308.

[2]

[3]

[4]

[6]

Search

음성 웹

네임스페이스

더

레퍼런스

외부 링크