스피치투텍스트 리포터

Speech-to-text reporter

캡션자로도 알려진 스피치투텍스트 리포터(STTR)는 전자 속기 키보드나 음성인식 소프트웨어와 CAT 소프트웨어 시스템을 사용하여, 현재 하고 있는 말을 듣고 단어(단어)로 입력하는 사람이다. 그들의 키보드나 음성 인식 소프트웨어는 컴퓨터에 연결되어 있고, 이것은 이 정보를 적절한 철자로 변환한다.[1] 복제된 글은 청각장애인이나 난청자들이 읽을 수 있었다.

가장 최근의 연설문 기자들은 음성 작가라고 불린다. 보이스피싱은 법정신고에 사용하는 수법으로 일부 의료기록가들도 사용한다. 법정기자는 음성문자법을 이용해 스테노마스크나 음성사음기에 직접 대고 말하는데, 이 마스크에는 마이크 한두 개와 음성감청 자료가 들어 있다. 음성 쓰기 시스템은 스테노마스크, 외부 사운드 디지타이저, 노트북, 음성 인식 소프트웨어, CAT 소프트웨어로 구성되어 있다. 풋페달은 컴퓨터의 USB 포트에 꽂을 수 있다.

실시간 음성 작성자의 말은 마스크의 케이블을 통해 외부 USB 디지털 신호 프로세서로 전달되며, 여기서부터 컴퓨터의 음성 인식 엔진으로 들어가 스트리밍 텍스트로 변환된다. 리포터는 스트리밍된 텍스트를 a) 인터넷, b) 컴퓨터 파일, c) 자막용 텔레비전 방송국, d) 심판, 변호사 또는 자막 소비자에게 가장 친숙한 방식으로 결과를 포맷하는 노트북, 태블릿, 스마트폰 또는 e) 소프트웨어를 통해 자막을 읽고 있는 최종 사용자에게 보낼 수 있다.

성우 작가들은 순수한 생리학에 기초하여 매우 높은 정확도를 가지고 있다. 사람의 말에 의해 취해진 경로는 입에서 기자의 귀, 뇌, '내부' 목소리에까지 이른다. 이런 형태의 반복은 자연적으로 노력하지 않는다; 그것은 우리가 매일 대화할 때, 사람이 말하는 것을 들을 때, 또는 책을 읽을 때 하는 것이다. 그래서 이 과정의 가장 자연스러운 확장은 반복 메커니즘을 심리적으로 '내부 목소리'에서 생리학적 '말하는 목소리'로 바꾸는 것이다. 그러므로, 우리는 구어체를 인쇄된 단어로 그것의 영구적인 목적지로 전송하는 우리의 임무에서 인지 오버헤드의 도입을 최소화한다. 이러한 능률적인 과정을 통해 음성 작성자는 지속적으로 많은 시간 동안 우수한 성능을 얻을 수 있으며 분당 350단어까지 높은 속도에서 98% 이상의 정확도를 달성할 수 있다.

음성 작성자는 모든 전자적 형식과 인쇄된 형식의 대본을 포함하여 속기형 동료와 동일한 제품을 생산한다. 실시간 말벌 리포터들은 그들의 노트북을 캡션 장비, 실시간 뷰어 프로그램에 연결하고, 세션이 끝날 때 변호사나 다른 고객들에게 컴퓨터 파일을 제공한다. 스피커의 말을 포착하는 물리적 방법만이 음성 쓰기와 법정 보고의 다른 방법을 구별한다. 이 직업의 다른 모든 측면은 동일하며, 음성 쓰기의 경우 훨씬 짧은 기술을 배우는 데 필요한 시간을 제외하면 그렇다.

텍스트 음성 변환을 만드는 다른 방법: 영국에서 사용되는 키보드에는 Palantype 시스템과 Stenograph 시스템이라는 두 가지 유형이 있다. 따라서 STTR은 때로 팔판티피스트속기사라고도 불린다. QWERTY 키보드와 달리 단어의 모든 문자를 누르는 것이 아니라 전체 단어, 구문 또는 짧은 형식을 나타내는 여러 개의 키를 한꺼번에 누른다. 그리고 나서 특별하게 설계된 컴퓨터 소프트웨어는 이 음성 화음을 다시 영어로 변환시켜 누군가가 읽을 수 있도록 표시해 줄 것이다.

컴퓨터 소프트웨어는 문맥에 특정한 사전 프로그램된 어휘, 음절 클러스터를 서면 양식에 일치시키는 정보를 사용할 수 있으며, STTR이 선택하는 대체 캡션을 제안할 수 있다. 오류는 STR이 단어를 잘못 숙지하고 다음에 언급된 내용에 의해 모호한 진술이 명확해지기 전에 STTR이 결정을 내려야 할 필요에서 발생한다.

STTRs의 전문 협회는 Verbatim Speech-to-Text Reporters의 협회다. 청각장애인과의 선진 의사소통을 위한 협의회와 왕립 청각장애인 연구소는 또한 STTR에 대해 더 많은 정보를 제공한다.

서비스 사용자는 화면에서 무엇을 볼 것인가?

색상과 글꼴 크기 변경을 요청할 수 있지만, 사용되는 모든 단어가 접근 가능한 형식으로 화면에 나타날 것이다. 사용되는 모든 단어와 마찬가지로, "NEW Speaker:"라는 단어는 일반적으로 스피커가 바뀔 때 나타내는 것처럼 보일 것이다. 행사 전에 STR(음성작가/판티파이터/진술가)에 회의 참석자 이름을 보내면 그 이름 역시 컴퓨터에 프로그래밍할 수 있어 누가 말하는지 쉽게 알아볼 수 있다. 관련 이벤트를 나타내기 위해 {웃음} 또는 {applause}과 같이 곱슬 괄호 안에 있는 다른 구절도 나타날 수 있다.

컴퓨터 소프트웨어가 음절 스트림에서 단어 단절이 발생하는 위치를 구분하지 못할 때 때때로 몬데그린 오류가 닫힌 캡션에서 나타날 수 있다. 예를 들어, "그랜드 퍼레이드"의 뉴스 보도는 "할아버지 습격"으로 자막될 수 있다. 이러한 맥락에서 몬데그린들은 생방송의 빠른 속도를 따라잡기 위한 자막의 필요성에서 비롯된다.

역사

많은 STR들이 법원 기자로 경력을 시작했다. 법원에서는 이 제도가 요청 시 의사진행 기록과 녹취록 제공에 이용됐다. 또한 이 분야에서 발달한 기술들은 청각장애인과 의사소통하는 분야에서 매우 귀중하게 만들었는데, 그들은 극도로 높은 정확도로 작품을 제작하고 항상 완전한 재량으로 행동하는 데 익숙하기 때문이다. STTR은 98.5% 이상의 일관된 정확도에 도달할 것으로 예상한다.

트레이닝

STTR이 되기 위해서는 Palantype/Stenograph와 관련 소프트웨어인 경우 일반적으로 2년 동안 광범위한 교육이 필요하며, 게다가 속도, 정확성, 사전/언어 실력을 쌓고 경험을 쌓기 위해 적어도 2년 더 연습해야 한다.

만약 STTR을 음성 쓰기가 된다면, 훈련은 비록 힘들지만 다소 짧다. 음성 쓰기 기술을 배우는 데 2년이 걸리면 관련 소프트웨어와 필수 실습, 속도, 정확성, 사전/어휘 구축, 경험 습득 등이 포함된다.

그 다음에야 미국 및/또는 영국 인증 시험을 치를 준비가 되어 있다. 미국에서는 NVRA와 NCRA가 필요한 교육을 입증하는 인증을 제공한다.

인증에는 여러 가지 수준이 있다. NVRA는 음성 작성기를 법원 기자, 실시간 기자, CART 제공자 및 방송 자막자로 인증한다. NVRA 인증은 어떤 면허 고려사항 이외에도 음성 작성자가 해당 분야의 다른 전문가 수준과 기술을 훨씬 능가하는 수준을 획득했음을 분명히 보여준다.

NVRA 인증 시험 프로그램은 모든 회원이 이용할 수 있다. 전국 각지에서 1년 내내 일정한 간격으로 시험이 치러진다.[2]

영국에서는 단위 CACDP 검사 및 CACDP 레지스터 회원 자격을 통해 요구되는 최소 표준에 도달했음을 확인할 수 있다. 등록된 STTR의 대다수는 또한 Verbatim Speech-to-Text Reporters 협회의 회원들이다.

참고 항목

참조

  1. ^ "Closed Captioning Web". Captions.org. 2006-02-13. Retrieved 2009-06-11.
  2. ^ "NVRA certifications". nvra.org. Retrieved 2017-01-05.

외부 링크