코드 들뜸 선형 예측

코드 들뜸 선형 예측(CELP)은 Manfred R이 최초로 제안한 선형 예측 음성 부호화 알고리즘입니다. 슈뢰더와 비슈누 S. 1985년 아탈.그 당시에는 잔류 들뜸 선형 예측(RELP) 및 선형 예측 부호화(LPC) 보코더(예를 들어 FS-1015)와 같은 기존 저비트 전송률 알고리즘보다 훨씬 나은 품질을 제공했습니다.대수 CELP, 완화 CELP, 저지연 CELP 및 벡터섬 들뜸 선형 예측과 같은 변형과 함께 현재 가장 널리 사용되는 음성 부호화^{[citation needed]} 알고리즘이다.MPEG-4 오디오 음성 부호화에도 사용됩니다.CELP는 일반적으로 특정 코덱이 아닌 알고리즘클래스의 총칭으로 사용됩니다.

배경

CELP 알고리즘은 다음 4가지 주요 아이디어를 기반으로 합니다.

선형 예측을 통한 음성 생성 소스 필터 모델 사용(LP) (교과서 "음성 부호화 알고리즘" 참조)
LP 모델의 입력(여진)으로 적응형 및 고정 코드북 사용
"perceptional weighted domain"의 닫힌 루프에서 검색을 수행합니다.
벡터 양자화(VQ) 적용

1983년 슈뢰더와 아탈이 시뮬레이트한 최초의 알고리즘은 Cray-1 슈퍼컴퓨터에서 실행할 때 1초의 음성을 인코딩하는 데 150초가 소요되었습니다.그 후 코드북을 보다 효율적으로 구현하고 컴퓨팅 기능을 개선함으로써 휴대전화 등의 임베디드 디바이스에서 알고리즘을 실행할 수 있게 되었습니다.

CELP 디코더

그림 1: CELP 디코더

CELP의 복잡한 부호화 프로세스를 조사하기 전에 디코더를 소개합니다.그림 1은 범용 CELP 디코더를 나타내고 있습니다.들뜸은 고정(확률적 또는 혁신) 코드북과 적응(피치) 코드북의 기여도를 합산하여 생성된다.

\displaystyle e[n]=e_{f}[n]+e_{a}[n],

$e_{f}[n]$ 서 e f $e_{f}[n]$ [ $]$ { $displaystyle e_{f}[n]$ 는 $e_{{f}}[n]$ 고정(확률적 또는 혁신적) 코드북 $e_{a}[n]$ 이고 $e_{a}[n]$ [ $]$ { $displaystyle e_{a}[n]$ 는 $e_{{a}}[n]$ 적응(적) 코드북 기여입니다.고정 코드북은 (명시적 또는 명시적으로) 코덱에 하드 코딩된 벡터 양자화 사전입니다.이 코드북은 대수(ACELP)이거나 명시적으로 저장할 수 있습니다(예: Spex).적응형 코드북의 엔트리는 지연된 버전의 들뜸으로 구성됩니다.이를 통해 유성음 등의 주기적인 신호를 효율적으로 코드화할 수 있습니다.

들뜸을 형성하는 필터는 1/ $)$ { $displaystyle$ 1/ $A(z$ $1/A(z)$ 의 올폴 모델을 가지고 있습니다. $A(z)$ 서 A $)$ { $displaystyle$ A $(z$ )}는 $A(z)$ 예측 필터라고 하며 선형 예측(Levinson-Durbin 알고리즘)을 사용하여 얻습니다.올폴 필터는 인간의 성관을 잘 표현하고 계산하기 쉽기 때문에 사용됩니다.

CELP 인코더

CELP의 주된 원리는 Analysis-by-synthesit(AbS; 합성별 분석)이라고 불리며, 폐쇄 루프에서 디코딩(합성) 신호를 지각적으로 최적화함으로써 부호화(분석)가 실행된다는 것을 의미합니다.이론적으로 최적의 CELP 스트림은 가능한 모든 비트 조합을 시도하고 가장 소리가 좋은 디코딩 신호를 생성하는 것을 선택함으로써 생성됩니다.이것은 분명히 두 가지 이유로 실제로는 가능하지 않다. 즉, 필요한 복잡성은 현재 사용 가능한 하드웨어를 넘어섰고 "최고의 소리" 선택 기준은 인간의 청취자를 의미한다.

한정된 계산 자원을 사용하여 실시간 부호화를 실현하기 위해 CELP 검색은 간단한 지각 가중치 함수를 사용하여 보다 작고 관리하기 쉬운 순차적 검색으로 분할됩니다.일반적으로 부호화는 다음 순서로 실행됩니다.

선형 예측 계수(LPC)는 일반적으로 라인 스펙트럼 쌍(LSP)으로 계산 및 양자화된다.
적응형(피치) 코드북이 검색되고 기여도가 제거됩니다.
고정(혁신) 코드북이 검색됩니다.

소음 가중치

최신 오디오코덱은 대부분(전부는 아니더라도) 귀에 잡음이 검출되지 않는 주파수 영역에 나타나도록 코딩 노이즈를 형성하려고 합니다.예를 들어, 귀는 더 큰 스펙트럼의 일부에서 소음에 더 잘 견디고 그 반대도 더 크다.따라서 CELP는 단순한 2차 오류를 최소화하는 것이 아니라 지각적으로 가중된 도메인의 오류를 최소화하는 것입니다.가중치 필터 W(z)는 일반적으로 대역폭 확장에 의해 LPC 필터에서 도출됩니다.

{{displaystyle W(z)=snap frac {A(z/\gamma _{1}}}{A(z/\gamma _{2}}}}

여기서 $\gamma _{1}>\gamma _{2}$ 1 $\gamma _{1}>\gamma _{2}$ > $\gamma _{1}>\gamma _{2}$ 2 \ $\gamma _{1}>\gamma _{2}$ \ $display$ style _ {1 $}$ > \ $display$ _ ${$ 2} $\gamma _{1}>\gamma _{2}$ } 。

「」를 참조해 주세요.

MPEG-4 Part 3(MPEG-4 오디오오브젝트 타입으로서의 CELP)
G.728 – 저지연 코드 들뜸 선형 예측을 사용한 16kbit/s에서의 음성 부호화
G.718 – 2단계 부호화 구조에서 밴드(50~6400Hz)의 하위 2개 레이어에 CELP 사용
G.729.1 – 3단계 코딩 구조에서 저대역(50~4000Hz)에 CELP 코딩 사용
오디오 코딩 포맷 비교
CELT는 CELP에서 아이디어를 차용한 관련 오디오 코덱입니다.

레퍼런스

B.S. Atal, "선형 예측의 역사", IEEE Signal Processing Magazine, vol. 23, no. 2, 2006년 3월, 페이지 154–161.
M. R. 슈로더와 B.S. Atal, "Code-excited linear prediction(CELP; 코드 들뜸 선형 예측): 매우 낮은 비트환율에서의 고품질 음성", vol. 10, 페이지 937–940, 1985.

외부 링크

이 문서는 Linux에서 제공된 문서를 기반으로 합니다.회의
Spex 코덱 매뉴얼에 근거한 부품도 있습니다.
CELP 1016A(CELP 3.2a) 및 LPC 10e의 실장을 참조해 주세요.
선형 예측 부호화(LPC)

선택한 판독치

Search

코드 들뜸 선형 예측

네임스페이스

더

목차

배경

CELP 디코더

CELP 인코더

소음 가중치

「」를 참조해 주세요.

레퍼런스

외부 링크

선택한 판독치

Search

코드 들뜸 선형 예측

배경

CELP 디코더

CELP 인코더

소음 가중치

「 」를 참조해 주세요.

레퍼런스

외부 링크

선택한 판독치

「」를 참조해 주세요.