상수 Q 변환

수학 및 신호 처리에서, 간단히 CQT라고 알려진 상수 Q 변환은 데이터 시리즈를 주파수 영역으로 변환한다. 푸리에 변환과^[1] 관련이 있으며 복잡한 몰레 웨이브트 변환과 매우 밀접하게 관련되어 있다.^[2]

변환은 일련의 필터 f로_k 생각할 수 있으며, k-th 필터는 이전 필터 너비의 배수와 동일한 스펙트럼 너비 Δf를_k 가지고 있으며, 로그 간격은 주파수로 되어 있다.

\f_{k}=2^{1/n}\cdot \cdot \f_{k-1}=\좌측(2^{1/n}\오른쪽)^{k}\cdot \f_{\text{min}},

여기서 Δf는_k k-th 필터의 대역폭이고, f는_min 가장 낮은 필터의 중심 주파수이며, n은 옥타브 당 필터 수입니다.

계산

샘플 m로 이동된 프레임에 대한 x[n]의 짧은 시간 푸리에 변환은 다음과 같이 계산된다.

X[k,m]=\sum _{n=0}^{N-1}W[n-m]x[n]e^{-j2\pi kn/N}}

샘플링 주파수 f_s = 1/T, T는 데이터의 샘플링 기간으로, 각 주파수 빈에 대해 다음을 정의할 수 있다.

필터 폭, Δf_k.
Q, "품질 인자":

Q={\frac {f_{k}{\delta f_{k}}}.

이 값은 중심 주파수_k f에서 처리된 정수 주기 수로 아래에 표시된다. 이와 같이, 이것은 변환의 시간 복잡성을 어느 정도 정의한다.

k-th 빈의 창 길이:

N[k]={\frac {f_{\text{s}}}{\delta f_{k}}={\frac {f_{\text{s}}}{f_{k}}Q.

f_s/f는_k 주파수 f에서_k 사이클당 처리된 샘플의 수이기 때문에 Q는 이 중심 주파수에서 처리된 정수 사이클의 수입니다.

동등한 변환 커널은 다음과 같은 대체물을 사용하여 찾을 수 있다.

각 빈의 창 길이는 이제 빈 번호의 함수가 된다.

[\displaystyle N=N[k]=]=Q{\frac {f_{\text{k}}{f_{k}}.}

각 빈의 상대적 힘은 더 적은 기간 동안 더 높은 주파수에서 감소할 것이다. 이를 보완하기 위해 N[k]로 정상화한다.
윈도우 설정 기능은 윈도우 길이의 함수가 될 것이고 마찬가지로 윈도우 번호의 함수가 될 것이다. 예를 들어, 동등한 해밍 창은

W[k,n]=\alpha -(1-\alpha )\cos {\frac {2\pi n}{N[k]-1,\quad \alpha =25/46,\quad 0\leqslant n[k]-1.

우리의 디지털 주파수인 ${\frac {2\pi k}{N}}$ ${\frac {2\pi k}{N}}$ ${\frac {2\pi k}{N}}$ ${\$ k $}{N}}$ 은 ${\frac {2\pi k}{N}}$ 는) ${\frac {2\pi Q}{N[k]}}$ ${\frac {2\pi Q}{N[k]}}$ ${\frac {2\pi Q}{N[k]}}$ N ${\frac {2\pi Q}{N[k]}}$ [ ${\frac {2\pi Q}{N[k]}}$ $]{\$ Q $}{N[k]}}}}}이($ 가) 된다 ${\frac {2\pi Q}{N[k]}}$

이러한 수정 후에, 우리는 남는다.

X[k]={\frac {1}{N[k]}}\sum _{n=0}^{N[k]-1}W[k,n]x[n]e^{\frac {-j2\pi Qn}{N[k]}}.

빠른계산

빠른 FFT(Fast Fourier Transform)와 비교할 때 상수 Q 변환의 직접 계산은 느리다. 그러나, FFT 자체는 커널의 사용과 함께, 등가 계산을 하지만 훨씬 더 빨리 수행하기 위해 사용될 수 있다.^[3] 그러한 구현에 대한 대략적인 반대가 2006년에 제안되었다; 그것은 DFT로 돌아가면서 작동하며, 피치 악기에만 적합하다.^[4]

이 방법은 연속적으로 낮은 투구에 대해 저역 통과 여과 및 하향 샘플링 결과를 사용하여 FFT 옥타브를 통한 CQT를 수행하는 것이 바람직하다.^[5] 이 방법의 구현에는 MATLAB 구현과 LibROSA의 Python 구현이 포함된다.^[6] LibROSA는 하위 샘플방식(subsampled method)과 직접 FFT방식("pseudo-CQ"를 더빙함)을 결합한다.T") 후자의 공정을 전체적으로 더 높은 주파수로 한다.^[6]

슬라이딩 DFT는 선형 주파수 간격과 bin당 윈도우 크기가 같을 필요가 없으므로, Sliding DFT는 상수 Q 변환의 더 빠른 계산을 위해 사용할 수 있다.^[7]

푸리에 변환과 비교

일반적으로 이 변환은 음악적 데이터에 잘 어울리며, 이는 빠른 푸리에 변환에 비해 그 장점 중 일부에서 볼 수 있다. 변환 출력은 로그 주파수에 대한 진폭/위상이기 때문에 주어진 범위를 효과적으로 커버하기 위해 필요한 주파수 빈은 더 적으며, 이는 주파수가 여러 옥타브에 걸쳐 있는 경우에 유용함을 입증한다. 인간의 청각 범위는 20Hz에서 약 20kHz까지 약 10옥타브에 이르기 때문에, 이러한 출력 데이터의 감소는 매우 크다.

변환은 더 높은 주파수 빈을 가진 주파수 분해능의 감소를 나타내며, 이는 청각적 적용에 바람직하다. 변환은 인간 청각 시스템과 유사하며, 낮은 주파수에서 스펙트럼 분해능이 더 나은 반면, 시간 분해능은 높은 주파수에서 개선된다. 피아노 음계 하단(약 30Hz)에서는 1세미톤의 차이가 약 1.5Hz인 반면, 음악 음계 상단(약 5kHz)에서는 1세미톤의 차이가 약 200Hz의 차이가 난다.^[8] 따라서 음악 데이터의 경우 상수 Q 변환의 지수 주파수 분해능이 이상적이다.

또한 악보의 고조파들은 이 변형에서 악기의 음색의 특징인 패턴을 형성한다. 기본 주파수가 변함에 따라 각 고조파의 상대적 강도를 동일하다고 가정하면 이들 고조파의 상대적 위치는 일정하게 유지된다. 이렇게 하면 계측기 식별이 훨씬 쉬워질 수 있다. 일정한 Q 변환은 누적된 크로마 함량을 바탕으로 한 음악적 키의 자동 인식에도 사용할 수 있다.^[9]

푸리에 변환에 비해 이 변환의 구현은 더 까다롭다. 이는 각 주파수 빈의 계산에 사용되는 샘플의 수가 다양하기 때문에, 구현되는 윈도우 설정 기능의 길이에도 영향을 미친다.^[10]

또한 주파수 스케일이 로그이기 때문에 진정한 0-주파수/DC 항이 존재하지 않으며 경우에 따라 단점이 될 수 있다.

참조

^ 주디스 C. 갈색, 일정한 Q 스펙트럼 변환의 계산, J. 음향. Soc. Am, 89(1:425–434, 1991).
^ 연속파울렛 변환 "모래파울렛을 창으로 된 사인파(Morlet파울렛 등)로 해석할 수 있을 때 파울렛 변환은 일정한 Q 푸리에 변환으로 해석할 수 있다. 웨이블렛 이론 이전에는 (고전적인 제3 옥타브 필터 뱅크에서 얻은 것과 같은) 일정한 Q 푸리에 변환은 기본 신호가 직교하지 않았기 때문에 반전하기가 쉽지 않았다."
^ 주디스 C. 브라운과 밀러 S. Fuckette, 상수 Q transformation의 계산을 위한 효율적인 알고리즘 J. Option. Soc. Am, 92(5):2698–2701, 1992.
^ FitzGerald, Derry; Cychowski, Marcin T.; Cranitch, Matt (1 May 2006). "Towards an Inverse Constant Q Transform". Audio Engineering Society Convention. Paris: Audio Engineering Society. 120.
^ Schörkhuber, Christian; Klapuri, Anssi (2010). "CONSTANT-Q TRANSFORM TOOLBOX FOR MUSIC PROCESSING". 7th Sound and Music Computing Conference. Barcelona. Retrieved 12 December 2018. 종이
^ Jump up to: ^a ^b McFee, Brian; Battenberg, Eric; Lostanlen, Vincent; Thomé, Carl (12 December 2018). "librosa: core/constantq.py at 8d26423". GitHub. librosa. Retrieved 12 December 2018.
^ Bradford, R, ffitch, J & Dobson, R 2008, Sliding with a constant-Q, in 11th International Conference on Digital Audio Effects (DAFx-08) Proceedings September 1-4th, 2008 Espoo, Finland . DAFx, Espoo, Finland, pp. 363-369, Proc. of the Int. 디지털 오디오 효과에 대한 설명(DAFx-08), 1/09/08.
^ http://newt.phys.unsw.edu.au/jw/graphics/notes.GIF
^ Hendrik Purwins, Benjamin Blankertz, Klaus Obermayer, A New Method for Tonal Music in Audio Data Format, International JCNN'00 (IJCN'00), 6:270-275, 2000.
^ 벤자민 블랭커츠, The Constant Q Transform, 1999.

[b91-1] 주디스 C. 갈색, 일정한 Q 스펙트럼 변환의 계산, J. 음향. Soc. Am, 89(1:425–434, 1991).

[2] 연속파울렛 변환 "모래파울렛을 창으로 된 사인파(Morlet파울렛 등)로 해석할 수 있을 때 파울렛 변환은 일정한 Q 푸리에 변환으로 해석할 수 있다. 웨이블렛 이론 이전에는 (고전적인 제3 옥타브 필터 뱅크에서 얻은 것과 같은) 일정한 Q 푸리에 변환은 기본 신호가 직교하지 않았기 때문에 반전하기가 쉽지 않았다."

[pb92-3] 주디스 C. 브라운과 밀러 S. Fuckette, 상수 Q transformation의 계산을 위한 효율적인 알고리즘 J. Option. Soc. Am, 92(5):2698–2701, 1992.

[4] FitzGerald, Derry; Cychowski, Marcin T.; Cranitch, Matt (1 May 2006). "Towards an Inverse Constant Q Transform". Audio Engineering Society Convention. Paris: Audio Engineering Society. 120.

[5] Schörkhuber, Christian; Klapuri, Anssi (2010). "CONSTANT-Q TRANSFORM TOOLBOX FOR MUSIC PROCESSING". 7th Sound and Music Computing Conference. Barcelona. Retrieved 12 December 2018. 종이

[librosa-cqt-6] Jump up to: ^a ^b McFee, Brian; Battenberg, Eric; Lostanlen, Vincent; Thomé, Carl (12 December 2018). "librosa: core/constantq.py at 8d26423". GitHub. librosa. Retrieved 12 December 2018.

[cqsdft-7] Bradford, R, ffitch, J & Dobson, R 2008, Sliding with a constant-Q, in 11th International Conference on Digital Audio Effects (DAFx-08) Proceedings September 1-4th, 2008 Espoo, Finland . DAFx, Espoo, Finland, pp. 363-369, Proc. of the Int. 디지털 오디오 효과에 대한 설명(DAFx-08), 1/09/08.

[8] ttp://newt.phys.unsw.edu.au/jw/graphics/notes.GIF

[pbo01-9] Hendrik Purwins, Benjamin Blankertz, Klaus Obermayer, A New Method for Tonal Music in Audio Data Format, International JCNN'00 (IJCN'00), 6:270-275, 2000.

[gb1999-10] 벤자민 블랭커츠, The Constant Q Transform, 1999.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Search

상수 Q 변환

네임스페이스

더

목차

계산

빠른계산

푸리에 변환과 비교

참조