상수 Q 변환
Constant-Q transform수학 및 신호 처리에서, 간단히 CQT라고 알려진 상수 Q 변환은 데이터 시리즈를 주파수 영역으로 변환한다. 푸리에 변환과[1] 관련이 있으며 복잡한 몰레 웨이브트 변환과 매우 밀접하게 관련되어 있다.[2]
변환은 일련의 필터 f로k 생각할 수 있으며, k-th 필터는 이전 필터 너비의 배수와 동일한 스펙트럼 너비 Δf를k 가지고 있으며, 로그 간격은 주파수로 되어 있다.
여기서 Δf는k k-th 필터의 대역폭이고, f는min 가장 낮은 필터의 중심 주파수이며, n은 옥타브 당 필터 수입니다.
계산
샘플 m로 이동된 프레임에 대한 x[n]의 짧은 시간 푸리에 변환은 다음과 같이 계산된다.
샘플링 주파수 fs = 1/T, T는 데이터의 샘플링 기간으로, 각 주파수 빈에 대해 다음을 정의할 수 있다.
- 필터 폭, Δfk.
- Q, "품질 인자":
- 이 값은 중심 주파수k f에서 처리된 정수 주기 수로 아래에 표시된다. 이와 같이, 이것은 변환의 시간 복잡성을 어느 정도 정의한다.
- k-th 빈의 창 길이:
- fs/f는k 주파수 f에서k 사이클당 처리된 샘플의 수이기 때문에 Q는 이 중심 주파수에서 처리된 정수 사이클의 수입니다.
동등한 변환 커널은 다음과 같은 대체물을 사용하여 찾을 수 있다.
- 각 빈의 창 길이는 이제 빈 번호의 함수가 된다.
- 각 빈의 상대적 힘은 더 적은 기간 동안 더 높은 주파수에서 감소할 것이다. 이를 보완하기 위해 N[k]로 정상화한다.
- 윈도우 설정 기능은 윈도우 길이의 함수가 될 것이고 마찬가지로 윈도우 번호의 함수가 될 것이다. 예를 들어, 동등한 해밍 창은
- 우리의 디지털 주파수인 k은는) N[ Q가) 된다
이러한 수정 후에, 우리는 남는다.
빠른계산
빠른 FFT(Fast Fourier Transform)와 비교할 때 상수 Q 변환의 직접 계산은 느리다. 그러나, FFT 자체는 커널의 사용과 함께, 등가 계산을 하지만 훨씬 더 빨리 수행하기 위해 사용될 수 있다.[3] 그러한 구현에 대한 대략적인 반대가 2006년에 제안되었다; 그것은 DFT로 돌아가면서 작동하며, 피치 악기에만 적합하다.[4]
이 방법은 연속적으로 낮은 투구에 대해 저역 통과 여과 및 하향 샘플링 결과를 사용하여 FFT 옥타브를 통한 CQT를 수행하는 것이 바람직하다.[5] 이 방법의 구현에는 MATLAB 구현과 LibROSA의 Python 구현이 포함된다.[6] LibROSA는 하위 샘플방식(subsampled method)과 직접 FFT방식("pseudo-CQ"를 더빙함)을 결합한다.T") 후자의 공정을 전체적으로 더 높은 주파수로 한다.[6]
슬라이딩 DFT는 선형 주파수 간격과 bin당 윈도우 크기가 같을 필요가 없으므로, Sliding DFT는 상수 Q 변환의 더 빠른 계산을 위해 사용할 수 있다.[7]
푸리에 변환과 비교
일반적으로 이 변환은 음악적 데이터에 잘 어울리며, 이는 빠른 푸리에 변환에 비해 그 장점 중 일부에서 볼 수 있다. 변환 출력은 로그 주파수에 대한 진폭/위상이기 때문에 주어진 범위를 효과적으로 커버하기 위해 필요한 주파수 빈은 더 적으며, 이는 주파수가 여러 옥타브에 걸쳐 있는 경우에 유용함을 입증한다. 인간의 청각 범위는 20Hz에서 약 20kHz까지 약 10옥타브에 이르기 때문에, 이러한 출력 데이터의 감소는 매우 크다.
변환은 더 높은 주파수 빈을 가진 주파수 분해능의 감소를 나타내며, 이는 청각적 적용에 바람직하다. 변환은 인간 청각 시스템과 유사하며, 낮은 주파수에서 스펙트럼 분해능이 더 나은 반면, 시간 분해능은 높은 주파수에서 개선된다. 피아노 음계 하단(약 30Hz)에서는 1세미톤의 차이가 약 1.5Hz인 반면, 음악 음계 상단(약 5kHz)에서는 1세미톤의 차이가 약 200Hz의 차이가 난다.[8] 따라서 음악 데이터의 경우 상수 Q 변환의 지수 주파수 분해능이 이상적이다.
또한 악보의 고조파들은 이 변형에서 악기의 음색의 특징인 패턴을 형성한다. 기본 주파수가 변함에 따라 각 고조파의 상대적 강도를 동일하다고 가정하면 이들 고조파의 상대적 위치는 일정하게 유지된다. 이렇게 하면 계측기 식별이 훨씬 쉬워질 수 있다. 일정한 Q 변환은 누적된 크로마 함량을 바탕으로 한 음악적 키의 자동 인식에도 사용할 수 있다.[9]
푸리에 변환에 비해 이 변환의 구현은 더 까다롭다. 이는 각 주파수 빈의 계산에 사용되는 샘플의 수가 다양하기 때문에, 구현되는 윈도우 설정 기능의 길이에도 영향을 미친다.[10]
또한 주파수 스케일이 로그이기 때문에 진정한 0-주파수/DC 항이 존재하지 않으며 경우에 따라 단점이 될 수 있다.
참조
- ^ 주디스 C. 갈색, 일정한 Q 스펙트럼 변환의 계산, J. 음향. Soc. Am, 89(1:425–434, 1991).
- ^ 연속파울렛 변환 "모래파울렛을 창으로 된 사인파(Morlet파울렛 등)로 해석할 수 있을 때 파울렛 변환은 일정한 Q 푸리에 변환으로 해석할 수 있다. 웨이블렛 이론 이전에는 (고전적인 제3 옥타브 필터 뱅크에서 얻은 것과 같은) 일정한 Q 푸리에 변환은 기본 신호가 직교하지 않았기 때문에 반전하기가 쉽지 않았다."
- ^ 주디스 C. 브라운과 밀러 S. Fuckette, 상수 Q transformation의 계산을 위한 효율적인 알고리즘 J. Option. Soc. Am, 92(5):2698–2701, 1992.
- ^ FitzGerald, Derry; Cychowski, Marcin T.; Cranitch, Matt (1 May 2006). "Towards an Inverse Constant Q Transform". Audio Engineering Society Convention. Paris: Audio Engineering Society. 120.
- ^ Schörkhuber, Christian; Klapuri, Anssi (2010). "CONSTANT-Q TRANSFORM TOOLBOX FOR MUSIC PROCESSING". 7th Sound and Music Computing Conference. Barcelona. Retrieved 12 December 2018. 종이
- ^ Jump up to: a b McFee, Brian; Battenberg, Eric; Lostanlen, Vincent; Thomé, Carl (12 December 2018). "librosa: core/constantq.py at 8d26423". GitHub. librosa. Retrieved 12 December 2018.
- ^ Bradford, R, ffitch, J & Dobson, R 2008, Sliding with a constant-Q, in 11th International Conference on Digital Audio Effects (DAFx-08) Proceedings September 1-4th, 2008 Espoo, Finland . DAFx, Espoo, Finland, pp. 363-369, Proc. of the Int. 디지털 오디오 효과에 대한 설명(DAFx-08), 1/09/08.
- ^ http://newt.phys.unsw.edu.au/jw/graphics/notes.GIF
- ^ Hendrik Purwins, Benjamin Blankertz, Klaus Obermayer, A New Method for Tonal Music in Audio Data Format, International JCNN'00 (IJCN'00), 6:270-275, 2000.
- ^ 벤자민 블랭커츠, The Constant Q Transform, 1999.