기하학적 간격이있는 빈이있는 DFT?


16

기존의 이산 푸리에 변환 (DFT)과 그 사촌 FFT는 간격이 동일한 빈을 생성합니다. 즉, 첫 번째 빈의 첫 번째 10 헤르츠, 두 번째 빈의 10.1 ~ 20 등을 얻습니다. 그러나 조금 다른 것이 필요합니다. 각 빈에 의해 커버되는 주파수 범위가 기하학적으로 증가하기를 원합니다. 1.5의 승수를 선택한다고 가정합니다. 그런 다음 첫 번째 빈에 0에서 10까지, 두 번째 빈에 11에서 25까지, 세 번째 빈에 26에서 48까지를 원합니다. 이러한 방식으로 동작하도록 DFT 알고리즘을 수정할 수 있습니까?


관심 지점에서 언제든지 DFT를 계산할 수 있습니다. 또한 이산 웨이블릿 변환필터 뱅크 오릅니다. 그들을 볼만한 가치가 있습니다.

2
상수 Q 변환 (CQT)을 찾고 있습니다.
Paul R

2
말이 잘못되었습니다. 당신이 원하는 것은 새로운 것이 아니며 많은 경우에 개선이 아닙니다.
hotpaw2


2
DFT와 FFT는 사촌이 아닙니다. 그들은 동일한 결과를 제공합니다.
Phonon

답변:


17

논문을 인용하려면 :

변환 모음에는 이름 상수 Q가 부여되며 푸리에 변환과 유사합니다.

이산 푸리에 변환의 계산은 고속 푸리에 변환을 사용할 때 매우 효율적일 수 있습니다. 그러나 신호의 에너지는 스펙트럼 전체에서 균일 한 크기의 주파수 버킷으로 나뉩니다. 많은 경우에 이것이 유용하지만, 우리는이 균일 한 분포가 차선책 인 상황에 주목합니다. 그러한 경우의 중요한 예는 음악 주파수의 분석으로 관찰됩니다. 서양 음악에서 음악 스케일을 구성하는 주파수는 기하학적으로 간격이 있습니다. 따라서 이산 푸리에 변환의 주파수 빈과 음계의 주파수 사이의 맵이 빈이 잘 맞지 않는다는 점에서 불충분하다는 것을 알 수 있습니다. 상수 Q 변환은이 문제를 해결합니다.

상수 Q의 목적은 주파수 빈의 폭이 이전의 곱인 로그 간격의 주파수 빈 세트를 생성하는 것입니다. 결과적으로 가청 스펙트럼에서 음표 당 동일한 수의 빈을 생성 할 수 있으므로 각 음표에 대해 일정한 수준의 정확도를 유지할 수 있습니다. 주파수 빈은 더 높은 주파수로 갈수록 더 넓어지고 더 낮은 주파수로 갈수록 더 좁아집니다. 주파수 탐지 정확도의 이러한 확산은 인간-청각 시스템이 주파수에 반응하는 방식을 밀접하게 모방합니다.

또한 서양 음계에서 음표의 밀접한 일치로 인해 상수 Q가 음표 감지에 특히 유용합니다. 명시적인 주파수 값이 아닌 음표 값을 식별합니다. 또한 상수 Q는 목재 분석 프로세스를 단순화합니다. 악기가 연주하는 음표의 주파수는 종종 조화로 관련된 부분으로 구성됩니다. 악기의 음색은 고조파의 비율로 특징 지어 질 수 있습니다. 일정한 Q 변환을 사용하면 기본 주파수에 관계없이 고조파가 빈 전체에 균등하게 이격됩니다. 이는 단순히 빈을 가로 질러 특성을 이동함으로써 스케일의 어느 곳에서나 노트를 연주하는 악기를 식별하는 프로세스를 크게 단순화합니다.

(FFT로 계산 될 수있는) 이산 푸리에 변환을 상수 Q 변환으로 변환하기위한 효율적인 알고리즘은 Brown and Puckette (1992)에 자세히 설명되어 있습니다.


1

DFT (FFT)에는 상당한 수학적 가정이 있습니다. 이 경우 가장 중요한 것은 절단 된 무한 시간 정현파 변환을 수행한다는 것입니다. 두 번째는 잘린 시간과 잘린 주파수 신호가 모듈로 랩핑 된 것으로 가정한다는 것입니다 (원형). 일반 FFT 간격으로 이격 된 빈은 이러한 가정 (및 산술 감지 간격) 때문에 직교 정규 세트를 형성합니다. 따라서 시간 <-> 주파수 쌍은 완벽하게 가역적입니다.

상수 Q 변환은 그렇게 잘리지 않으므로 실제 구현으로 완벽한 직교 정규 쌍을 얻을 수는 없습니다. 커널은 무한히 기하 급수적으로 붕괴하는 정현파이므로 위에 표시된 순환 이점을 가질 수 없습니다. 자르지 않으면 직교 정규 세트를 형성합니다.

웨이블릿 변환은 일반적으로 2의 거듭 제곱으로 이루어 지므로 세분화 된 주파수 추정에별로 유용하지 않습니다.

표준 정현파 DFT의 간격이 고르지 않다는 제안은 넓게 떨어진 영역의 정보가 누락되고 밀도가 높은 영역의 정보는 복제됩니다. 그렇지 않으면, 각각의 주파수에 대해 다른 아포 디제이 션 기능이 사용됩니다 ... 매우 비용이 많이 듭니다.

한 가지 실용적인 솔루션은 옥타브 기반 하위 섹션을 얻기 위해 반 스펙트럼-> 2 씩 반복 반복 절차를 수행하여 옥타브 당 약간의 최대 추정 오차를 충족시키는 것입니다. 분광-> 비율은 입도 요구를 달성하기 위해 임의의 비율로 설정 될 수있다. 그래도 여전히 계산 집약적입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.