푸리에 변환은 일반적으로 음의 주파수 분석에 사용된다. 그러나 인간의 소리 인식을 분석 할 때 몇 가지 단점이 있습니다. 예를 들어, 주파수 빈은 선형 인 반면, 사람의 귀는 선형이 아닌 대수적으로 주파수에 반응합니다 .
웨이블릿 변환은 푸리에 변환과 달리 다른 주파수 범위에 대한 해상도를 수정할 수 있습니다 . 는 속성이 웨이블릿 변환 고주파수 짧은 시간 폭을 유지하면서 낮은 주파수에서 큰 시간적 지원을 허용한다.
웨이블릿 Morlet 밀접 청각 인간의 인식과 관련이 있습니다. 음악 녹음에 적용 할 수 있으며 푸리에 변환 기술로는 불가능한 매우 정확한 결과를 생성합니다. 각 음표에 대해 명확한 시작 및 종료 시간으로 짧은 반복 버스트 및 반복 음표를 캡처 할 수 있습니다.
일정 Q 변환 (웨이브 렛 변환 밀접한 관련 Morlet)는 또한 잘 음악 데이터에 적합한 . 변환의 출력이 효과적으로 로그 주파수에 대한 진폭 / 위상이므로, 주어진 범위를 효과적으로 커버하기 위해 더 적은 스펙트럼 빈이 필요하며, 이는 주파수가 몇 옥타브에 걸쳐있을 때 유용합니다.
변환은 더 높은 주파수 빈으로 주파수 분해능 감소를 나타내며, 이는 청각 적용에 바람직하다. 그것은 인간의 청각 시스템을 반영하여, 낮은 주파수에서 스펙트럼 분해능이 더 좋은 반면, 시간 분해능은 더 높은 주파수에서 향상됩니다.
제 질문은 이것입니다 : 인간의 청각 시스템을 모방 한 다른 변형이 있습니까? 누구든지 인간의 청각 시스템과 해부학 적 / 신경 학적으로 일치하는 변환을 설계하려고 했습니까?
예를 들어, 사람의 귀는 소리 강도에 대한 대수 반응을 갖는 것으로 알려져 있습니다. 같은 소리 강도의 윤곽 은 강도뿐만 아니라 스펙트럼 성분의 주파수 간격에 따라 변하는 것으로 알려져 있습니다 . 전체 중요 음압이 일정하게 유지 되더라도 많은 중요 대역에 스펙트럼 성분이 포함 된 사운드는 더 크게 인식됩니다.
마지막으로, 인간의 귀는 주파수 의존적 제한된 시간적 해상도를가 집니다. 아마도 이것도 고려 될 수 있습니다.