그렇습니다. 많은 사람들이 시간-주파수 분석에 참여했습니다.
"데이터를 청크로 분할하고 각 청크에서 FFT를 수행"하는 방법은 좋은 생각입니다. FFT를 수행하기 직전에 각 청크에 "창 기능"을 적용하면 많은 인공물을 피할 수 있습니다. 청크가 겹치는 것도 도움이됩니다. 이러한 조정 후에는 Gabor 변환 이 시작되는데, 이는 가장 인기있는 단시간 푸리에 변환 (STFT) 인 것 같습니다.
이미 지적했듯이 Wikipedia 기사에서 지적했듯이 모든 단기 푸리에 변환 기술에는 다음과 같은 단점이 있습니다.
- 당신은 매우 짧은 조각으로 시계열을 절단 할 때, 당신은 정확하게에 관해서는 매우 정확한 시간 정보를 얻을 때 톤을 시작하고 중지하지만, 주파수 정보는 매우 흐릿하다.
- 시계열을 매우 긴 조각으로 자르면 정확한 톤 주파수에 대해 매우 정확한 주파수 정보를 얻을 수 있지만 정확한 시작 및 중지 시간은 흐릿합니다.
이것은 유명한 문제이지만 아아, 해결되지 않았을뿐만 아니라 Gabor 한계, Heisenberg-Gabor 한계, 불확실성 원리 등 두 가지의 불확실성이 불가피하다는 것이 입증되었습니다 .
내가 당신이라면 가보 변환을 계산하기 위해 많은 상용 라이브러리 중 하나에서 시작하여 시계열을 다양한 길이로 자르는 실험을해볼 것입니다. 운이 좋을 확률이 꽤 높으며 적절한 시간 지역화와 적절한 주파수 식별 을 제공하는 길이로 끝날 것입니다 .
이 응용 프로그램에서 작동하지 않으면 시간-주파수 표현 및 시간-주파수 분석 ( 웨이블릿 변환, 첩렛 변환 , 분수 푸리에 변환 (FRFT) 등) 에 대한 다른 접근 방식으로 넘어갑니다 .
편집 : 오디오 데이터에서 스펙트로 그램 / 폭포 그림 을 생성하는 일부 소스 코드 :
Image to Spectrogram 은 위의 유틸리티와 반대 방향으로 진행됩니다.