첫째, 저는 소프트웨어 개발자이기 때문에 appologize하고 순수한 수학에 뛰어 들지 않은 시간이 너무 길어서 내 질문은 바보처럼 보일 수 있습니다. 내가하지 희망.
맥락은 음악의 피치 인식입니다.
음표를 녹음하고 푸리에 변환을 적용하면 주어진 주파수에 대해 무한한 진폭의 진폭을 갖게됩니다. 예를 들어, 푸리에 변환 후 모든 악기에서 기본이 인 음을 연주하면 고조파가 . 모든 주파수는 악기의 음색 (피아노, 보이스, 트럼펫 등)을 정의하는 지정된 진폭을 갖습니다 (모두이 약자를 따르지만 모든 고조파에 대해 다른 진폭을 갖게됩니다)
이제 내가 원하는 것은 주어진 오디오 신호에서 오는 것입니다 찾으십시오 . 그냥 배경 노이즈 등이 항상 있기 때문에 생각보다 복잡합니다. 더 나아가 는 진폭이 가장 높은 주파수를 필요로하지 않습니다!
찾는 내 생각 그래서 DFT에 (속도도 실제로 FFT)를 적용하고 frenquency 찾을 수 있습니다 그래서, 는 FFT 출력에서 최대이다.
당신은 그것이 가능하다고 생각합니까? 아주 짧은 시간 안에 가능하다고 생각하십니까 (<5 밀리 초라고합시다)?