2
MFCC 추출 과정에서 DCT 단계를 어떻게 해석합니까?
대부분의 오디오 처리 작업에서 가장 많이 사용되는 변환 중 하나는 MFCC (Mel-frequency cepstral coefficients) 입니다. 나는 대부분 MFCC의 배후에있는 수학을 알고있다. 나는 필터 뱅크 단계와 Mel 주파수 스케일링을 모두 이해한다. 내가 얻지 못하는 것은 DCT (Discrete Cosine Transform) 단계입니다.이 단계에서 어떤 종류의 정보를 얻습니까? 이 단계의 시각적 표현은 무엇입니까?