«mfcc» 태그된 질문

2
MFCC 추출 과정에서 DCT 단계를 어떻게 해석합니까?
대부분의 오디오 처리 작업에서 가장 많이 사용되는 변환 중 하나는 MFCC (Mel-frequency cepstral coefficients) 입니다. 나는 대부분 MFCC의 배후에있는 수학을 알고있다. 나는 필터 뱅크 단계와 Mel 주파수 스케일링을 모두 이해한다. 내가 얻지 못하는 것은 DCT (Discrete Cosine Transform) 단계입니다.이 단계에서 어떤 종류의 정보를 얻습니까? 이 단계의 시각적 표현은 무엇입니까?

1
MFCC 계산 / 이해에 도움 : Mel-Frequency Cepstrum Coefficients
온라인에서 비트와 조각을 읽었지만 모두 함께 조각 할 수는 없습니다. 신호 / DSP에 대한 배경 지식이있어 충분한 전제 조건이되어야합니다. 결국이 알고리즘을 Java로 코딩하는 데 관심이 있지만 아직 완전히 이해하지 못하므로 여기에 있습니다 (수학으로 계산됩니다). 내 지식의 격차와 함께 작동한다고 생각합니다. 배열로 읽을 수있는 오디오 음성 샘플 (예 : .wav 파일)로 …

1
뇌 평균 정규화
누구든지 Cepstral Mean Normalization에 대해 설명 할 수 있습니까, convolution의 등가 속성이 어떻게 영향을 미칩니 까? MFCC 기반 스피커 인식에서 CMN을 수행해야합니까? MFCC에 컨볼 루션 속성이 필요한 이유는 무엇입니까? 나는이 신호 처리에 매우 익숙하다. 도와주세요
15 mfcc 

4
사운드 분류를위한 기능 추출
사운드 파일에서 기능을 추출하고 사운드를 특정 카테고리 (예 : 개 껍질, 차량 엔진 등)에 속하는 것으로 분류하려고합니다. 다음 사항에 대해 명확하게 설명하고 싶습니다. 1) 이것이 가능합니까? 음성을 인식하고 서로 다른 유형의 개 껍질을 구별 할 수있는 프로그램이 있습니다. 그러나 소리 샘플을 수신하고 어떤 종류의 소리인지 말할 수있는 프로그램을 가질 수 …

3
MFCC 계산에서 DCT 단계의 올바른 해석입니까?
이것은 여기서 논의 의 연속입니다 . 나는 거기에 의견을 말하지만 50 명의 담당자가 없으므로 새로운 질문을하고 있습니다. MFCC 계산 프로세스의 DCT 단계를 이해하는 방법은 다음과 같습니다. 필터의 겹침으로 인해 로그 뱅크 크기 (필터 뱅크에서)의 상관 관계를 분리해야합니다. 기본적으로 DCT는 이러한 로그 스펙트럼 크기로 제공되는 스펙트럼 표현을 부드럽게합니다. 아래 이미지의 파란색 …
9 mfcc  dct 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.