음성 인식을 위해 비디오 파일에서 오디오 클립을 추출합니다. 이 비디오는 모바일 / 기타 핸드 메이드 장치에서 가져 오므로 많은 노이즈가 있습니다. 음성 인식 엔진에 전달하는 음성이 선명하도록 오디오의 배경 소음을 줄이려고합니다. ffmpeg를 사용 하여이 모든 작업을 수행하고 있지만 노이즈 감소 단계에 갇혀 있습니다.
지금까지 다음 필터를 시도했습니다.
ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav
ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav
ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav
그러나 결과는 매우 실망 스럽다. 내 추론은 음성이 300-3000 hz 범위 아래에 있기 때문에 다른 모든 주파수를 필터링하여 배경 소음을 억제 할 수 있다는 것입니다. 내가 무엇을 놓치고 있습니까?
또한 음성 향상에 사용할 수있는 weiner 필터에 대해 읽었으며 이것을 발견 했지만 사용 방법을 잘 모르겠습니다.