신호 처리 speech-recognition

3

비 음성을 감쇠시키는 필터를 아는 사람이 있습니까? 음성 인식 소프트웨어를 작성 중이며 사람의 음성을 제외한 모든 것을 필터링하고 싶습니다. 여기에는 배경 소음, 삐걱 거리는 마이크에서 생성 된 소음 또는 배경 음악이 포함됩니다. 파워 스펙트럼의 6dB 롤오프를 보상하는 1 차 필터를 이미 구현했지만 여전히 잡음이 들립니다 (음성이 훨씬 선명하게 들리지만). 저역 …

17 filters audio noise speech-recognition

1

사람의 말과 비슷한 오디오의 결정

이 문제에 대한 답을 찾고있는 동안,이 게시판 은 Stack Overflow 에서이 질문을 게시하기로 결정했습니다 . 오디오 세그먼트와 사람의 음성 사이의 유사성을 결정하는 방법을 찾고 있는데, 이는 숫자로 표현됩니다. 나는 꽤 많이 검색했지만 지금까지 찾은 것 (아래에 자세히 설명되어 있음)은 내가 필요한 것에 실제로 맞지 않습니다. 한 가지 방법은 음성 인식 …

12 audio algorithms speech-recognition

1

음성 인식을위한 노이즈 감소는 인간에게 음성을 "명료하게"만들도록하는 노이즈 감소와 어떻게 다릅니 까?

이것은 주로 기존 음성 인식 시스템의 노이즈 감소를 위해 노력하고 있기 때문에 한동안 관심을 끌었던 질문입니다. 소음 감소 기술에 관한 대부분의 논문은 사람이 말을 더 잘 이해할 수있게하거나 "음질"과 같은 모호한 용어를 개선하는 방법에 초점을 맞추고있는 것 같습니다. 이와 같은 기준을 사용하여 시끄러운 음성 신호를 사람이 쉽게들을 수있는 필터를 식별 …

10 noise speech-recognition speech-processing noise-cancellation

1

서로 다른 음파를 구별하기위한 피처 벡터 디자인

다음 4 가지 파형 신호를 고려하십시오. signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 …

10 computer-vision frequency-spectrum autocorrelation speech-recognition

1

전화 통화 오디오를 무음 / 무음으로 분할하는 방법은 무엇입니까?

내 문제는 배경 소음의 에너지를 모른다는 것이므로 에너지를 임계 할 수는 없습니다. 처리는 실시간으로 이루어지며 약 500msec을 결정해야합니다. 이상적으로는 조용한 자음이 침묵이 아닌 것으로 간주되기를 원합니다.

9 audio speech-recognition

2

그라디언트 기반 Hough 변환을 구현하는 방법

가장자리 감지에 Hough 변환을 사용하려고하는데 그라디언트 이미지를 기본으로 사용하고 싶습니다. I 화상은 주어진 지금까지 수행 한 어떤 I크기 [M,N]및 그 부분 유도체 gx, gy등의 각 화소에서의 기울기 각도를 산출한다 thetas = atan(gy(x,y) ./ gx. 마찬가지로 그라디언트 크기를로 계산합니다 magnitudes = sqrt(gx.^2+gy.^2). Hough 변환을 구축하기 위해 다음 MATLAB 코드를 사용합니다. max_rho …

9 image-processing edge-detection image-processing computer-vision image-registration discrete-signals noise bpsk snr demodulation bpsk multipath synchronization timing image-processing filters algorithms edge-detection sampling demodulation bpsk synchronization timing fft fourier-transform delay audio speech-recognition soft-question discrete-signals discrete-signals autocorrelation frequency computer-vision

«speech-recognition» 태그된 질문