«speech-recognition» 태그된 질문

3
휴먼 스피치 노이즈 필터
비 음성을 감쇠시키는 필터를 아는 사람이 있습니까? 음성 인식 소프트웨어를 작성 중이며 사람의 음성을 제외한 모든 것을 필터링하고 싶습니다. 여기에는 배경 소음, 삐걱 거리는 마이크에서 생성 된 소음 또는 배경 음악이 포함됩니다. 파워 스펙트럼의 6dB 롤오프를 보상하는 1 차 필터를 이미 구현했지만 여전히 잡음이 들립니다 (음성이 훨씬 선명하게 들리지만). 저역 …

1
사람의 말과 비슷한 오디오의 결정
이 문제에 대한 답을 찾고있는 동안,이 게시판 은 Stack Overflow 에서이 질문을 게시하기로 결정했습니다 . 오디오 세그먼트와 사람의 음성 사이의 유사성을 결정하는 방법을 찾고 있는데, 이는 숫자로 표현됩니다. 나는 꽤 많이 검색했지만 지금까지 찾은 것 (아래에 자세히 설명되어 있음)은 내가 필요한 것에 실제로 맞지 않습니다. 한 가지 방법은 음성 인식 …

1
음성 인식을위한 노이즈 감소는 인간에게 음성을 "명료하게"만들도록하는 노이즈 감소와 어떻게 다릅니 까?
이것은 주로 기존 음성 인식 시스템의 노이즈 감소를 위해 노력하고 있기 때문에 한동안 관심을 끌었던 질문입니다. 소음 감소 기술에 관한 대부분의 논문은 사람이 말을 더 잘 이해할 수있게하거나 "음질"과 같은 모호한 용어를 개선하는 방법에 초점을 맞추고있는 것 같습니다. 이와 같은 기준을 사용하여 시끄러운 음성 신호를 사람이 쉽게들을 수있는 필터를 식별 …

1
서로 다른 음파를 구별하기위한 피처 벡터 디자인
다음 4 가지 파형 신호를 고려하십시오. signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 …


2
그라디언트 기반 Hough 변환을 구현하는 방법
가장자리 감지에 Hough 변환을 사용하려고하는데 그라디언트 이미지를 기본으로 사용하고 싶습니다. I 화상은 주어진 지금까지 수행 한 어떤 I크기 [M,N]및 그 부분 유도체 gx, gy등의 각 화소에서의 기울기 각도를 산출한다 thetas = atan(gy(x,y) ./ gx. 마찬가지로 그라디언트 크기를로 계산합니다 magnitudes = sqrt(gx.^2+gy.^2). Hough 변환을 구축하기 위해 다음 MATLAB 코드를 사용합니다. max_rho …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.