신호 처리 audio

6

소프트웨어 개발 경험이 있고 신디사이저를 좋아하고 디지털 오디오 표현의 [매우] 기본 사항을 알고있는 사람은 DSP와 같은 음악 신디사이저를 프로그래밍하기 위해 가장 먼저해야 할 단계는 무엇입니까?

19 audio

3

Sooo .. 나는 이것에 대해 생각하고 있었다. 우리는 모두 자신의 목소리와 다른 소리를냅니다. 다른 사람이 자신을 녹음하여 우리의 의견을 듣고들을 수있는 방법을 쉽게 찾을 수 있습니다. 그러나 다른 방법은 어떻습니까? 우리 자신의 목소리를 인식 할 때 다른 사람들이 우리를들을 수있는 방식으로 우리의 목소리를 변형시키는 방법이 있습니까? 나는 그것이 매우 흥미로운 …

18 signal-analysis audio transform

4

음성 활동 감지를위한 라이브러리 (음성 인식 아님)

이전 질문에 따라 음성 감지 라이브러리가 있는지 궁금합니다. 음성 감지 란 오디오 버퍼를 전달하고 음성이 시작 및 중지되는 위치의 색인을 다시 가져 오는 것을 의미합니다. 따라서 44kHz에서 10 초의 오디오 샘플링을 수행하면 다음과 같은 숫자 배열이 필요합니다. 44000 88000 123000 190334 ... 예를 들어 말은 1 초 후에 시작하여 2 …

18 audio speech

3

휴먼 스피치 노이즈 필터

비 음성을 감쇠시키는 필터를 아는 사람이 있습니까? 음성 인식 소프트웨어를 작성 중이며 사람의 음성을 제외한 모든 것을 필터링하고 싶습니다. 여기에는 배경 소음, 삐걱 거리는 마이크에서 생성 된 소음 또는 배경 음악이 포함됩니다. 파워 스펙트럼의 6dB 롤오프를 보상하는 1 차 필터를 이미 구현했지만 여전히 잡음이 들립니다 (음성이 훨씬 선명하게 들리지만). 저역 …

17 filters audio noise speech-recognition

1

FFT Spectrums를 사용하여 유사한 음악 찾기

몇 주 동안 다른 장르의 음악을 포함하는 라이브러리에서 비슷한 노래를 일치 / 찾기하는 방법을 찾기 위해 실험했습니다. 첫 번째 시도는 그룹을 형성하기 위해 템포와 같은 기능을 감지하거나 곡에 저음이 얼마나 많은지를 감지하는 것이었지만 송 비트의 약 20 %가 계산되지 않기 때문에이 방법 (볼륨 변경 기반 비트 감지)으로 멀리 가지 못했습니다. …

16 audio fft music

2

스테레오 오디오 신호에서 보컬 부분을 추출하는 방법은 무엇입니까?

이제 MP3 파일을 처리 중이며이 문제가 발생합니다. 내 MP3는 스테레오 인코딩입니다. 내가하고 싶은 것은 추가 처리를 위해 보컬 부분을 추출하는 것입니다 (출력 신호 모드, 모노 또는 스테레오가 모두 괜찮습니다). 내가 아는 한, 오디오는 MP3에서 다른 분리 된 하위 주파수 대역으로 인코딩됩니다. 차단 주파수를 적절히 설정 한 고역 통과 / 저역 …

15 audio downsampling mp3 background-subtraction

4

FFT에서 더 낮은 주파수가 더 강합니까?

마이크 입력에서 FFT를 계산하고 있습니다. 저주파는 항상 고주파수보다 더 많은 전력 (더 높은 dB)을 갖는 것으로 보입니다. 데이터를 24576 바이트 (4096 * 6)의 프레임으로 자릅니다. 해밍 적용 창 : input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); FFTW를 통해 실행하십시오 Process1D(). 복소수에서 변환 : output[i] = 10.0 * Math.Log10((fout[i * 2] * …

15 audio fft

4

사운드 분류를위한 기능 추출

사운드 파일에서 기능을 추출하고 사운드를 특정 카테고리 (예 : 개 껍질, 차량 엔진 등)에 속하는 것으로 분류하려고합니다. 다음 사항에 대해 명확하게 설명하고 싶습니다. 1) 이것이 가능합니까? 음성을 인식하고 서로 다른 유형의 개 껍질을 구별 할 수있는 프로그램이 있습니다. 그러나 소리 샘플을 수신하고 어떤 종류의 소리인지 말할 수있는 프로그램을 가질 수 …

15 audio mfcc machine-learning classification sound-recognition

1

RMS로 트랙의 음량 높이기

버퍼에 저장 한 오디오 트랙의 음량을 계산하려고합니다. 버퍼에는 신호의 PCM 데이터가 포함되어 있으며 Root Mean Squared를 사용하여 얼마나 큰 소리를 얻고 싶습니다. 주파수 도메인으로 전환하지 않고 시간 도메인 에서이 작업을 수행 할 수 있다고 가정합니다. 이 작업을위한 의사 코드는 무엇입니까? 간단히 1 초 동안 (audio [0]-audio [44099], audio [44099]-audio [88199] …

15 audio discrete-signals

2

웃음 트랙은 언제 시작됩니까?

주말 프로젝트 중 하나가 신호 처리의 심해로 나를 데려 왔습니다. 무거운 수학이 필요한 모든 코드 프로젝트와 마찬가지로 이론적 근거가 부족하더라도 솔루션에 대한 해결책을 찾는 것이 행복하지만이 경우에는 아무것도 없으며 내 문제에 대한 조언을 좋아할 것입니다. 즉, 나는 TV 쇼에서 라이브 관객이 언제 웃을 지 정확히 파악하려고합니다. 나는 웃음을 감지하기위한 머신 …

14 audio sound-recognition

4

인간의 정확도에 가까운 실시간으로 오디오 신호의 주파수 성분을 추출하는 가장 효율적인 방법

FFT와 같은 방식으로 임의의 오디오 샘플 (일반적으로 음악)의 주파수 구성 요소를 추출하는 방법을 (가능하면) 해결하려고 노력하고 있지만 FFT 알고리즘에 대한 연구에서 일부 문제가 있음을 알고 있습니다 이 목적에 대한 엄격한 제한. FFT가 제시하는 3 가지 문제가 있습니다. FFT 빈 해상도는 창 크기와 같기 때문에 상당히 정확한 정확도 (1Hz)를 달성하려면 불합리하게 …

14 fft audio frequency music real-time

4

Scipy-오디오 처리

오디오 신호 처리를위한 유용한 도구를 찾고 있습니다. 음성 및 음악 분석, 자동 언어 식별 등 Scipy 라이브러리는 오디오 처리 기능을 제공합니까? 오디오 신호 처리를위한 좋은 도구가 있습니까? 이를위한 도구를 제안 해 주시겠습니까?

14 audio python signal-detection

2

어떤 대역 통과 필터 설계가 가장 짧은 임펄스 응답을 제공합니까?

중심 주파수가 500Hz이고 대역폭이 1 옥타브 인 간단한 2 차 IIR 대역 통과 Buterworth 필터를 설계하면 다음과 같은 주파수 응답이 가능합니다. 이제 임펄스 응답을 취해이를 정규화하여 dB로 변환 하면 임펄스 응답 의 붕괴 를 관찰 할 수 있습니다 . 임펄스 응답의 감쇠는이 스케일에 표시 될 때 시간에 따라 거의 선형이므로 …

14 filters audio infinite-impulse-response impulse-response bandpass

5

음성 전용 녹음에서 노래가 시작되는 위치 식별

사용자가 노래의 4 줄을 노래하는 작은 노래방 스타일 앱이 있으며 각 줄 사이에 1 초 간격이 있습니다. 배경 음악이 없으므로 음성만으로 문제를 쉽게 해결할 수 있습니다. 내 녹음에서 사용자가 노래 1을 시작하고 끝내고 노래 2를 시작하고 끝내는 등을 정확하게 감지하는 가장 강력한 방법을 찾고 있습니다. 나는 녹음에 배경 소음이 거의 …

14 audio signal-detection

2

오디오 시스템에서 에코를 식별하고 제거하는 데 어떤 방법을 사용할 수 있습니까?

배경 전화 유형 설정에 사용할 단일 소형 마이크 및 스피커가있는 시스템을 설계하고 있습니다. 내가 줄 수있는 가장 쉬운 예는 컴퓨터 스피커와 데스크탑 마이크를 사용하는 Skype 대화입니다. 스피커의 오디오가 마이크에 의해 픽업되어 원래 사람에게 다시 전송되는 것이 걱정됩니다. 나는 VoIP 대화 초기에 항상 이런 일이 발생한다고 들었지만, 더 이상 들리지 않습니다. …

14 audio

«audio» 태그된 질문