음성 녹음에서 환경 소음을 제거하는 방법을 알고 싶습니다.
나는 약간의 연구를했으며 제안 된 대부분의 방법이 빠른 푸리에 변환을 사용한다는 것을 알았습니다. 그러나 왜 클래식 전자 필터를 사용하여 잡음 주파수를 제거 할 수 없습니까? FFT를하는 데 왜 귀찮은가?
음성 녹음에서 환경 소음을 제거하는 방법을 알고 싶습니다.
나는 약간의 연구를했으며 제안 된 대부분의 방법이 빠른 푸리에 변환을 사용한다는 것을 알았습니다. 그러나 왜 클래식 전자 필터를 사용하여 잡음 주파수를 제거 할 수 없습니까? FFT를하는 데 왜 귀찮은가?
답변:
음성 녹음에서 환경 소음을 제거하는 방법을 알고 싶습니다.
음, 지금은 디지털 방식으로 저장됩니다. 아날로그 필터 후에 마이크를 스피커 옆에 두어 다시 녹음 할 계획입니까?
엉망인 나는 진지 할 것이다.
더 작은 주파수 범위에서 필터를 더 감쇠 시키려면 주파수 응답 곡선을 더 수직으로 만들면 필터의 차수 만 증가하면됩니다.
그것은 Matlab에서 합리적으로 쉬운 일입니다. 또한 사후 처리를 수행하는 것이 가능합니다. 오늘도 맑은 날에 필터를 적용하면 내일 비가 올 때와 동일하게 작동 할 것으로 예상됩니다. 당신은 그것이 정확히 똑같이 작동 할 것으로 기대 합니까?
아날로그 회로에는 이러한 "5 % 저항", "1 % 커패시터"및 기타 모든 것들이 있습니다. 따라서 정확한 것을 만들고 싶다면 원하는 필터와 완벽하게 일치하도록 회로를 다듬어야합니다. 필터의 순서를 높이려면 ... 안타깝게도 .. 필터를 물리적으로 훨씬 크게 만듭니다. 신용 카드의 크기를 차지하는 대신 필터 순서와 원하는 것에 따라 크기가 커집니다.
반복성에 관해서는, 오늘 무언가를해라 .. 따뜻한 .. 내일 .. 더 차가워 라 ... 저항은 약간 변할 것이다. 구성 요소의 값이 변경 될 수 있습니다. 그리고 습기가 있고 산화되고 ...
그리고 여기 제가 먼저 말씀 드린 펀치 라인이 있습니다. 카세트 테이프가 없다면 실제로 후 처리 할 수 없습니다. 나는 쉽게 녹음 / 삭제하는 데 사용되는 아날로그 음악 매체가 100 % 확실하지 않습니다. LP 디스크는 악몽 일 것입니다 ...
그리고 가격을 잊지 말자. 하나는 소프트웨어이며, 직접 작성하면 본질적으로 무료이며 다른 하나는 구성 요소, 물리적 부분이 필요합니다.
그러나 아날로그 필터가 나쁘다고 생각하지 마십시오. 대형 DC 모터에서 불쾌한 고조파를 제거하거나 전류를 부드럽게하여 3D 프린터 용 초고속 스테퍼 모터 를 만드는 등의 용도로 사용 됩니다. 그리고 다른 많은 용도. -또한 아날로그 필터로 문제를 해결하면 아무도 나쁜 해결책이라고 생각 하지 않습니다 .
나는 FFT가 왜 후 처리에 현명한 지에 대해 더 나은 방법이라고 왜 간접적으로 대답하고 있다고 생각합니다. 결론은 훨씬 저렴하다는 것입니다. 잡음의 주파수를 알고 있다면 노치 필터를 적용 할 수도 있습니다. 또는 더 넓은 일명 밴드 스톱 필터.
마지막으로 추가하고 싶은 것은 ...이 답변이 너무 길어서 죄송합니다. 그러나 아날로그 필터를 사용하고 계산을 엉망으로 만든 다음 모든 것이 멋지고 멋지게 생각되면 스웨덴 왕 (Knugen)과의 인터뷰와 같은 심각한 사건에 사용하십시오. 그리고 16kHz 노이즈를 필터링하는 대신 커패시터의 크기 조정을 망쳐 놓고 4kHz "노이즈"를 필터링합니다. 대신 디지털 방식으로 처리하는 경우 일부 변수를 변경하기 만하면됩니다. 다른 구성 요소를 납땜 제거 할 필요가 없습니다. 또한 인터뷰가 망했다.
그러나 왜 클래식 전자 필터를 사용하여 잡음 주파수를 제거 할 수 없습니까?
누가 할 수 없다고합니까? 이것이 디지털 신호 처리 전날에 이루어진 방식입니다. 문제는 잡음을 줄이면서 원하는 신호 (음성, 음악)를 건드리지 않고 유지하는 것 사이에서 항상 잡음 필터링이 절충안이라는 것입니다.
카세트 테이프 및 DNL 및 Dolby와 같은 다른 아날로그 테이프 녹음 시스템의 경우 신호가 약한 경우에만 필터링하여 노이즈가 더 잘 들리도록 필터링했습니다. 그런 다음 신호가 강해지면 필터가 사라집니다. 참조 : 위키 백과 기사 노이즈 감소에
음성은 300 Hz ~ 3 kHz와 같은 좁은 주파수 대역으로 제한 될 수 있지만 여전히 완벽하게 이해할 수 있습니다. 해당 대역에 대한 간단한 아날로그 필터를 만들 수 있지만 노이즈가 억제되는 정도가 제한됩니다. 이 대역 외부의 주파수를보다 효과적으로 필터링하려면 복잡한 아날로그 필터가 필요합니다. 이러한 필터는 설계, 제작 및 제조가 어렵다.
디지털 신호 처리가 시작됩니다. 디지털 영역에서는 극점과 영점이 많은 복잡한 필터를 구현하는 것이 훨씬 쉽습니다. 또한 이러한 극점과 영점의 위치 (주파수 영역에서)는 정확한 (크리스탈) 클록 인 DSP (Digital Signal Processor)의 클록에 연결되므로 필터는 아날로그 구현에 비해 훨씬 정확합니다. .
FFT가 필요한 이유를 이해하기위한 첫 번째 단계는 디지털 필터링의 작동 방식을 이해하는 것입니다.
따라서 기본적으로 시프트 레지스터와 같은 많은 메모리 요소, 입력 및 출력 구조가 있습니다. 샘플 값이 입력으로 들어가 레지스터를 통해 이동하여 출력으로 이동합니다. 레지스터의 각 단계에서 필터 계수라는 숫자를 곱합니다.
빠른 곱셈을하는 빠른 레지스터가 있고 샘플이 하나씩 천천히 들어 오면이 아이디어는 정상적으로 작동합니다.
실제로는 그 대신 여러 샘플로 구성된 프레임을 얻을 수 있습니다. 이를 필터링하고 싶을 때 필터 계수로 샘플을 컨벌루션합니다. 이는 이전의 접근 방식과 동일하지만 약간 다르게 보입니다.
이제 FFT 부분이 온다. 컨볼 루션은 샘플 수에 따라 수치 복잡성이 매우 빠르게 증가합니다. 반면에 FFT는 수치 적으로 복잡하지만 컨볼 루션에 비해 필터 계수가 증가함에 따라 필요한 연산 수가 훨씬 느려집니다.
위의 의미는 특정 개수의 샘플을 초과하면 FFT를 사용하여 신호를 주파수 영역으로 변환하고 주파수 영역에서 신호를 필터링 한 다음 IFFT를 사용하여 다시 변환하는 것이 훨씬 빠릅니다. 우리가 사용하는 트릭은 컨볼 루션의 속성 중 하나입니다. 즉, 시간 도메인의 컨볼 루션은 경우에 따라 주파수 도메인의 곱셈으로 모델링 될 수 있습니다.
요약하면, 필터 계수의 수가 충분히 많으면 FFT가 더 빠릅니다. "대형"은 백 정도 정도 작을 수 있습니다.
FFT 기반 방법 (여전히 윈도우와 오버랩 추가 또는 오버랩 시프트 수정 작업을해야 함)은 디자인이 주파수 영역에서 견고하고 위너 필터 또는 스펙트럼 감산 또는 신호 통계에 의존하는 다른 시스템과 모델은 실제로 주파수 영역에서 기본적으로 작동합니다.
반대로, 반향 제거 및 다양한 변형은 잡음 모델 에 의존하지 않고 잡음과 높은 상관 관계가있는 불완전한 기록에 의존합니다 . 나머지 필터와 노이즈 채널의 상관 관계를 최소화하기 위해 신호에서 노이즈 추정값을 빼고 필터를 업데이트하기 위해 다양한 필터 (일반적으로 FIR)를 사용합니다. 이러한 기술의 경우 FFT가 그다지 유용하지는 않습니다 (결과 신호 및 필터 업데이트의 상당한 지연이 허용되는 경우 성능상의 이유로 지연이있는 블랙 박스 FIR의 구성 요소로 사용될 수 있지만 실제로는 유용하지는 않습니다) 주파수 영역 표현 능력).
아날로그 필터는 설계하기에 충분하지만 한계는 주어진 주파수의 대역 정지 필터링을 달성하기 위해 물리적 필터 요소를 계속 추가해야한다는 것입니다. 노치를 움직이려면 구성 요소 값을 조정해야합니다. 단일 opamp는 하나의 대역 정지 노치를 수행 할 수 있으므로 원하는 각 노치마다 다른 증폭기를 추가해야합니다. 보다 선택적인 노치의 경우 노치 당 2 개의 증폭기가 필요합니다.
실제로는 단일 opamp 또는 2 개가 필요한 5 차 저역 통과 필터로 수행 할 수있는 3 차 저역 통과 필터를 사용하는 것이 가장 좋습니다. 저역 통과 필터를 사용하여 나이키 스트 주파수 (1/2 샘플링 주파수) 이상의 주파수를 약간의 마진으로 감쇠하면 후 처리를위한 고품질 디지털 샘플을 얻을 수 있습니다. 깨끗하게 녹음하면 FFT 필터를 적용하여 필요에 따라 고역 통과, 대역 통과 및 대역 정지 필터를 만들 수 있습니다.
"고전 전자 필터"가 수행하는 선형 시간 불변 필터링은 푸리에 영역에서 "덤"곱셈입니다. 그러나 FFT에서 찾은 정보는 하나의 필터 응답보다 더 자세한 정보를 제공합니다. 이는 해당 구성 요소의 선형 조합입니다. 이 정보를 사용하여 데이터 처리를 조정하고 데이터에 맞게 조정할 수 있습니다. 잡음은 명확한 보컬과 음악 톤이 아닌 일부 특성을 가지고 있습니다. 예를 들어, 오버톤 간의 상관은 음성이나 음악의 잡음과 거의 동일하지 않습니다.
따라서 주파수 성분 사이의 상관 관계를 식별 할 수있는 경우 (예 : "지상 톤"찾기) 필터링을 조정하여 데이터에보다 적합하게 만들 수 있습니다.