더 높은 샘플링 속도에 대한 수학적 이점이 있습니까?


18

어쨌든 대부분의 사람들이 20kHz 이상의 주파수를들을 수 없기 때문에 48kHz 이상의 샘플링 속도를 사용하는 정확한 주장을 이해하지 못했습니다. 48kHz에서는 앨리어싱을 제거하기 위해 약간 더 높은 대역폭의 저역 통과 필터를 구성하는 것이 더 쉽다는 것을 알고 있지만, 왜 아무도 96kHz로 녹음하고 싶어하는지 이해하지 못합니다.

순수 디지털 합성을 사용하고 아날로그-> 디지털에서 변환 될 자료를 기록하지 않는 디지털로 엄격히 진행되는 프로젝트의 경우 44.1kHz 이상의 샘플링 속도를 사용하면 어떤 이점이 있습니까?

다른 모든 것에는 96kHz를 사용하면 어떤 이점이 있습니까? 나중에 특정 유형의 DSP 작업을 적용 할 때 도움이됩니까? 아니면 귀에 순수한 위약 효과입니까?

참고 : 여기에는 다양한 유형의 레코딩 프로젝트에 사용할 샘플링 속도에 대한 다른 질문이 있지만 여기서는 더 높은 샘플링 속도의 사용을 지원하는 수학 또는 DSP 관련 이유로 실제로 어려운 사실 을 묻습니다 .

답변:


19

가능한 경우 항상 두 가지 중요한 이유로 이중 샘플링 속도를 사용합니다.

첫 번째 이유 : 아날로그 사운드 소스로 작업 할 때 이미지 방지 필터의 특성을 제거해야합니다. 안티 이미징 필터 란 무엇입니까?

44100Hz로 녹화한다고 가정 해 봅시다.
10KHz 미만의 사인파를 기록하면 그래프에서 샘플 값을 플롯 할 때 사인파를 명확하게 볼 수 있습니다.
22,5KHz 주파수로 0dB FS의 사인파를 샘플링하면 샘플이 1과 -1을 교대로 읽습니다.

자, 여기 문제가 있습니다. 30KHz 주파수로 0dB FS의 사인파를 기록하고 샘플을 플로팅하면 각 샘플이 사인 기간의 절반 이상을 차지하고 샘플을 재생하는 경우 11KHz 사인파를 반환합니다. (나를 믿지 않으면 간단한 그림을 만드십시오.)이 동작을 '이미징 효과'라고합니다.

즉, 신호를 샘플링하기 전에 소위 "nyquist frequency"(샘플링 속도의 절반)보다 높은 주파수가 없는지 확인해야합니다. 이미 샘플링 된 사운드를 제공하는 디지털 사운드 소스를 사용하는 경우 샘플링 속도의 절반을 초과하는 신호를 생성하지 않도록 프로그래밍하거나 선형 위상을 사용하여 모든 것을 필터링 할 수 있기 때문에 실제로 그렇게 큰 문제는 아닙니다. 나머지 부분에는 영향을 미치지 않는 브릭 월 필터.

그러나 아날로그 소스에서 신호를 샘플링하는 경우이 필터링은 신호가 샘플링되기 전에 수행됩니다. 아날로그 사운드를 필터링하는 유일한 방법은 전자 회로를 사용하는 것입니다. 그리고 필터는 매우 가파른 곡선을 가져야 하므로 필터가 설계되지 않았더라도 가청 범위 내의 주파수에 영향을 미칩니다 . 이제 A / D 변환기 내부에는 꽤 좋은 필터가 있으므로 문제는 최소화되지만 96KHz를 사용하는 것과 비교하여 44.1KHz 오디오에서 며칠을 작업 할 때 듣는 것이 상대적으로 자극적입니다. 96을 다시 44.1로 다운 샘플링 할 때 적용되는 필터는 물론 디지털 필터이며 품질이 훨씬 더 좋습니다. 또한 모든 작업이 완료된 경우에만 적용되므로 귀찮게하지 않습니다.

두 번째 이유 : 디더링 신호의 특성을 제거하는 것입니다.

24 비트 해상도로 레코딩 할 때 마스터를 16 비트로 설정하려는 경우 반올림 오류를 가리기 위해 디더링 신호가 필요합니다. 이제 노이즈는 레코딩에있어 좋은 것은 아니며 광대역 노이즈는 반올림 오류를 마스킹하는 데 가장 좋지만, 노이즈 형성은 디더링 신호에 크게 방해가되지 않도록 크게 개선 될 수 있습니다. 이제 96KHz를 사용하여 녹음 한 경우, 디더링 신호의 대부분을 24KHz보다 높은 주파수로 노이즈 형태로 만들 수 있으므로 아무도들을 수 없습니다. 디더링 노이즈는 레코딩이 끝날 때 마지막으로 필터링되어 44.1 KHz로 프로젝트를 다시 샘플링하는 순간에 필터링됩니다.

결론 : 아날로그를 녹음 할 때 유용합니까?

  • 물론 이죠 적절한 노이즈 쉐이핑과 함께 사용하면 안티-이미징 필터의 방해가 줄어들고 디더링 신호의 방해가 줄어 듭니다.

내 softsynth에서 온 디지털 물건으로 작업 할 때 유용합니까?

  • 예, 24 비트로 작업하고 16 비트로 마스터 링하려는 경우에도 여전히 유용합니다. 디더링 신호를 형성하는 노이즈로 많은 것을 얻을 수 있습니다.

"그들은 때로는 절반 샘플링 속도 위의 신호를 생성 결코하도록 프로그램 할 수 있기 때문에" 그러나 확실히 진실 : "또는 나머지에 영향이없는 선형 위상 된 brickwall 필터를 사용하여 모든 필터링 할 수 있습니다" 아니에요을 가능합니다. 디지털로 생성 된 웨이브에서 초음파를 걸러 내려면 먼저 높은 샘플링 주파수 (이것은 가명 적이지만 가청 대역만큼 많지는 않지만)에서 더 높은 샘플링 주파수로 초음파를 생성해야합니다. 이미 별칭이 지정된 주파수는 필터링 할 수 없습니다.
endolith

3
"이제 96KHz를 사용하여 녹음 한 경우, 대부분의 디더링 신호를 24KHz 이상의 주파수로 노이즈 쉐이핑 할 수 있으므로 아무도들을 수 없습니다. 디더링 노이즈는 다운 샘플하는 순간에 최종적으로 필터링 된 필터링의 끝에서 필터링됩니다. 44.1 KHz로 프로젝트를 다시 시작하십시오. " 나는 그것이 옳다고 생각하지 않습니다. 모든 디더를 걸러 내면 더 이상 디더링이 없습니까? 양자화 왜곡으로 돌아가는가?
endolith

첫 번째 코멘트 다시 : 당신은 절대적으로 맞습니다. 내가 말하고자하는 것은 디지털 효과를 사용할 때 출력의 주파수 범위가 고려 될 수 있다고 생각합니다. 출력을 처음에 앨리어싱으로 나오면 자신의 샘플 주파수를 높이면 변경되지 않습니다. 당신의 두 번째 코멘트에 관해서 : 흥미있는; 프리 다운 샘플링에 사용 된 필터에 따라 달라집니다. 노이즈가 다시 이미지화되면, 양자화 노이즈를 숨길 수는 있지만 정확히 동일하게 들리지는 않습니다. 나는 마지막 nyquist freq 주위에 내 소음을 형성 할 것이라고 생각합니다.
Pellmeister

1
특정 종류의 동작은 24KHz 이상의 주파수 성분을 20KHz 이하의 주파수 성분으로 또는 그 반대로 변환 할 수 있습니다. 오디오가 첫 번째와 마지막 그러한 동작 사이에서 더 높은 샘플링 속도로 유지되지 않으면, 중간 단계에서의 정보 손실은 최종 출력에 가청적인 영향을 미칠 수있다.
supercat

12

순수 디지털 합성을 사용하고 아날로그-> 디지털에서 변환 될 자료를 기록하지 않는 디지털로 엄격히 진행되는 프로젝트의 경우 44.1kHz 이상의 샘플링 속도를 사용하면 어떤 이점이 있습니까?

예. 몇 가지 예 :

원하지 않는 주파수 생성

디지털 합성에서 앨리어싱

많은 구형 / 톱니 / 삼각형 파동 발생기 는 별명을 갖고 명확하게 나쁜 소리를내는 무한한 수의 고조파를 생성한다는 점에서 순진하게 작성되었습니다 . ( 올바른 구형파 ..., +1, +1, +1, +1, −1, −1, −1, −1, ...아니며 , 앨리어싱 된 고조파는 포르타멘토 동안 백그라운드에서 라디오 튜닝 사운드를 생성합니다.)

샘플링 주파수가 높으면 앨리어싱 주파수가 오디오 대역에서 멀어 지므로이 효과가 줄어 듭니다.

물론 생성자가 앨리어싱을 완전히 제거하는 방식으로 작성된 것이 더 좋지만 항상 사용자로 제어 할 수는 없습니다. 잘 작성된 것조차도 "감소 된"앨리어싱 으로 완전히 타협 되지 않으므로 타협이 이루어 지므로 더 높은 샘플링 속도는 여전히 도움이됩니다.

디지털 왜곡으로부터 앨리어싱

마찬가지로, 모든 종류의 디지털 비선형 왜곡을 사용하면 무한한 수의 고조파 또는 상호 변조 제품이 생성됩니다. 나이키 스트 주파수 이상으로 생성되는 것은 실제로 가청 범위로 다시 앨리어싱됩니다.

이론적 으로 대역 제한 방식 으로 왜곡하는 것이 가능하지만 플러그인 코더가 실제로이를 수행하는 것은 일반적이지 않습니다. 테스트 한 모든 기타 왜곡 플러그인에는 앨리어싱이 있으며 96 kHz에서 처리됩니다.

이것이 실제로 얼마나 많은 문제인지 잘 모르겠습니다. 많은 것들이 컴프레서 나 볼륨 페이드와 같이 소량의 왜곡을 유발하지만 그 양은 이미 무시할 수 있으므로 앨리어싱 된 양은 훨씬 무시할 수 있습니다. 왜곡이 심하면 앨리어싱 주파수가 노이즈에 묻혀있어 눈에 띄지 않을 수 있습니다. 그럼에도 불구하고 샘플링 속도가 높으면 유해한 영향을 최소화하는 데 도움이됩니다.

당신이 주파수의 부족 희망을

또 다른 가능한 문제는 합성 된 초음파 주파수가 녹음에서 직접들을 수는 없지만 나중에 처리에 유용 할 수 있다는 것입니다.

시간 변화에서 주파수 이동

사운드 폰트 플레이어와 같이 웨이브의 속도를 늦추기 위해 웨이브를 리샘플링하면 해당 초음파 주파수가 가청 주파수가됩니다. 낮은 샘플링 속도에서 앨리어싱을 피하기 위해 필터를 걸러 내면 느려진 사운드에 하이 엔드가 누락됩니다.

왜곡 / 변조

앞에서 말했듯이, 왜곡은 원래 기록에서 주파수와의 합과 차이 위치에서 새로운 상호 변조 주파수를 생성합니다. 이번에는 초음파 주파수의 왜곡 / 변조 (앨리어싱과 관련이 없음)에 의해 생성되는 바람직한 가청 주파수에 대해 우려하고 있습니다. 이러한 초음파 주파수가 왜곡되기 전에 녹음에 없으면 출력에서 ​​발생하는 가청 주파수가 누락되고 동등한 아날로그 효과를 정확하게 에뮬레이션하지 않습니다.

다시 말하지만 이것이 실제로 문제인지는 확실하지 않지만 적어도 그럴듯하며 초음파를 포함한 샘플링 속도가 높아지면 문제가 개선됩니다.

일반적으로 더 높은 샘플링 속도로 작업하면 "헤드 룸"이 생겨서 제대로 구현되지 않을 수있는 효과 및 항목의 문제를 방지 할 수 있습니다. 사본을 복사하는 것과 같이 각 사본의 품질이 좋을수록 최종 제품의 품질이 저하됩니다.

재생에 쓸모가 없습니다

이것은 높은 샘플링 속도가 완성 된 믹스 를 재생 하기에 좋은 아이디어라는 것은 아닙니다 . 그들은 아니야. 위에서 설명한 바와 같이 초음파 왜곡은 가청 사운드를 생성 할 수 있으며, 오디오 체인에서 스피커가 가장 선형 적이 지 않기 때문에 스피커에서 초음파가 왜곡되는 것을 방지하기 위해 최종 믹스에서 초음파를 제거해야합니다.

음악 재생을위한 높은 샘플링 속도에는 이점이 없습니다. 기록 및 처리 단계에서만 사용해야합니다. 24/192 음악 다운로드 ... 및 왜 이해가되지 않는 이유를 참조하십시오 .


1
잘못된 구형파 발생기를 언급 한 경우 +1 또한, 동일 톱니와 삼각 파도라고 할 수 있습니다 ...
사지 (Sarge) 러시아 식 수프의 일종

오디오 출력에 22Khz ~ 48KHz 범위의 원치 않는 컨텐츠를 쉽게 유지할 수 있기 때문에 96KHz 이상의 속도로 디지털 업 샘플링하는 것이 종종 재생에 도움이됩니다. 22Khz 이하의 어떤 것도 해치지 않고 48Khz 정도를 죽 이도록 아날로그 필터를 구성하는 것은 22Khz 이하의 어떤 것도 해치지 않고 26Khz 이상의 모든 것을 죽일 때까지 하나의 틸트를 구성하는 것보다 훨씬 쉽습니다. 오디오가 재생을 위해 96Khz로 변환되고 하나는 96Khz로 설정되어 있으면 다운 컨버전 및 업 컨버전 대신 96Khz로 유지할 수 있습니다.
supercat

@supercat 재생이 아니라 녹화 용입니다. 재생하기 전에 20kHz 이상의 모든 것을 제거하기 위해 매우 가파른 디지털 필터를 쉽게 만들 수 있습니다. 샘플링하기 전에 초음파를 제거하기 위해 아날로그 필터를 만드는 것은 어렵고 비싸기 때문에 ADC는 훨씬 높은 속도 (MHz)로 오버 샘플링을 사용한 다음 디지털 필터를 사용하여 초음파를 제거하고 96 kHz와 같은 일반 속도로 다시 변환합니다.
endolith

5

효과에 대한 헤드 룸을 확보하는 것은 사람의 청력 한계의 두 배보다 높은 샘플링 속도를 갖는 이론적으로 (실제적으로) 유효한 이유입니다.

그 이유는 이미지 편집과 비교하여 쉽게 시각화 할 수 있습니다.-고 대비 벽돌 벽, 망사, 줄무늬 직물 또는 기타 미세한 간격의 고 대비 텍스처를 전체적으로 촬영 한 800x600 px 이미지 만 있다면 회전 만 가능합니다. 모아레 효과 를 일으키지 않고 디테일을 흐리게 하지 않고 45 ° 배수 . 오디오를 사용하면 편집시 발생하는 왜곡이 다른 용어를 사용하지만 동일한 나이키 스트-샤논 샘플링 이론 원리가 적용됩니다. 앨리어싱 은 "이미징 효과"보다 일반적으로 사용되는 용어입니다. 샘플링 된 사운드의 샘플링 속도가 나이키 스트 주파수라고하는 샘플링 속도의 절반을 초과하는 경우.

실제로 Pelle ten Cate가 이미 설명한 것처럼 벽돌 벽 저역 통과 필터는 달성 할 수 없지만 컷오프에는 항상 약간의 경사 (기울기)가 있습니다.

더 높은 샘플링 속도로 녹음해야 할 또 다른 이유는 더 큰 스테레오 이미지를 얻는 것입니다. 사람의 청력은 대부분 음원을 현지화하기 위해 귀 사이의 작은 시간 차이 (약 5-20ms, 물리적으로는 위상 차이)에 의존하기 때문입니다. 머리 "그림자"와 다른 측면들도 역할을합니다.

44100Hz의 오디오 CD 샘플링 속도에서 각 샘플은 22,6 마이크로 초를 나타내며, 예를 들어 882Hz 주파수의 한주기에는 50 개의 샘플이 있습니다. 또한 20ms 지연의 다소 긴 지연은 50 개의 샘플을 지속합니다. 따라서 중간 주파수에서 25 개의 샘플 만 180 ° 위상 상쇄를 의미합니다.

따라서 44,1 KHz 샘플링 속도는 충분하지만 실제로 편집 할 헤드 룸이 많지 않습니다.

명심해야 할 또 다른 사항은 디더링 (이미지 편집에서와 같이)을 사용하여 양자화 노이즈를 방지하는 것입니다. 그리고 다음으로 물어볼 것입니다 .16 비트 대신 24 비트 양자화를 사용해야합니까?


의식적으로들을 수는 없지만 초음파가 여전히 스테레오 인식에 영향을 미치는 것으로 나타 났습니까?
endolith

1
스테레오 이미지에 대한 청각 시차의 영향은 귀의 거리가 파장보다 짧은 저주파수 (1500Hz 미만)에 가장 큰 영향을 미치므로 위상차가 있습니다. 주파수가 높을수록 사운드 레벨의 차이가 사운드 현지화에 더 큰 영향을 미칩니다. 참조 : en.wikipedia.org/wiki/Interaural_time_difference#Duplex_theory
peterhil

4

더 높은 샘플링 속도를 사용하는 또 다른 좋은 이유는 플러그인 구현의 결함을 해결하는 것입니다. 많은 플러그인 작성자는 비선형 신호 연산의 대역폭 확장 효과를 제대로 고려하지 않으므로 상자를 떠나기 전에 앨리어싱 효과를 얻을 수 있습니다.

예를 들어, 컴프레서는 기본적으로 전압 제어 앰프입니다. 하나의 신호 (오디오 신호)와 다른 신호 (이득)를 곱합니다. 2 개의 신호의 곱은 링 변조 또는 이종 다이닝이라고도합니다. 두 입력의 합과 차이 신호를 생성하는 효과가 있습니다. 15kHz 사인에 10kHz 사인을 곱하면 5kHz와 25kHz 성분을 갖는 출력 신호를 얻습니다. 컴프레서의 게인이 매우 빠른 어택을 가지고 있고 입력 신호의 대역폭이 넓은 경우 "합계"컴포넌트 신호가 일시적으로 Fs / 2 한계를 쉽게 넘어갈 수있어 출력에서 ​​허위 앨리어스 저주파 정크가 발생할 수 있습니다. 신호.

이것에 대한 진짜 해결책은 내부적으로 오버 샘플링을 사용하여 플러그인을 구현하는 것이지만, 다음으로 얻을 수 없다면 가장 높은 Fs로 시스템을 실행하는 것이 가장 좋습니다. 성층권에는 실제 오디오 콘텐츠가 없지만 경계를 지나치는 플러그인으로부터 보호됩니다.


2

가치가있는 것에 대해, 적어도 오디오 세계의 요구에 대한 수학적 이론적 근거는 일반적으로 나이키 스트-샤논 샘플링 정리 (Nyquist-Shannon sampling theorem)에 의해 묘사되며 , 때로는 나이키 스트 정리 (Nyquist theorem)라고도합니다. 최대 주파수가 nHz 인 파형의 경우 초당 2n 개의 샘플이 필요합니다.


1
네, 그러나 나이키 스트 샤논은 벽돌 벽 필터를 사용합니다.
endolith

1

여러 트랙으로 녹음 할 때 비트 심도가 샘플링 속도보다 더 중요하다고 생각합니다.

예를 들어 24 비트가 16 비트보다 낫습니다. 비트가 충분하지 않은 경우 트랙이 서로 섞이고 "라운딩 오류"라고하는 방식과 관련이 있습니다.

대부분의 하드웨어 및 소프트웨어는 이제 96k 및 24 비트를 쉽게 지원할 수 있으므로 적은 비용으로 해결할 필요가 없습니다.

즉, 이전 16 / 44.1 장비를 사용하여 고품질 녹음을 할 수 있습니다.

그것은 장비보다 재능에 관한 것입니다.


2
이것이 사실이 아니지만 24 비트로 작업하면 16 비트로 돌아가려면 디더링을 사용해야하는 단점이 있습니다. 노이즈 쉐이핑을 사용할 때 96KHz 신호에 적용하면 디더링 노이즈를 크게 줄일 수 있습니다. (자세한 내용은 다른 답변 참조)
The Pellmeister

1
모든 전문 오디오 소프트웨어는 녹음 중에 사용 된 비트 깊이에 관계없이 믹스 중에 내부적으로 32 비트 또는 64 비트 부동 소수점으로 작동합니다.
leftaroundabout

3
@PelletenCate 16 비트로 작업하는 경우 각 사소한 편집 단계에서 양자화 노이즈를 추가하기 때문에 이미 문제가 있습니다. 이것은 24 비트 이상으로 작업하면 그러한 단점이 있음을 암시하는 것은 매우 잘못입니다.
Sarge Borsch

나는 +1했다. 나는 그것이 단점이기 때문에 그것을 설명해서는 안됩니다. 그러나 44/16 믹스에서 양자화 노이즈와 형태가없는 디더링 노이즈를 모두들을 수 있다고 말해야합니다. 내 요점은 24 비트로 전환하면 더 높은 샘플링 속도로 기록하여 효과적으로 줄일 수있는 다른 문제 (디더링 노이즈)에 대해 하나의 문제 (양자화 노이즈)를 변경할 수있는 기회를 제공한다는 것입니다.
Pellmeister

0

"... 더 높은 샘플링 속도의 사용을 지원하는 모든 수학적 또는 DSP 관련 이유로 실제적이고 어려운 사실."

실제 오디오 엔지니어가 제공하는 실제 사실은 여기에서 몇 가지를 찾을 가능성이 있지만 인터넷에서 실제 엔지니어가 작성한 기사를 검색하는 것이 더 빠릅니다. 여기에 묻는 것은 오디오 엔지니어가 아니지만 검색 도구를 사용할 수 있다는 의미입니다.

고려해야 할 것은 소음 층입니다. 다른 답변은 노이즈를 추가하고 디더링 및 양자화 오류를 언급하는 방법을 언급하지만 다른 답변이 바닥에 대해 언급 한 가장 가까운 것은 다음과 같은 것입니다. ".

건설 현장, 기차역 또는 조선소에서 녹화하는 경우 완벽하지 않은 경우 저렴하고 44.1에서 녹화 할 수 있습니다. 그렇지 않으면 비디오가 4 : 2 : 2가 아니라 4 : 2 : 0이 아니기 때문에 더 많은 비트 수 (32 개 이하) (내부 소프트웨어의 경우 32 개 이상) 및 더 높은 샘플링 속도 (96kHz 이상) (더 높은 샘플링 속도로 작동하는 소프트웨어 및 하드웨어를 내부적으로 사용)

엔지니어의 조언 검색을 시작하려면이 기사를 사용하십시오. 법적 조언은 방문하지 않습니다. 중요한 정보에 대한 스택 교환을 통해 배우는 법을 배우십시오. 궁극적으로 그것이 얼마나 많은 관심을 갖고 있는지, 청중이 얼마나 많은 관심을 가지고 있는지, 기술 수준 및 당신이 감당할 수있는 것입니다.

왜 88.2- http: //www.soundonsound.com/sound-advice/q-why-882khz-best-sample-rate-recording

왜 24/96입니까? -http: //www.premiersoundfactory.com/modules/pico/content0035.html

무료 온라인 강좌를 포함하여 인터넷상의 많은 장소.

짧은 버전은 그렇습니다. 이유가 있으며 어려운 사실입니다. 처음에 오류를 던지지 말고 나중에 자르기를 희망합니다. 촬영을 시도하는 동안 누군가가 말하는 것을 원하지 않거나 Shot을 통해 달리는 낯선 사람 -그래도 엄지 손가락이 많은 동영상이 있습니다.

기억해야 할 해킹은 시간, 저장 공간, 기술, 돈 및 입력 유형 (IE : 건설 현장), 청중)이 감당할 수있는 높은 속도로 클리핑없이 크게 녹음하고 노이즈 제거로 가장 조용한 뉘앙스를 잘라내어 시끄러운 양자화 및 디더링 노이즈

[사실상의 오류없이 간단한 답변을하고자하며 오디오 애호가 나 전문 오디오 엔지니어를 화나게하려는 의도가 아님]

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.