오디오 신호 처리 초보자를위한 학습 로드맵


13

오디오 신호 처리를 배우고 싶습니다. 온라인과 학술 논문이 많이 있으며 주제의 기본 사항을 모두 생략 한 것 같습니다.

오디오 신호 처리를 성공적으로 배우기 위해 따라야 할 거친 로드맵을 알고 싶습니다.

신호 분석을 시작하기 전에 미적분이 첫 번째 단계라는 것을 읽었습니다.

오디오 신호 분석이 필요한 전체 지식의 일부일 뿐이라고 생각합니다. 다른 주제는 음악 이론, 오디오 엔지니어링 및 프로그래밍입니다.

이 분야에 대한 지식을 가진 사람들에게 오디오 신호를 분석하고 조작 / 생성하는 방법을 이해하기위한 가능한 단계를 제안하도록 요청할 수 있습니다.


신호 및 시스템 이론 텍스트 또는 과정에서 발생할 수있는 수학을 이해하는 데 미적분학 배경 (최소한)이 중요하다는 데 동의합니다. 나는 당신이 먼저 스너프에 있는지 확인합니다.
Jason R

1
이 슬라이드가 도움이 될 수 있습니다. 오디오 처리 및 오디오 프로그래밍의 비 수학적 / 엔지니어링 기본 사항을 제공합니다. blog.bjornroche.com/2011/11/…
Bjorn Roche

답변:



9

오디오가 기본적으로 무엇이고 오디오를 디지털로 표현하는 다양한 방법이 무엇인지 먼저 이해하지 않고 DFT / FFT / IIR / FIR 및 웨이블릿의 복잡성을 뛰어 넘는 포인트는 없다고 생각합니다.

일반적으로 오디오 란 무엇입니까 (물이나 기타 재료가 아닌 공기 중) :

  • 오디오는 음압 파로 구성
  • 그들은 공기의 압축과 희박을 유발합니다
  • 이 파도는 근원지 점에서 바깥쪽으로 전파됩니다
  • 파도가 서로 간섭하여 피크와 최저점을 유발할 수 있음
  • 파도는 재료에 의해 흡수되고 반사 될 수 있습니다

오디오는 전기적으로 어떻게 표현됩니까?

  • 음압 파를 전기 신호로 변환하는 마이크 및 프리 앰프
  • 일반적으로이 신호에는 양의 전압과 음의 전압이 모두 있습니다 (예 : AC 전압)
  • 마그네틱 테이프는 이러한 차이를 저장하므로 아날로그라는 용어를 저장합니다.
  • 입력 신호의 강도가 시스템의 한계와 같을 때 포화가 발생합니다 (더 이상 전압 증가를 정확하게 표현할 수 없음)
  • 클리핑은 입력 신호가 시스템이 표현할 수있는 것보다 높을 때 발생하므로 신호가 잘립니다 (또는 사지에 캡 핑됨)

오디오는 어떻게 디지털 방식으로 표현됩니까?

  • 먼저 ADC를 사용하여 오디오를 샘플링해야합니다 (아날로그-디지털 변환기)
  • 샘플링은 주기적으로 오디오 신호를 전기적으로 측정하는 것으로 구성됩니다
  • 이 기간을 샘플 속도라고하며 표현할 수있는 최고 주파수를 결정합니다 (최신 한계)
  • 나이키 스트 한계는 샘플링 속도 / 2입니다 (한계에 가까울수록 신호가 더 잘 표현되지 않음).
  • 비트 범위는 노이즈 플로어를 결정합니다 (16 비트의 경우 -96dB, 8 비트의 경우 -48dB).
  • 단일 16 비트 오디오 샘플은 -32768에서 32767 사이의 (서명 된) 값일 수 있습니다 (이는 아날로그 신호의 음과 양의 스윙을 모두 나타낼 수 있음)
  • 바이트 당 8 비트 만 허용되므로 (컴퓨터 저장 측면에서) 16 비트 샘플은 2 바이트 이상으로 표시되어야합니다.
  • 이러한 바이트가 저장되는 순서를 엔디안 유형 (큰 또는 작은)이라고합니다.
  • 스테레오 샘플은 각 채널마다 별도의 샘플이 필요합니다. 하나는 왼쪽이고 다른 하나는 오른쪽입니다

디지털 오디오를 저장하는 데 사용되는 다른 방법 :

  • PCM (pulse code modulated)은 오디오를 디지털 방식으로 저장하는 가장 일반적인 비 압축 방식입니다
  • 사용 된 데이터의 양을 줄이기 위해 많은 압축이 존재하며 일부는 무손실, 일부는 손실
  • WAV 파일은 압축되지 않으며 모노 또는 스테레오 일 수 있습니다 (인터리브 된 샘플)
  • MP3 파일은 압축되고 손실되며 심리 음향을 사용하여 매우 높은 데이터 압축률을 달성합니다.
  • 가장 낮은 비트 범위 (1 비트)도 사용법에 따라 유용 할 수 있습니다. 일반적으로 1 비트로 저장된 오디오를 재생하는 기프트 카드

디지털 영역에서 오디오에 익숙해지는 방법 :

  • 더 많은 일을하세요! 대담과 같은 프로그램을 다운로드하고 다른 샘플 속도와 비트 범위를 사용하여 다른 오디오 파일을 만듭니다.
  • 사인 / 삼각 / 정사각형 및 톱니 톤을 만들고 차이를 듣습니다.
  • 8 비트 10KHz 파일과 16 비트 44.1KHz 파일 (CD 품질)과 같은 형식의 차이점을 배우십시오.
  • 고역 통과 / 저역 통과 / 대역 통과 필터를 실험하고 차이점을 들어보십시오
  • 클리핑이 오디오 신호에 미치는 영향을 이해하려면 신호를 채도 한계 이상으로 푸시하십시오.
  • 소프트웨어에이 기능이있는 경우 신호에 봉투를 적용하십시오
  • 비 고조파 왜곡과 고조파 왜곡의 차이가 있습니다.
  • 스펙트로 그램 (FFT)을 사용하여 이러한 신호와 다른 신호에 익숙해 지도록하십시오.
  • 차이를 보려면 선형 플롯과 로그 플롯을 모두 사용하십시오.
  • 다운 샘플 및 업 샘플 신호 및 이것이 오디오에 어떤 영향을 미치는지 들으십시오
  • 다른 디더링 방법을 사용하고 (비트 범위를 변환 할 때) 차이점을 들으십시오

이것은 디지털로 표현 된 오디오가 무엇인지, 그리고 DSP를 시도하기 전에 어떤 차이가 나는지에 대한 감각을 희망적으로 줄 것입니다. 예를 들어 8 비트 신호 대 16 비트 신호를 입력했거나 변환에서 잘못된 계산 오류로 인해 샘플 속도가 손상되었음을 인식 할 수 있으면 FFT 분석에 문제가 있다는 것을 항상 쉽게 알 수 있습니다.


답변 해주셔서 감사합니다. 나는 이것들을 알고 있으며 지금 그것의 dsp 코딩 측면에 들어가기를 원합니다.
jarryd
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.