선형 예측 코딩 (LPC)의 이론


9
  • LPC의 이론은 무엇입니까?
  • LPC의 특정 구현 이 다른 압축 음성 인코딩 체계보다 전송 또는 인코딩 오류 양자화에 더 관대하다고 말한 이유는 무엇 입니까?

  • 칼만 필터 방법의 사용과 유사하게 평활 또는 단기 "예측"에 LPC 방법을 사용할 수 있습니까?

  • 어떤 조건이나 제약 조건에서 LPC 사용이 유효합니까?

"왜 LPC가 다른 압축 음성 인코딩 방식보다 전송 또는 인코딩 오류에 더 관대하다고 말했습니까?" 누가 말했다? 나는 LPC를 잘 모르지만 중복성을 줄이는 것과 관련이 있다고 생각했는데, 이는 반대 효과를 줄 것입니다.
endolith

이 질문은 잘못된 전제에 따라 오도 됩니다. 이것을 닫고 수정하십시오.
Dipan Mehta

여기에는 여러 가지 질문과 구제가 있습니다. 수리가 필요하다고 생각되는 것은 무엇입니까?
hotpaw2

1
그 진술 Why are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?은 오히려 거짓이다. 다른 것보다 더 나은 것을 구체적으로 알려주는 참조를 인용 할 수 있습니까?
Dipan Mehta

1
그것은 실제로 내 질문입니다. 나는 어딘가에서 이것을 들었지만 이것이 왜 언급되었을 지 모른다.
hotpaw2

답변:


14

첫째, 선형 예측 코딩 (LPC)이 "전송 또는 인코딩 오류에 대해 더 관대 한"이라고 말하는 것은 전적으로 사실이 아닙니다. 계수가 전송되는 형식은 큰 차이를 만듭니다. 예를 들어, 선형 예측 계수가 해결되면, 고차 IIR 필터 계수와 매우 유사하게 양자화에 매우 민감 할 수 있습니다 (이는 합성 필터가 IIR이기 때문이지만 나중에는 그 이상입니다). 그러나 다른 형식으로 전송되면이 문제를 쉽게 완화 할 수 있습니다.

한 가지 방법은 반사 계수를 전달하는 것입니다. k 차 선형 예측 필터를 재귀 적으로 풀면 각 단계의 최고 차수를 반사 계수라고합니다. 이들은 시스템을 완전히 특성화하기 위해 함께 사용될 수 있습니다 (Levinson 재귀에서 쉽게 볼 수 있음). 실제로, 격자 필터를 형성하기 위해 이들 모두를 함께 사용할 수 있습니다. 이 필터는 낮은 비트 수에 훨씬 더 강력하므로 양자화가 중요한 경우에 종종 사용됩니다. 또한 이러한 반사 계수의 크기가 1로 제한되는 경우 필터를 사용하여 신호를 합성하는 데 LPC에 중요한 BIBO 안정적인 필터가 보장됩니다. 라인 스펙트럼 쌍과 같이 자주 사용되지만 다른 방법이 있습니다.

이제 첫 번째 질문을 해결하기 위해 LPC 이론은 성대 모델링을 중심으로 진행됩니다. 본질적으로, 우리는 어떤 구조의 튜브에 대한 입력으로서 공기 진동으로서 스피치를 모델링하고있다. 이 모델을 구체화하기 위해 훨씬 더 자세한 자료를 찾을 수 있습니다 (튜브 길이, 공기 강도, 구조 등). 이러한 리소스는 이러한 구조를 다양한 자극, 백색 잡음에 응답하는 IIR 필터와 직접 관련시킵니다.

따라서 선형 예측 계수를 풀 때 계수에서 생성 된 FIR 필터에 신호 (예 : 음성)를 입력하면 화이트 노이즈가 출력으로 발생하는 계수를 찾습니다. 이것이 무엇을 의미하는지 생각해보십시오. 우리는 높은 입력상관 된 신호, 및 백색 잡음 시퀀스를 출력하는 단계. 실제로, 우리는 그 신호의 모든 선형 의존성을 제거하고 있습니다. 이것을 보는 또 다른 방법은 모든 의미있는 정보가이 선형 의존성을 제거하는 계수에 포함되어 있다는 것입니다. 따라서 이러한 계수 (또는 위와 같은 일부 형식)를 전송할 수 있으며 수신단이 신호를 재생성 할 수 있습니다. 이는 선형 예측 FIR 필터를 반전시켜 IIR 필터를 생성하고 화이트 노이즈를 입력하여 수행됩니다. 압축은이 선형 의존성을 제거하고 계수를 전송함으로써 발생합니다. 이것이 선형 예측 필터에서 출력 노이즈의 "랜덤 성"또는 백색도를 최대화하기 위해 Burg 방법을 때때로 최대 엔트로피 방법이라고도하는 이유입니다. 이것을 보는 또 다른 방법은

마지막 질문에 대답하기 위해, 당신이 무엇을 전적으로 요구하는지 잘 모르겠습니다. LPC 또는 선형 예측 코딩은 전술 한 바와 같이 신호를 효율적으로 모델링 할 수 있다고 가정하여 신호를 "압축"하는 것을 의미한다. 앞서 언급했듯이 선형 예측을 사용하여 "단기 예측"을 수행 할 수 있습니다. 이것은 전력 스펙트럼 밀도 추정에 사용되는 고해상도 AR 방법의 묵시적 근거입니다. 자기 상관 시퀀스는 그것의 유한 형태로부터 제한된 데이터 레코드로부터 무한 창으로 재귀 적으로 확장 될 수 있으며, 비 윈도우 시퀀스의 이론적 자기 상관 시퀀스이다. 이것이 PSD 추정의 AR 방법이 사이드 로브 현상을 나타내지 않는 이유이기도합니다.


1
"LPC 이론은 성대 모델링과 관련이 있습니다"이것이 항상 사실입니까? FLAC는 음성뿐만 아니라 일반 오디오 파형에서도 LPC를 사용합니다.
endolith

3
저의 사과는 원래 성대와 유사한 물리적 모델로 보컬 코드를 통해 배웠습니다. 내가 말했듯이, 그들이 이것에 대해 훨씬 더 깊이 파고 드는 곳이 있습니다. 그러나 맞습니다. LPC는 일반 오디오 파형에 적합합니다. 내가 언급했듯이, 그것은 충동적인 스펙트럼에서 잘 작동합니다. 결론적으로, 스펙트럼이 덜 임펄스 인 잡음이있는 신호에서는 제대로 작동하지 않습니다 (이는 잡음이있는 신호가 ARMA 프로세스로 더 잘 모델링되기 때문입니다).
Bryan
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.