일반 FFT 크기 스펙트럼 대신 PSD를 언제 계산해야합니까?


12

44.1 kHz로 샘플링 된 32 초의 음성 신호가 있습니다. 이제 연설의 주파수를 보여 드리고자합니다. 그러나 최선의 방법은 무엇인지 잘 모르겠습니다. 때로는 푸리에 변환의 절대 값과 때로는 파워 스펙트럼 밀도를 계산하는 것 같습니다. 올바르게 이해하면 후자가 작동하여 신호를 부분으로 나누고 FFT를 부분별로 수행하고 어떻게 든 합산합니다. 창 기능은 어떻게 든 관련되어 있습니다. 이 부분을 좀 분명히 해줄 수 있습니까? 저는 DSP를 처음 사용합니다.


1
신호를 세그먼트로 나누고 각각의 스펙트럼을 찾은 다음 스펙트럼을 평균하면 노이즈를 줄이는 데 도움이되지만 해상도도 줄어 듭니다. en.wikipedia.org/wiki/Welch%27s_method
endolith

답변:


8

이제 연설의 주파수를 보여 드리고자합니다. 그러나 최선의 방법은 무엇인지 잘 모르겠습니다. 때로는 푸리에 변환의 절대 값과 때로는 파워 스펙트럼 밀도를 계산하는 것 같습니다.

분석에 물리적 의미를 부여하려면 전력 스펙트럼 밀도 (PSD)를 사용하십시오. 이것은 각 주파수 대역에서 단순히 신호의 전력을 제공하기 때문입니다. 반면에 물리적 의미를 원하지는 않지만 각 대역의 푸리에 진폭이 서로 어떻게 다른지 알고 싶다면 절대 크기를 유지할 수 있습니다.

x[n]엑스(에프)|엑스(에프)||엑스(에프)|2

올바르게 이해하면 후자가 작동하여 신호를 부분으로 나누고 FFT를 부분별로 수행하고 어떻게 든 합산합니다. 창 기능은 어떻게 든 관련되어 있습니다. 이 부분을 좀 분명히 해줄 수 있습니까? 저는 DSP를 처음 사용합니다.

아니요, 사실이 아닙니다. 여기서 말하는 것은 STFT ( Short Time Fourier Transform )입니다. 이것은 단순히 시간 도메인 신호를 잘라내어 미미하게 한 다음 푸리에 형태를 취하는 것입니다. 그러나 마지막 날에는 여전히 복잡한 행렬이 있습니다. 절대 크기를 선택하면 절대 크기 푸리에 변환 행렬이 생깁니다. 절대 크기 제곱을 취하면 전력 스펙트럼 밀도 행렬이 생깁니다.


3

음성 신호와 같은 것에 대해 이해해야 할 중요한 것은 주파수 성분이 시간에 따라 변한다는 것 입니다. 주파수 영역에서 음성을 표현하기 위해 일반적으로 음성의 스펙트럼이 크게 변하지 않는다고 가정 할 수 있는 짧은 신호 (일반적으로 10ms)을 취합니다. 따라서 STFT (종종 창 사이에 일부 겹침)를 사용하여 각 연속 10ms 창에 대한 전력 스펙트럼을 계산하고 각 연속 스펙트럼을 특정 시간에 음성 주파수 구성 요소의 "스냅 샷"으로 처리합니다. 종종 연속 스펙트럼은 스펙트로 그램 과 같은 3D 플롯으로 그려집니다., X 축에 시간, Y 축에 주파수 및 각 X, Y 위치에서 가색 또는 회색조 강도로 표시된 크기와 함께.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.