답변:
DCT와 PCA의 주요 차이점 (보다 정확하게는 Karhunen Loeve Transform 이라고도하는 상관 행렬의 고유 벡터에 의해 형성된 기준으로 데이터 세트를 나타냄 )은 주어진 데이터 세트에 대해 PCA를 정의해야한다는 것입니다. DCT는 "절대"이며 입력 크기만으로 정의됩니다. 이것은 PCA를 "적응"변환으로 만드는 반면 DCT는 데이터 독립적입니다.
PCA가 적응성으로 인해 이미지 또는 오디오 압축에 더 자주 사용되지 않는 이유가 궁금 할 수 있습니다. 두 가지 이유가 있습니다.
데이터 세트의 PCA를 계산하고 계수를 인코딩하는 인코더를 상상해보십시오. 데이터 세트를 재구성하기 위해, 디코더는 계수 자체뿐만 아니라 변환 매트릭스 (데이터에 의존하며 액세스 할 수없는 데이터에 의존)도 필요하다. DCT 또는 다른 데이터 독립 변환은 입력 데이터의 통계적 종속성을 제거하는 데 덜 효율적일 수 있지만 변환 매트릭스는 전송하지 않아도 코더와 디코더 모두에 의해 미리 알려져 있습니다. 부수적 인 정보를 거의 요구하지 않는 "충분히 좋은"변환은 부가적인 부수적 인 정보를 필요로하는 최적의 변환보다 낫습니다
이 타일의 광도와 매트릭스. 이 데이터에 대한 PCA를 계산하고 추정 할 주요 구성 요소를 플로팅하십시오. 이것은 매우 깨달은 실험입니다! 가장 높은 순위의 고유 벡터가 실제로 DCT 기반의 변조 된 사인파 패턴처럼 보일 가능성이 매우 높습니다. 이것은 충분히 크고 일반적인 이미지 타일 세트의 경우 DCT가 고 유량에 대한 매우 근사치라는 것을 의미합니다. 많은 양의 오디오 녹음에서 추정되는 멜 간격 주파수 대역의 로그 신호 에너지에 대한 고유 기준이 DCT 기준에 가깝기 때문에 오디오에 대해서도 동일한 것이 확인되었습니다 (따라서 역 상관 변환으로 DCT 사용). MFCC를 계산할 때).