ZCA 미백과 일반 미백 (주요 구성 요소를 PCA 고유 값의 제곱근으로 나눔)에 대해 혼란 스럽습니다. 내가 아는 한,
ZCA 미백의 용도는 무엇입니까? 일반 미백과 ZCA 미백의 차이점은 무엇입니까?
ZCA 미백과 일반 미백 (주요 구성 요소를 PCA 고유 값의 제곱근으로 나눔)에 대해 혼란 스럽습니다. 내가 아는 한,
ZCA 미백의 용도는 무엇입니까? 일반 미백과 ZCA 미백의 차이점은 무엇입니까?
답변:
(중심) 데이터 를 열에 피처 (변수)와 행에 데이터 포인트를 갖는 matrix 에 저장하십시오. 공분산 행렬 이 열에 고유 벡터를 갖고 의 대각선에 고유 값을 갖도록하여 입니다.
그런 다음 "정상"PCA 미백 변환은 에 의해 제공됩니다. 주요 구성 요소 분석?
그러나이 미백 변형은 고유하지 않습니다. 실제로 미백 데이터는 회전 후에도 미백 상태를 유지합니다. 즉, 직교 행렬 이 있는 모든 도 미백 변환이됩니다. 소위 ZCA 미백에서는 받아 이 직교 행렬, 예로서 (공분산 행렬의 고유 벡터들을 함께 적층)
ZCA 변환 ( 종종 "마할 라 노비스 변환"이라고도 함) 의 정의 속성 중 하나 는 원본 데이터에 가능한 한 가까운 희게 된 데이터 (최소 제곱의 의미)를 초래한다는 것입니다. 즉, 를 최소화 하려면 이 희게되는 경우 . 다음은 2D 일러스트레이션입니다.
왼쪽 서브 플롯은 데이터와 그 주축을 보여줍니다. 분포의 오른쪽 상단 모서리에 어두운 음영이 나타납니다. 방향을 나타냅니다. 행은 두 번째 서브 플롯에 표시됩니다. 이들은 데이터가 투영되는 벡터입니다. 미백 후 (아래) 분포는 둥글게 보이지만 회전 된 것처럼 보입니다. 어두운 구석은 이제 북동쪽이 아니라 동쪽에 있습니다. 행은 세 번째 서브 플롯에 표시됩니다 (직교가 아님). (아래) 미백 후 분포는 둥근 모양 과 그것으로 원래 같은 방법으로 지향합니다. 물론, 로 회전하여 PCA 미백 데이터에서 ZCA 미백 데이터로 얻을 수 있습니다 .
"ZCA"라는 용어는 1996 년 Bell과 Sejnowski 에서 소개 된 것으로 보인다독립 성분 분석의 맥락에서 "제로 위상 성분 분석"을 나타냅니다. 자세한 내용은 거기를 참조하십시오. 아마도 이미지 처리의 맥락에서이 용어를 접했을 것입니다. 여러 자연 이미지 (피처로 픽셀, 각 데이터 포인트로 각 이미지)에 적용될 때 주축은 주파수가 증가하는 푸리에 구성 요소처럼 보입니다 (아래 그림 1의 첫 번째 열 참조). 그래서 그들은 매우 "글로벌"입니다. 반면에, ZCA 변환 행은 매우 "로컬"로 보입니다. 두 번째 열을 참조하십시오. ZCA는 데이터를 가능한 한 적게 변환하려고하기 때문에 각 행은 원래의 기본 함수 (활성 픽셀이 하나만있는 이미지)에 더 근접해야합니다. 그리고 이것이 가능합니다.
최신 정보
ZCA 필터 및 ZCA로 변환 된 이미지의 더 많은 예는 Krizhevsky, 2009, Tiny Images의 다중 레이어 피처 학습에 나와 있습니다 (@bayerj의 답변 (+1) 참조).
ZCA 미백이 언제 PCA보다 선호 될 수 있는지에 대한 아이디어를 제공한다고 생각합니다. 즉, ZCA 백색 화 이미지는 여전히 일반 이미지와 유사 하지만 PCA 백색 화 이미지는 일반 이미지와 유사 하지 않습니다. 이것은 주변 픽셀을 함께 처리하고 자연 이미지의 로컬 속성에 크게 의존하는 컨볼 루션 신경망 (예 : Krizhevsky 논문에서 사용) 과 같은 알고리즘에 중요합니다 . 대부분의 다른 기계 학습 알고리즘의 경우 데이터가 PCA 또는 ZCA로 희게되는지 여부는 절대적으로 관련이 없습니다 .
공분산 행렬의 고유 분해가 주어지면 여기서 은 고유 값의 대각선 행렬입니다 , 일반 미백은 데이터를 공분산 행렬이 대각선 인 공간으로 변환하는 것입니다. (일부 표기법 남용) 이는 에 따라 데이터를 변환하여 공분산을 대각선화할 수 있음을 의미
이것은 PCA의 일반적인 미백입니다. 이제 ZCA는 다른 작업을 수행합니다. 즉, 고유 값에 작은 엡실론을 추가하고 데이터를 다시 변환합니다. 다음은 ZCA 전후에 CIFAR 데이터 세트의 일부 그림입니다.
ZCA 이전 :
ZCA 후
ZCA 후
비전 데이터의 경우, 고주파 데이터는 일반적으로 낮은 고유 값으로 확장 된 공간에 상주합니다. 따라서 ZCA는 이러한 기능을 강화하여보다 가시적 인 가장자리 등을 생성하는 방법입니다.