독립 성분 분석과 요인 분석의 관계는 무엇입니까?


67

저는 ICA (Independent Component Analysis)를 처음 사용했으며이 방법에 대한 기본적인 이해를했습니다. ICA는 한 가지 예외를 제외하고는 요인 분석 (FA)과 유사합니다. ICA는 관측 된 랜덤 변수가 비가 우스 독립 성분 / 인자의 선형 조합 인 것으로 가정하지만 고전적인 FA 모델은 관측 된 랜덤 변수를 가정합니다. 상관 된 가우스 성분 / 인자의 선형 조합입니다.

위의 내용이 정확합니까?


1
다른 질문 ( PCA는 반복적으로 가장 큰 분산의 방향을 찾지 만 가장 큰 분산으로 전체 부분 공간을 찾는 방법무엇입니까? )에 대한 이 대답 은 가치가 있습니다.
Piotr Migdal 13

답변:


72

여기에 이미지 설명을 입력하십시오

FA, PCA 및 ICA는 모두 '관련 적'이며, 3 개 모두 데이터가 투영되는 기준 벡터를 찾는만큼 삽입 기준을 최대화합니다. 기본 벡터를 선형 조합을 캡슐화하는 것으로 생각하십시오.

예를 들어, 데이터 행렬 는 x 행렬, 즉 두 개의 임의 변수 가 있고 각각 관측치가 있다고 가정합니다. 그런 다음 의 기본 벡터를 찾았다 고 가정 . (첫 번째) 신호를 추출하면 (벡터 ) 다음과 같이 수행됩니다. 2 N N w = [ 0.1 - 4 ] YZ2NNw=[0.14]y

y=wTZ

이것은 단지 "데이터의 첫 번째 행에 0.1을 곱하고 데이터의 두 번째 행을 4 배 빼는 것"을 의미합니다. 그런 다음 제공합니다. 물론 여기에서 삽입 기준을 최대화 한 속성을 갖는 x 벡터입니다. 1 Ny1N

그렇다면 그 기준은 무엇입니까?

2 차 기준 :

PCA에서 데이터의 분산을 '가장 잘 설명하는'기본 벡터를 찾고 있습니다. 첫 번째 (즉, 최고 순위) 기본 벡터는 데이터의 모든 분산에 가장 적합한 것입니다. 두 번째 규칙도이 기준을 갖지만 첫 번째 규칙과 직교해야합니다. PCA에 대한 기본 벡터는 데이터 공분산 행렬의 고유 벡터에 불과합니다.

FA에서는 FA가 생성되는 반면 PCA는 그렇지 않기 때문에 FA와 PCA간에 차이가 있습니다. 나는 '잡음'을 '특정 요인'이라고 부르는 '소음이있는 PCA'로 FA가 묘사되는 것을 보았습니다. 마찬가지로 PCA와 FA는 2 차 통계 (공분산)를 기반으로하며 위의 것은 없다는 결론을 내립니다.

더 높은 주문 기준 :

ICA에서 기본 벡터를 다시 찾고 있지만 이번에는 결과를 제공하는 기본 벡터를 원하므로이 결과 벡터가 원래 데이터 의 독립 구성 요소 중 하나가 됩니다. 정규화 된 첨도의 절대 값 (4 차 통계량)을 최대화하여이를 수행 할 수 있습니다. 즉, 데이터를 기본 벡터로 투영하고 결과의 첨도를 측정합니다. 기본 벡터를 약간 변경 한 다음 (보통 기울기 상승을 통해) 첨도 등을 다시 측정합니다. 결국 기본 벡터에 도달하여 가장 높은 첨도를 갖는 결과를 얻습니다. 구성 요소.

위의 다이어그램은 시각화에 도움이 될 수 있습니다. PCA 벡터가 분산이 최대화 된 방향을 찾으려고하면서 ICA 벡터가 서로간에 독립적으로 데이터 축에 어떻게 대응하는지 명확하게 확인할 수 있습니다. (결과물과 비슷 함).

상단 다이어그램에서 PCA 벡터가 ICA 벡터와 거의 일치하는 것처럼 보이는 경우 이는 우연의 일치입니다. 다음은 다른 데이터와 믹싱 매트릭스가 매우 다른 다른 예입니다. ;-)

여기에 이미지 설명을 입력하십시오


2
두 방법 모두에 익숙한 것 같습니다. 유능한 사람으로서 이러한 방법이 기본 벡터가 직교 함을 암시하는 경우 대답 할 수 있습니까? 서로 45도 각도로 배향 된 2 점 구름과 같이 서로 0이 아닌 투영을 갖는 1 차 또는 독립 구성 요소를 어떻게 발견 할 수 있습니까?
mbaitoff

2
@mbaitoff ICA는 직교 기준 벡터 집합을 복구합니다. 두 번째로, 요청한대로 서로에 대해 0이 아닌 투사를 갖는 두 개의 신호가 바로 ICA가 실행 취소하려는 것입니다. ICA에서 찾은 최종 기본 벡터가 서로 직교하는 이유입니다. 그런 다음 새로운 두 벡터에 데이터를 투영하면 서로 직교하게됩니다.
Spacey

1
@Tarantula 나는 내가 말하는 것에 대해 질문했다 : stats.stackexchange.com/questions/6575/… , 당신은 그림 i.stack.imgur.com/U6fWb.png를 볼 수 있습니다 . 나는 직교 기저가 그 두 구름을 어떻게 묘사하는지 이해할 수 없습니다. 주요 진동 방향을 나타내는 두 개의 벡터가 직교하지 않다는 것은 분명합니다.
mbaitoff

@mbaitoff 두 개의 센서에서 데이터를 가져 와서 서로에 대해 플로팅하고이 두 가지 모드가 표시되므로 적어도 서로 관련되어 있음을 알 수 있습니다. 그렇다면 문제는 당신이 어떻게 당신이 가지고있는 모든 지점을 독립적으로 만들 수 있는가? (즉, ICA가 찾은 것과 같은 직교 기반). 그것이 ICA가 당신을 위해 찾은 것입니다. "직교적인 기초가 그 두 구름을 어떻게 묘사하는지 이해할 수 없습니다."라고 말할 때의 의미를 이해하지 못합니다. 왜 안돼?
Spacey

@Tarantula 오, 이제 그게 무슨 뜻인지 알겠습니다! 나는 그것이 '원래 플롯에 두 개의 직교 벡터를 찾는 것'과 같다고 생각했지만 실제로는 '원래 플롯에 두 개의 벡터를 투영하여 그것들을 직교 (독립적)으로 만들 것'을 의미합니다.
mbaitoff

31

좀 빠지는. 요인 분석은 두 번째 순간에 작동하며, 데이터가 가우시안 (Gaussian)이어서 가능성 비와 그와 같은 것들이 비정규성에 영향을받지 않기를 바랍니다. 반면에 ICA는 CLT로 인해 항목을 추가 할 때 정상적인 무언가를 얻고 데이터가 비정규 적이므로 비정규 구성 요소를 추출 할 수 있다는 아이디어에 동기를 부여합니다. 그들. 비정규 성을 활용하기 위해 ICA는 입력의 선형 조합의 네 번째 순간을 최대화하려고 시도합니다.

maxa:a=11ni[a(xix¯)]4

ICA를 PCA와 비교하면 표준화 된 입력 조합의 두 번째 모멘트 (분산)를 최대화합니다.


멋지고 바삭한 대답
Subhash C. Davar

네 번째 순간은 무엇입니까? PL. EXPLAIN.
Subhash C. Davar

@ subhashc.davar 4 번째 모멘트는 첨도입니다. 즉, 데이터가 정규 분포보다 무겁거나 가벼운 꼬리입니다. en.wikipedia.org/wiki/Kurtosis
javadba
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.