PCA의 목표는 차원을 줄이는 것입니다
이것은 사람들이 종종 가정하는 것이지만 실제로 PCA는 데이터를 직교 적으로 표현한 것입니다. 이 기준은 여전히 원래 데이터와 차원이 동일합니다. 아무것도 잃어버린 ... 아직. 차원 축소 부분은 전적으로 귀하에게 달려 있습니다. PCA가 보장하는 것은 최고입니다k새 투영의 크기가 최고입니다 k데이터가 표시 될 수있는 측정 기준 가장 좋은 것은 무엇입니까? 그것이 설명 된 차이가 나오는 곳입니다.
이 경우에는 분명히 아닙니다
나는 그것에 대해 확신하지 않을 것입니다! 두 번째 줄거리에서 시각적으로 데이터의 많은 정보를 수평선에 투영 할 수있는 것처럼 보입니다. 그것은 2 차원으로 된 원래의 플롯 대신에 1 차원입니다! 분명히 Y 축을 제거하기 때문에 일부 정보가 손실되지만이 정보 손실이 허용되는지 여부는 전화입니다.
이 사이트에 PCA가 무엇인지와 관련된 수많은 질문이 있으므로 여기 , 여기 , 여기 또는 여기에서 확인하십시오 . 그 후에 다른 질문이 있으시면 게시 해 주시면 기꺼이 도와 드리겠습니다.
실제 질문으로 :
PCA 플롯에서 온도와 아이스크림에 대해 이야기 할 수있는 이야기는 무엇입니까?
새로운 좌표축은 원래 좌표의 선형 조합이므로 기본적으로 아무것도 아닙니다! PCA는 다음과 같은 답변을 제공합니다.
PC1PC2=2.5×ice cream−3.6×temperature=−1.5×ice cream+0.6×temperature
그게 당신에게 유용한가요? 아마도. 그러나 나는 추측하지 않을 것이다 :)
편집
대화 형 차트가 멋지므로 도움이 될만한 이 리소스를 추가 하겠습니다 .
다시 편집
가장 좋은 것을 명확히하기 위해 k 방법:
PCA는 데이터가 투영 될 때 가장 큰 차이를 산출하는 차원을 찾으려고합니다. 데이터가 있다고 가정n>k 치수, 최초 k PC는 다른 어떤 것보다 더 많은 데이터 차이를 설명합니다 k차원 할 수 있습니다. 그게 내가 의미하는 바야 k. 그것이 당신에게 유용한 지 아닌지는 또 다른 것입니다.