원시 데이터를 표준 편차로 나누는 이유에 대한 다음과 같은 정당성을 읽었습니다 (cs229 코스 노트에서).
설명이 말하는 것을 이해하더라도 표준 편차로 나누는 것이 왜 그러한 목표를 달성 할 수 있는지는 분명하지 않습니다. 그것은 모두가 같은 "규모"에 더 가깝도록 말합니다. 그러나 왜 표준 편차로 나누는 것이 그렇게되는지 완전히 명확하지는 않습니다 . 분산으로 나눌 때 무엇이 잘못 되었습니까? 왜 다른 수량? 절대 값의 합처럼? 또는 다른 표준 ... STD를 선택하기위한 수학적 근거가 있습니까?
이 추출의 주장은 수학 (및 / 또는 통계)을 통해 도출 / 증명 될 수있는 이론적 진술입니까, 아니면 그것이 "연습"에서 작동하는 것처럼 보이기 때문에 우리가하는 그러한 진술 중 하나입니까?
기본적으로 왜 직관이 사실인지에 대한 엄격한 수학적 설명을 제공 할 수 있습니까? 또는 단지 경험적 관찰이라면 PCA를 수행하기 전에 일반적으로 효과가 있다고 생각하는 이유는 무엇입니까?
또한 PCA와 관련하여 표준화 또는 표준화 프로세스입니까?
STD가 왜 "설명"될 수있는 다른 생각들 :
PCA는 분산을 최대화하여 얻을 수 있기 때문에 STD와 같은 관련 수량으로 나누는 것이 STD로 나눈 이유 중 하나 일 수 있습니다. 그러나 다른 표준과의 "변이"를 정의하면 이면 우리는 표준의 STD로 나눕니다 (pth 근을 취함으로써). 그러나 그것은 단지 추측 일 뿐이며 나는 이것에 대해 100 %가 아니므로 질문입니다. 누군가 이것과 관련된 것을 알고 있는지 궁금합니다.
관련 질문이 있음을 알았습니다.
그러나 "상관성"또는 "공분산"을 사용할시기에 대해 더 많이 이야기하는 것처럼 보였지만 엄격하거나 설득력이 있거나 자세한 정당화가 부족했습니다.
동일 :
관련 :