이 용어는 다변량 통계에 관한 일부 책에 나타납니다. 정량적 특징 데이터 매트릭스에 n
의해 개인이 있다고 가정하십시오 p
. 그런 다음 축이 피처 인 공간에서 개인을 점으로 플롯 할 수 있습니다. 그것은 가변적 인 공간 플롯으로 알려진 고전적인 산점도 입니다. 우리는 개인의 구름이 축 특징에 의해 정의 된 공간에 걸쳐 있다고 말합니다 .
점이 변수이고 축이 개인 인 산점도를 생각할 수도 있습니다. 이전과 마찬가지로 절대적으로 이빨 만 튼튼합니다. 그것은 대상 공간 플롯 (또는 관측 공간 플롯)이 될 수 있으며 변수를 포함하는 변수는 그것을 정의합니다.
n>p
두 번째 경우에는 (종종) p
치수의 일부 치수 만 n
중복되지 않습니다. 당신이하고 그릴 수 있습니다 것을 의미 p
에 변수 포인트를 p
차원 플롯 . 또한 전통적으로 변수 점은 일반적으로 원점과 연결되어 벡터 (화살표)로 나타납니다. 주제 공간 표현을 주로 사용하여 변수 간의 관계를 표시하므로 편의를 위해 좌표축 주제를 삭제하고 점을 화살표로 표시합니다.1
피험자 공간 플롯을 그리기 전에 피처 (데이터 행렬의 열)가 중심에 놓인 경우 가변 벡터 사이의 각도 코사인은 Pearson 상관과 같지만 벡터 길이는 변수의 표준 (루트 제곱의 합)과 같습니다 ) 또는 표준 편차 ( df 로 나눈 경우 ).
가변 공간과 주제 공간은 같은 동전의 양면이며, 동일한 유클리드 분석 공간이며 서로 거울처럼 보입니다. 이들은 0이 아닌 고유 값 및 고유 벡터와 같은 동일한 속성을 공유합니다. 그러므로 피험자와 변수를 나란히 해당 분석 공간의 주축 공간 (또는 다른 직교 기준) 공간의 점으로 나눌 수 있습니다. 이 조인트 플롯을 biplot 이라고 합니다 . "데이터 공간"이라는 용어의 의미가 무엇인지 정확히 알지 못합니다. 특정 의미가있는 경우 주제 공간과 가변 공간이 공통적으로 존재하는 분석 공간이라고 가정합니다.
일부 로컬 링크 :
1n=5
개인과 p=2
변수가 있고 어떻게 5 차원 공간에서 2 점을 그리도록 마술처럼 관리 했다고 상상해보십시오 . 그런 다음 2 개 점을 포함하는 방식으로 2 개 축으로 정의 된 부분 공간을 회전 할 수 있습니다 (따라서 지금부터 그 평면에 걸쳐 있음). 그 후에는 다른 3 축 (치수)이 불필요 해지기 때문에 안전하게 떨어 뜨립니다. 서로에 대한 2 개의 가변 점의 위치는 유지되었다.