첫째, 서신 분석의 경우 소위 biplots 를 구성하는 다른 방법이 있습니다 . 모든 경우에 기본 아이디어는 행 셀과 열 셀 사이의 "거리"에 대한 최상의 2D 근사를 표시하는 방법을 찾는 것입니다. 다시 말해, 우연성 테이블의 행과 열 사이의 관계에 대한 계층 구조 (또한 "조정"이라고도 함)를 찾습니다.
χ2
corresp()
MASS
RtC=NN
i=1,…,Ij=1,…,Jfj|i=nij/ni⋅fi|j=nij/n⋅jIfi⋅Jf⋅jχ2ii′
d2χ2(i,i′)=∑j=1Jnn⋅j(nijni⋅−ni′jni′⋅)2
또한 와의 링크를 볼 수도 있습니다.χ2H0ni⋅×n⋅j/n(i,j)
행 프로파일에서 PCA를 인식하면 (개인으로 간주) 유클리드 거리를 대체χ2거리가 나면 CA를 얻습니다. 첫 번째 주축은 모든 점에 가장 가까운 선이며 해당 고유 값은이 치수로 설명되는 관성입니다. 열 프로필에서 동일한 작업을 수행 할 수 있습니다. 두 접근법 사이에 대칭이 있으며,보다 구체적으로 열 프로파일에 대한 주성분 (PC)이 행 프로파일에 대한 PC와 동일한 고유 값과 연관되어 있음을 알 수 있습니다. Biplot에 표시되는 것은이 새로운 좌표 시스템에서 개인의 좌표이지만 개인은 별도의 계승 공간으로 표시됩니다. 각 개인 / 양식이 요인 공간에 잘 표현되어 있다면 ( 볼 수 있습니다.cos2ijχ2chisq.test(tab)$expected-chisq.test(tab)$observed
χ2nϕ2
사실,에서 사용할 수있는 기능에 비해 강화 된 CA를 제공 할 수있는 몇 가지 패키지가 있습니다 MASS
: 패키지 ade4 , FactoMineR , anacor 및 CA는 .
최신은 특정 그림에 사용 된 것 중 하나이며 Journal of Statistical Software에 실린 논문은 대부분의 기능 : 2 차원 및 3 차원 그래픽이있는 R의 대응 분석 : ca 패키지를 설명 합니다.
따라서 눈 / 머리 색에 대한 예는 여러 가지 방법으로 재현 할 수 있습니다.
data(HairEyeColor)
tab <- apply(HairEyeColor, c(1, 2), sum) # aggregate on gender
tab
library(MASS)
plot(corresp(tab, nf=2))
corresp(tab, nf=2)
library(ca)
plot(ca(tab))
summary(ca(tab, nd=2))
library(FactoMineR)
CA(tab)
CA(tab, graph=FALSE)$eig # == summary(ca(tab))$scree[,"values"]
CA(tab, graph=FALSE)$row$contrib
library(ade4)
scatter(dudi.coa(tab, scannf=FALSE, nf=2))
모든 경우에 결과 biplot에서 읽은 것은 기본적으로 (대부분의 관성을 설명하는 첫 번째 축으로 해석을 제한합니다).
- 첫 번째 축은 밝은 머리카락과 검은 머리카락 사이, 그리고 파란 눈과 갈색 눈 사이의 명확한 반대를 강조합니다.
- 금발 머리를 가진 사람들은 파란 눈을 가진 경향이 있고 검은 머리를 가진 사람들은 갈색 눈을 가진 경향이 있습니다.
프랑스 리옹 의 생물 정보학 연구소 에 대한 데이터 분석에 대한 추가 자료가 많이 있습니다 . 이것은 주로 프랑스어로되어 있지만, 그렇게 큰 문제는 없을 것입니다. 다음 두 유인물은 첫 시작으로 재미 있어야합니다.
k