설문 조사에서 다른 질문에 대한 답변 사이의 상관 관계를 찾고 있습니다 ( "음, 11 번 질문에 대한 답변이 78 번 질문에 대한 답변과 관련이 있는지 살펴 보겠습니다"). 모든 답변은 범주 형 (대부분 "매우 불행"에서 "매우 행복"까지)이지만 일부 답변에는 다른 답변이 있습니다. 대부분은 서수로 간주 될 수 있으므로이 경우를 고려해 보겠습니다.
상용 통계 프로그램에 액세스 할 수 없으므로 R을 사용해야합니다.
나는 시도 래틀 (매우 멋진 R위한 프리웨어 데이터 마이닝 패키지를,)하지만 불행히도 그것은 범주 데이터를 지원하지 않습니다. 내가 사용할 수있는 한 가지 해킹은 R에서 "매우 불행"... "행복"대신 숫자 (1..5)가있는 설문 조사의 코딩 된 버전을 가져 와서 Rattle이 숫자 데이터라고 믿게하는 것입니다.
나는 산점도를하고 점 크기가 각 쌍의 수에 비례하도록 생각하고있었습니다. 인터넷 검색 후 http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-order-categorical-data/를 발견 했지만 매우 복잡해 보입니다.
나는 통계 학자 (그러나 프로그래머)는 아니지만 문제에 대해 약간의 독서를했으며 올바르게 이해한다면 Spearman의 rho 가 여기에 적합 할 것입니다.
그래서 서두르는 사람들을위한 짧은 질문 버전 : R에 Spearman의 rho를 빠르게 그릴 수있는 방법이 있습니까? 눈에 띄기 쉽고 재료에 포함될 수 있기 때문에 플롯은 숫자 매트릭스보다 선호됩니다.
미리 감사드립니다.
추신 : 나는 이것을 SO 사이트 또는 여기에 게시할지 여부를 잠시 고민했다. 두 사이트에서 R 상관 관계를 검색 한 후이 사이트가 질문에 더 적합하다고 생각했습니다.