두 서수 변수 사이의 관계를 나타내는 적절한 그래프는 무엇입니까?
내가 생각할 수있는 몇 가지 옵션 :
- 임의의 지터가 추가 된 산점도는 서로 숨기는 지점을 중지합니다. 분명히 표준 그래픽-Minitab에서는이를 "개별 값 그림"이라고합니다. 내 의견으로는 데이터가 간격 스케일에서 온 것처럼 서수 레벨 사이의 일종의 선형 보간을 시각적으로 장려하므로 오도 될 수 있습니다.
- 산점도는 각 샘플링 단위에 대해 하나의 점을 그리는 것이 아니라 점의 크기 (면적)가 해당 레벨 조합의 빈도를 나타내도록 조정되었습니다. 나는 때때로 그러한 음모를 실제로 보았습니다. 그것들은 읽기 어려울 수 있지만 포인트는 규칙적으로 간격을 둔 격자에 놓여있어 데이터를 시각적으로 "간격"시키는 지터 스 캐터 플롯의 비판을 다소 극복합니다.
- 특히 변수 중 하나가 종속으로 처리되는 경우 독립 변수의 수준으로 그룹화 된 상자 그림이 표시됩니다. 종속 변수의 수준 수가 충분히 높지 않은 경우 (위스커가 없거나 매우 붕괴 된 사 분위수로 인해 "매우 평평"하지 않거나, 중앙값을 시각적으로 식별하는 것이 불가능한 악화 된 사 분위수) 경우 적어도 끔찍한 것처럼 보일 수 있지만, 서수 변수에 대한 관련 설명 통계.
- 주파수를 나타내는 열 맵이있는 값 표 또는 셀의 빈 격자. 시각적으로 다르지만 개념적으로 포인트 영역이 주파수를 나타내는 산점도와 유사합니다.
어떤 음모가 선호되는 다른 아이디어 나 생각이 있습니까? 특정 서수 대 좌표 그림이 표준으로 간주되는 연구 분야가 있습니까? (저는 유전체학에서 널리 퍼져있는 주파수 히트 맵을 기억하는 것 같지만 명목 대 명목에 대해서는 더 자주 의심됩니다.) 좋은 표준 참조 제안도 매우 환영받을 것입니다. 저는 Agresti에서 무언가를 추측하고 있습니다.
누군가 플롯으로 설명하고 싶다면 가짜 샘플 데이터에 대한 R 코드가 이어집니다.
"운동이 얼마나 중요합니까?" 1 = 전혀 중요하지 않음, 2 = 다소 중요하지 않음, 3 = 중요하지 않거나 중요하지 않음, 4 = 다소 중요 함, 5 = 매우 중요 함
"얼마나 정기적으로 10 분 이상 뛰나요?" 1 = 결코, 2 = 2 주일에 1 회 미만, 3 = 1 주 또는 2 주에 1 회, 4 = 주당 2 ~ 3 회, 주당 5 회 또는 4 회 이상.
"종종"을 종속 변수로 취급하고 "중요도"를 독립 변수로 취급하는 것이 당연한 경우, 도표가 둘을 구별하는 경우.
importance <- rep(1:5, times = c(30, 42, 75, 93, 60))
often <- c(rep(1:5, times = c(15, 07, 04, 03, 01)), #n=30, importance 1
rep(1:5, times = c(10, 14, 12, 03, 03)), #n=42, importance 2
rep(1:5, times = c(12, 23, 20, 13, 07)), #n=75, importance 3
rep(1:5, times = c(16, 14, 20, 30, 13)), #n=93, importance 4
rep(1:5, times = c(12, 06, 11, 17, 14))) #n=60, importance 5
running.df <- data.frame(importance, often)
cor.test(often, importance, method = "kendall") #positive concordance
plot(running.df) #currently useless
내가 찾은 연속 변수에 대한 관련 질문, 아마도 유용한 시작점 : 두 숫자 변수 사이의 관계를 연구 할 때 산점도의 대안은 무엇입니까?