누적 막 대형 차트는 일반적으로 비 통계 전문가가 잘 이해하는 경우 일반적으로 잘 이해됩니다. 서수 항목 (예 : 리 커트) 인 경우 각 범주에 대해 점진적인 색상으로 공통 메트릭 (예 : 0-100 %)으로 스케일링하는 것이 유용합니다. 항목이 너무 많지 않고 응답 범주가 3-5 개 이하인 경우 닷 차트 (클리블랜드 도트 그림)를 선호합니다 . 그러나 실제로 시각적 선명도의 문제입니다. 나는 일반적으로 표준화 된 측정 값 인 %를 제공하고 스택되지 않은 막대 차트로 %와 개수 만보고합니다. 다음은 내가 의미하는 바의 예입니다.
data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)",
sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)
더 나은 렌더링을 달성 할 수있다 lattice
나 ggplot2
. 이 특정 예에서 모든 항목의 응답 범주는 동일하지만보다 일반적인 경우에는 다른 항목을 기대할 수 있으므로 여기에서와 같이 모든 항목을 표시하는 것이 중복 된 것으로 보이지는 않습니다. 그러나 읽기를 용이하게하기 위해 각 응답 범주에 동일한 색상을 부여 할 수 있습니다.
그러나 모든 항목이 동일한 응답 범주를 갖는 경우 누적 막 대형 차트가 더 우수하다고 말하고 있습니다. 항목마다 하나의 응답 양식 빈도를 이해하는 데 도움이됩니다.
또한 일종의 히트 맵을 생각할 수 있는데, 반응 범주가 비슷한 항목이 많은 경우에 유용합니다.
누락 된 응답 (특히 무시할 수 없거나 특정 항목 / 질문에 현지화 된 경우)이 각 항목에 대해 이상적으로보고되어야합니다. 일반적으로 각 카테고리에 대한 응답 비율은 NA없이 계산됩니다. 이것은 일반적으로 설문 조사 또는 심리 측정에서 수행되는 것입니다 (우리는 "표현되거나 관찰 된 응답"에 대해 말합니다).
PS
I는 아래의 그림과 같이 더 멋진 것들을 생각할 수 (첫 번째는 손, 두 번째는 출신에 의해 만들어진 ggplot2
, ggfluctuation(as.table(tab))
),하지만 난 표면 변화가 어렵 기 때문에이 dotplot 또는 막대 그래프 등의 정확한 정보로 전달 생각하지 않는다 고맙습니다.