나는 예제가 이상하다는 것을 @PeterFlom에 동의하지만 따로 설정하면 설명 변수가 범주 형임을 알 수 있습니다. 그것이 사실이라면, 이것을 크게 단순화시킵니다. 모자이크 플롯 을 사용 하여 이러한 효과를 나타냅니다. 모자이크 플롯은 조건부 비율을 세로로 표시하지만 각 범주의 너비는 샘플의 한계 (즉, 무조건) 비율을 기준으로 조정됩니다.
다음은 R을 사용하여 생성 된 타이타닉 재해의 데이터가있는 예입니다.
data(Titanic)
sex.table = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
# Sex
# Survived Male Female
# No 0.788 0.268
# Yes 0.212 0.732
round(prop.table(t(class.table), margin=2), digits=3)
# Class
# Survived 1st 2nd 3rd Crew
# No 0.375 0.586 0.748 0.760
# Yes 0.625 0.414 0.252 0.240
windows(height=3, width=6)
par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
mosaicplot(sex.table, main="")
mosaicplot(class.table, main="")
왼쪽에서, 우리는 여성이 생존 할 가능성이 훨씬 높지만 남성이 탑승 한 사람의 약 80 %를 차지한 것으로 나타났습니다. 따라서 남성 생존자 비율이 증가하면 여성 생존자 비율이 크게 증가하는 것보다 더 많은 생명을 구할 수 있었을 것입니다. 이것은 귀하의 예와 다소 유사합니다. 오른쪽에는 승무원과 조종사가 가장 많은 사람들을 구성했지만 생존 가능성이 가장 낮은 다른 예가 있습니다. (가치가있는 것은 클래스와 섹스가 타이타닉과 무관했기 때문에이 데이터에 대한 완전한 분석은 아니지만이 질문에 대한 아이디어를 설명하기에 충분합니다.)