로지스틱 회귀 분석에서 범주의 영향과 해당 빈도를 시각화하는 가장 좋은 방법은 무엇입니까?


11

여론 조사 데이터를 사용하여 후보자 투표의 주요 예측 자에 대한 정보를 제시해야합니다. 관심있는 모든 변수를 사용하여 로지스틱 회귀 분석을 실행했지만이 정보를 제시하는 좋은 방법을 찾을 수 없습니다.

내 의뢰인은 효과의 크기 만 신경 쓰지 않고 효과의 크기와 그러한 속성을 가진 모집단의 크기 사이의 상호 작용에 대해서는 신경 쓰지 않습니다.

그래프에서 어떻게 처리 할 수 ​​있습니까? 어떤 제안?

예를 들면 다음과 같습니다.

종속 변수가 Vote / Not not of variable 일 때 변수 SEX (Male = 1) 의 는 2.3이며, 이는 승산 비 또는 확률로 지수화되고 처리 된 후 큰 숫자입니다. 그러나이 설문 조사에 참여한 사회는 남성이 30 %에 불과했습니다. 따라서 비록 인간이이 후보를 상당히지지했지만 그들의 수는 대수 선거에서 이길 수있는 후보자에게는 중요하지 않다.β


FWIW에서 "상호 작용"이라는 용어의 사용이 올바르지 않습니다 (예 : here 또는 here 참조 ). 나는 '...하지만 효과 크기가 크고 그러한 속성을 가진 모집단의 크기도 큰 상황을 식별하는 것에 대해'라고 말할 것입니다.
gung-복직 모니카

답변:


10

나는 예제가 이상하다는 것을 @PeterFlom에 동의하지만 따로 ​​설정하면 설명 변수가 범주 형임을 알 수 있습니다. 그것이 사실이라면, 이것을 크게 단순화시킵니다. 모자이크 플롯 을 사용 하여 이러한 효과를 나타냅니다. 모자이크 플롯은 조건부 비율을 세로로 표시하지만 각 범주의 너비는 샘플의 한계 (즉, 무조건) 비율을 기준으로 조정됩니다.

다음은 R을 사용하여 생성 된 타이타닉 재해의 데이터가있는 예입니다.

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

여기에 이미지 설명을 입력하십시오

왼쪽에서, 우리는 여성이 생존 할 가능성이 훨씬 높지만 남성이 탑승 한 사람의 약 80 %를 차지한 것으로 나타났습니다. 따라서 남성 생존자 비율이 증가하면 여성 생존자 비율이 크게 증가하는 것보다 더 많은 생명을 구할 수 있었을 것입니다. 이것은 귀하의 예와 다소 유사합니다. 오른쪽에는 승무원과 조종사가 가장 많은 사람들을 구성했지만 생존 가능성이 가장 낮은 다른 예가 있습니다. (가치가있는 것은 클래스와 섹스가 타이타닉과 무관했기 때문에이 데이터에 대한 완전한 분석은 아니지만이 질문에 대한 아이디어를 설명하기에 충분합니다.)


5

나는 사회에 10 %의 남성 만있는 것에 대해 조금 궁금합니다.

당신이 할 수있는 한 가지는 승산 비를 플로팅하고 샘플 크기로 각각 레이블을 지정하는 것입니다.

두 변수를 모두 그래픽으로 나타내려면 y 축의 각 거품 위치가 승산 비 크기와 거품 크기와 일치하여 거품 크기를 거품 형 차트로 만들 수 있습니다.


7
어쩌면 하나.
Andre Silva
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.