여러 응답으로 설문 조사 질문을 처리하는 방법은 무엇입니까?


10

사람들에게 특정 장소 (예 : A, B, C, D)를 방문했는지 여부를 묻는 데이터 집합이 있으며 둘 이상의 선택을 할 수 있으며 코에서 표본을 채취하여 일부 감염 여부를 확인합니다. 질병.

특정 장소로 ​​이동하는 사람에 대한 감염의 상대적 위험을 찾아야합니다. 현재 로지스틱 회귀 만 생각할 수 있습니다. 다른 제안이 있습니까?

감사.

답변:


2

결과는 이분법 적이며 감염되거나 감염되지 않기 때문에 로지스틱 회귀를 계속 사용할 수 있습니다. 나는 단순히 더미 변수 접근법을 취하고 여행을 참조 카테고리로 사용하지 않을 것입니다 (즉, 각 장소에 대해 변수가 해당 장소를 방문하면 1로 코딩되고 해당 장소를 방문하지 않으면 0으로 코딩됩니다). 따라서 베타 계수를 승산으로 변환하면 (즉, 로그 확률을 지수화), 위치 A에 대한 더미 변수의 해석은 방문하지 않은 위치 A에 대한 방문 위치 A와 방문한 다른 장소를 제어하는 ​​확률입니다. 또한이 접근법에서는 다중 공선 성이 중요합니다 (예 : A로 여행하는 많은 사람들이 B로 여행하는 경우 각 계수를 편향시킬 수 있음).


5
이 모델은 응답이 각 장소로 이동하는 부가적인 기능이라고 가정합니다. 상호 작용 용어를 포함 시켜서 작동하도록 만들 수 있습니다. 양방향 상호 작용 외에 모든 가능한 모든 상호 작용이 필요할 수 있습니다. (이것은 수학적으로 대상의 가능한 각 조합에 대해 별도의 더미를 제공하는 것과 동일합니다.)
whuber

4
주요 효과 (4 개의 매개 변수)보다는 모든 상호 작용 (15 개의 매개 변수)을 사용하는 경우 많은 데이터를 확보하는 것이 좋습니다.
Stephan Kolassa

@ whuber와 @Stephen, 답변 주셔서 감사합니다, 그리고 나는 당신 각자에 완전히 동의합니다. 여러 반응이 그다지 흔하지 않은 경우 주요 효과 더미 변수 접근 방식을 개인적으로 사용하면 좋을 것입니다. 원래 포스터가 A 대 B로 여행 할 위험에 관심이 있다면 다른 디자인을 제안 할 것입니다 (예 : 일부 유형의 일치 절차). 그리고 일부 선택 바이어스가 발생하는 경우를 제외하고는 추가 위험이 의미가 없다는 데 동의합니다.
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.