답변:
이진 변수를 종속 변수로 사용하는 것과 비율을 종속 변수로 사용하는 것에는 차이가 있습니다.
이항 종속 변수 :
종속 변수로서의 비율 :
다른 그룹 내 응답이 0 또는 100 %에 얼마나 가까운 지에 따라 다릅니다. 극단적 인 값이 많으면 (즉, 0 또는 100 %에 쌓인 많은 값) 이것이 어려워집니다. "분모"를 모르는 경우 (예 : 백분율을 계산하는 주제의 수) 어쨌든 우발 사태 테이블 접근 방식을 사용할 수 없습니다. 그룹 내의 값이 더 합리적인 경우 응답 변수 (예 : 클래식 arcsine-square-root 또는 아마도 로짓 변환). 변환 된 데이터가 ANOVA의 가정을 적절히 충족시키는 지 (변형과 정규성의 균질성, 전자가 후자보다 더 중요 함)를 결정하기위한 다양한 그래픽 (선호) 및 귀무 가설 검정 (덜 선호) 접근법이 있습니다. 그래픽 테스트 : 상자 그림 (분산의 동질성) 및 QQ 그림 (정상) [후자는 그룹 내에서 또는 잔차에서 수행되어야 함]. 귀무 가설 검정 : 예 : Bartlett 또는 Fligner 검정 (균일 성 분산), Shapiro-Wilk, Jarque-Bera 등
응답 변수가 0/1 (연기, 연기가 아님)이되도록 원시 데이터가 있어야합니다. 그런 다음 이항 로지스틱 회귀를 사용할 수 있습니다. BMI를 간격으로 그룹화하는 것은 올바르지 않습니다. 컷 포인트가 정확하지 않거나 존재하지 않을 수 있으며 BMI가 흡연과 관련이 있는지 공식적으로 테스트하고 있지 않습니다. 현재 많은 정보가 삭제 된 BMI가 흡연과 관련이 있는지 테스트 중입니다. 특히 외부 BMI 간격이 상당히 이질적이라는 것을 알 수 있습니다.
비례 데이터에 대해 일반적인 분산 분석을 수행하기로 선택한 경우 동종 오차 분산의 가정을 확인하는 것이 중요합니다. (비율 데이터와 마찬가지로) 오차 분산이 일정하지 않은 경우보다 현실적인 대안은 모델에서이 이분산성을 설명 할 수있는 베타 회귀를 시도하는 것입니다. 다음은 백분율 또는 비율 인 응답 변수를 처리하는 다양한 대체 방법을 설명하는 논문입니다. http://www.ime.usp.br/~sferrari/beta.pdf
R을 사용하면 패키지 베타 레그 가 유용 할 수 있습니다.