회귀 분석의 비율, 즉 Kronmal에 대한 질문


14

최근 무작위로 탐색하는 질문으로 인해 몇 년 전에 회귀 모형의 비율 사용에 대해 경고하면서 교수 중 한 명이 직접 의견을 떠올리게되었습니다. 그래서 나는 이것에 대해 읽기 시작하여 결국 Kronmal 1993로 이어졌습니다.

나는 이것을 모델링하는 방법에 대한 그의 제안을 올바르게 해석하고 있는지 확인하고 싶습니다.

  1. : 종속 독립 측에서도 같은 분모 비율로 모델 용
    Z1Y=Z11nβ0+Z1XβX+βZ+Z1ϵ

    • 다른 비율 외에 (역) 분모 변수에 대한 회귀 종속 비율
    • (역) 분모 변수에 의한 가중치
  2. 종속 변수가 비율 인 모형의 경우 :
    Y=β0+βXX+Z1nα0+ZXαX+Z1ϵ

    • 원래 변수, 분모 및 분모에 원래 변수를 곱한 회귀 분자 [범주 형 변수는 어떻습니까?]
    • (역) 분모 별 가중치
  3. 전용 독립 변수의 비율이 모델 : Y=β0+XβX+Z11nβZ1+WβW+Z1WβZ1W+ϵ

    • 주 효과로 분자와 역 분모를 포함하고 상호 작용 항으로 비율을 포함합니다.

여기 내 해석이 정확합니까?

답변:


1

당신은 실제로 Kronmal 논문 과 연결되어 있어야합니다. (그리고 논문 에서 직접 가져온 표기법을 설명했습니다.) 당신의 논문 읽기는 너무 문자 그대로입니다. 특히, 그는 가중치 부여에 대한 조언을하지 않으며, 가중치 부여는 일반적인 방법으로 수행 될 수 있으므로 논의 할 필요가 없습니다. 가능성으로 만 언급됩니다. 특히 상황을 분석하는 방법의 예로 사례와 같은 사례를 더 읽으십시오.

섹션 6에서 그는 몇 가지 일반적인 조언을 제공합니다.

이 논문의 메시지는 비율 변수는 비율을 구성하는 변수가 포함되고 절편 항도 존재하는 완전 선형 모형의 맥락에서만 사용해야한다는 것입니다. 회귀 분석에서 종속 변수 또는 독립 변수에 비율을 사용하는 일반적인 관행은 오도를 유발하는 추론으로 이어질 수 있으며 거의 ​​이득을 얻지 않습니다. 그러나 이러한 관행은 널리 퍼져 있고 견고하며 일부 연구자들에게 가장 소중한 비율이나 지수를 포기해야한다고 설득하기가 어려울 수 있습니다.

이 논문은 출생과 황새에 대한 Neyman의 가상의 예를 사용합니다. 이 예제를 사용하려면 R을 통해 액세스 할 수 있습니다.

data(stork, package="TeachingDemos")

나는 독자들에게 재미를 남길 것이지만 한 가지 흥미로운 음모는 다음과 coplot같습니다.

Neyman 황새 예의 컨디셔닝 플롯

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.