비율 인 종속 변수를 사용한 선형 회귀


10

종속 변수가 0.01에서 100 사이의 비율 인 선형 회귀를하고 있습니다.

종속 변수의 로그와 회귀 분석을해도 괜찮습니까? 나는 연구 결과와 일치하고 그것이 그들이 한 일입니다.

로그를 사용하는 것과 비율을 그대로 사용하는 것의 차이점은 무엇입니까?


주택 가격의 평가를 찾고 있습니다. 내 독립 변수는 주택 가격을 판매 가격으로 나눈 것입니다. 나의 종속 변수는 여러 인종 범주 (백분율, 백인, 히스패닉 및 아시아 인)와 가계 수입의 중간입니다. 흑인의 비율이 높은 인구 조사 지역은 다른 지역보다 판매 가격 비율이 더 높은 것으로 나타났습니다.
Aaron Kreider 20

로지스틱 회귀를 사용하지 않는 이유는 무엇입니까? 종속 변수가 많은 통계 패키지이므로 비율을 정의 할 수 있습니다.
statnoobie1

1
로지스틱 회귀는 일반적으로 이진 값 또는 비율 (0과 1 사이)에 대한 것입니다. 비율이 1을 초과 할 수 있으므로 여기서는 적용 할 수 없습니다.
Max Ghenis

답변:


9

비율의 로그를 취할 때 그 값이 무엇인지 명심하십시오. 이 값을 종속 변수로 사용하는 것이 문제에 적합합니까?영형()=영형()영형()

이제 원시 비율을 사용하는 데 문제가 될 있습니다. Kronmal 1993 은 비율이 종속 변수 인 의 회귀가 라는 주장을합니다.
와이=α0+α엑스엑스+ϵ

와이=1α0+엑스α엑스+1ϵ

와이=β0+β엑스엑스+1α0+엑스α엑스+1ϵ

일명 ...

  • 원래 독립 변수, 분모 및 분모에 원래 변수를 곱한 회귀 분자
  • (역) 분모에 의한 가중치 회귀

β0β엑스

주의 - 나는 비율의 완전한 이해가 확신 아니에요 중 하나 .


고정 Z를 가정하고 있습니까? 27,000 건 (일명 속성)이 있고 Y (평가 가격) 및 Z (판매 가격)가 각각 다릅니다.
Aaron Kreider

1와이=α0+α엑스엑스+ϵ

확인. 나는 당신의 관련 질문에서 제안 된 접근법을 살펴 보았고 합리적입니다. 나는 이것들에 대해 실제로 그들에게 어떤 방법 으로든 추천 할만큼 충분히 알지 못하지만, 누군가가 당신의 제안을 확인하면 내가 시도 할 수있는 것보다.
Aaron Kreider
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.