(물류) 회귀 분석에“예측”이라는 단어를 사용하는 것이 얼마나 공정합니까?


9

내 이해는 회귀조차도 인과 관계를 제공하지 않는다는 것입니다. y 변수와 x 변수 및 가능한 방향 사이의 연관성 만 제공 할 수 있습니다. 제가 맞습니까? 나는 대부분의 교과서와 온라인의 다양한 교과서 페이지에서도 "x predicts y"와 비슷한 문구를 발견했습니다. 그리고 회귀자를 종종 예측 변수라고하고 y를 반응이라고합니다.

  1. 선형 회귀에 사용하는 것이 얼마나 공정합니까?
  2. 로지스틱 회귀 분석은 어떻습니까? (내가 확률을 비교할 수있는 임계 값 t가 있다면?)

1
오차 부분을 예측할 방법이 없다는 것을 알고있는 한 사용하는 것이 좋습니다. 완전히 무작위입니다.
Aksakal

1
무작위 또는 기타 오류 부분이 없습니다.
Frank Harrell

답변:


21

"predict"라는 단어를 사용하는 데 아무런 문제가 없습니다.

예측은 인과 관계와 관련이 없음을 인식하는 것이 중요합니다. 병원 응급실에서 사망하는 대부분의 사람들이 심장 마비로 사망하는 경우를 고려하십시오. 환자가 사망했지만 그 원인을 알지 못한다면 심장 마비가 50 % 이상을 담당한다는 것을 알고 있기 때문에 아마도 심장 마비로 인한 것으로 추정 할 수 있습니다. 예측 중이지만 알려진 효과를 통해 알려지지 않은 원인을 예측하고 있습니다. 또한이 예의 예측은 범주 형이므로 로지스틱 회귀와 유사합니다. (비유는 다항 로지스틱 회귀 분석 에 비해 강력 할 수 있지만 여기서는 중요하지 않습니다.)

그 가치에 대해 예측은 직접적인 인과 관계와 전혀 관련이 없습니다. 관계가 신뢰할 수있는 한 가짜 상관 관계를 기반으로 예측할 수 있습니다. 쌍둥이 형제를 기준으로 동일한 쌍둥이의 알 수없는 높이를 예측하는 것을 고려하십시오. 이 경우 두 가지 높이 모두 공통 원인 세트 (유전자 및 환경 공유)의 영향입니다. 쌍둥이의 키는 다른 사람의 원인이거나 결과입니다. 그럼에도 불구하고이 상황에서 아주 좋은 예측을 할 수 있습니다.


'스퓨리어스 회귀'예제 +1!
PatrickT
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.