회귀 모형의 왼쪽 및 오른쪽 명명법


10

y=β0+β1x1+ε0

위에 지정된 매우 간단한 선형 회귀와 같은 회귀 모델을 설명하는 언어는 종종 다양하며 이러한 변형은 종종 의미의 미묘한 변화를 수반합니다. 예를 들어, 방정식의 왼쪽에있는 모델의 일부는 괄호 안의 의미와 의미로 다음과 같이 표시 될 수 있습니다.

  • 종속 변수 (인과 관계에 따른 힌트)
  • 예측 변수 (모델 예측을 암시 / 예측합니다)
  • 응답 변수 (인과 관계를 암시 또는 적어도 시간적 순서에서)
  • 결과 변수 (인과성 함축)

명명법의 변형은 방정식의 오른쪽에서도 마찬가지입니다 (다른 용어에 대해서는 무시하고있는 것과 동일한 면책 조항).

  • 독립 변수 (인과 관계 우선 순위, 실험 설계 힌트)
  • 예측 변수 (예측, 변수에 0이 아닌 모수 추정값이 있음을 의미)

베팅 제안 또는 의사 소통 연구 과정에서 나는 한 용어 또는 다른 용어의 사용에 대해 부름을 받았을뿐 아니라 그 용어로 대체하기로 선택한 용어에 대해 부름을받을 기회가있었습니다. 전화하는 사람들은 물론 농민 (NB : 나는 전문적인 교육자이므로 동정합니다)이지만, 물론 우리 모두는 무엇을 전달 하고 있는지 이해 했지만 여전히 궁금합니다.

(a) 모델의 외부 사용, (b) 변수 간의 인과 관계 및 (c) 연구 측면과 관련하여 회귀 모델에 왼손 및 오른손 변수에 일반적으로 사용되는 용어가 있습니까? 변수 자체를 생성하는 데 사용되는 설계?

NB : 저는 적절한 모델링과 적절한 해석의 중요한 문제에 대해 묻지 않고 (즉, 인과 관계, 연구 설계 등에 매우 관심이 있습니다), 일반적으로 그러한 모델에 대해 말하는 언어에 더 관심이 있습니다.

(나는 "왼쪽 변수"와 "오른쪽 변수"가 믿을만한 대답으로 해석 될 수 있다고 생각하지만,이 용어는 어리석은 것처럼 보인다 ... 아마도 어색한 질문이다. :)


이에 대한 혼동이 없어야합니다.
Carl

1
나는 짧은 대답이 아니오라고 생각합니다. 이것은 내 의견으로는 합당한 이유입니다. 공식적인 사례에서, 변수를 식별하는 데 사용되는 언어는 모델이 의도 한 응용 프로그램 / 도메인 내에서 차별화 된 해석을 내포 할 수있을 정도로 미묘한 차이를 가져야합니다. 이것으로).
Zachary Blumenfeld

2
@ZacharyBlumenfeld (a) 의견에 답하지 마십시오. :) (b) 그럼에도 불구하고, 우리는 연구 설계, 징계 지식 영역 등에 의존하지 않고 일반적인 용어로 "회귀"자체에 대해 이야기합니다. 등). 우리가 광범위한 종류의 통계적 노력을 기술 할 수있는 응용 불가지론 언어가 있다면, 그러한 노력의 구성 요소에 대해 유사하게 불가지론적인 언어가없는 이유는 무엇입니까?
Alexis

1
이것이 답변으로 간주 될 가치가 있는지 확실하지 않으므로 의견으로 게시하고 있습니다. 아마도 는 의 투영입니다. 위에 ) 공간? 마찬가지로 프로젝터projectand (나는 관련 용어를 기억하지 않는 한 지금이를 구성하고있다). 이 용어에는 (a), (b) 및 (c)가 없어야합니다. X(XX)1XyyX
Richard Hardy

1
@ Kenji 나는 당신의 관점의 대부분에 전적으로 동의합니다. 그러나 나는 적용 된 경우에 회귀 방정식에 대해서만 이야기 할 수 있고 동의해야한다는 것에 동의하지 않습니다. 우리는 모든 회귀 모델 의 왼손 및 오른손 변수에 대해 이야기 할 수있는 언어가 있어야합니다 (예 : 그러한 방법의 적용을 검토 할 때) 여러 분야의 메타 수준에서.
Alexis

답변:


6

이것은 훌륭한 질문입니다. 실제로 대답이 없을 정도로 좋습니다. 내가 아는 한, Y를 설명하는 진정한 "무의미한"용어는 없습니다.

내 경험과 독서에서, 시맨틱은 도메인과 모델의 객관적이라는 것을 알았습니다.

계량 경제학자는 설명이 필요한 모형을 작성할 때 종속 변수 항을 사용합니다. 이론적 설명력보다 정확한 추정 / 예측에 중점을 둔 예측 모델을 작성할 때 예측 또는 적합 또는 추정 변수라는 용어를 사용할 수 있습니다.

Big Data / Deep Learning 군중은 완전히 다른 언어를 사용합니다. 그리고 일반적으로 응답 변수 또는 대상 변수라는 용어를 사용합니다. 그들의 모델은 일반적으로 현상을 예측하고 정확하게 추정하기보다는 현상을 설명하려고 시도하지 않는 블랙 박스입니다. 그러나 어떻게 든 그들은 예측이라는 용어를 사용하여 잡히지 않을 것입니다. 응답 또는 대상이라는 용어를 훨씬 선호합니다.

결과 변수라는 용어에 익숙하지 않습니다. 그것은 심리학, 의학, 임상 시험, 역학을 포함한 사회 과학과 같은 노출이 적은 다른 영역에서 널리 퍼질 수 있습니다.

위의 관점에서, 나는 Y를 설명하기위한 "무의식적"의미를 제공 할 수 없었다. 대신에, 나는 다른 청중을 수용하고 모델의 목표를 반영 할 때 어떤 의미를 사용할 것인지에 대한 약간의 정보를 제공했다. 요약하면 계량 경제학자의 의존 변수와 딥 러닝 유형의 반응 또는 목표 변수에 대해 이야기하면 누구도 다 치지 않을 것입니다. 바라건대, 당신은 그 군중들을 분리시킬 수 있습니다. 그렇지 않으면 당신은 당신의 손에 구두 음식 싸움을 할 수 있습니다.


"언어 음식 싸움"에 대한 추가 투표를 할 수 있기를 바랍니다 : D
Alexis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.