누군가 나를 혼란스럽게 만들 수 있기를 바랍니다. 다음과 같은 두 가지 회귀 계수 세트가 서로 크게 다른지 테스트하고 싶다고 가정 해보십시오.
- , 5 개의 독립 변수가 있습니다.
- 크기가 대략 2 개의 그룹 (이것은 다를 수 있음)
- 수천 개의 유사한 회귀 분석이 동시에 수행되므로 일종의 다중 가설 보정이 수행되어야합니다.
나에게 제안 된 한 가지 접근법은 Z- 테스트를 사용하는 것입니다.
이 보드에서 제안한 또 다른 것은 그룹화를위한 더미 변수를 도입하고 모델을 다음과 같이 다시 작성하는 것입니다.
(여기서, 는 0, 1로 코딩 된 그룹화 변수 임)
내 질문은이 두 가지 접근 방식이 어떻게 다른가 (예 : 다른 가정, 유연성)입니까? 하나가 다른 것보다 더 적절합니까? 나는 이것이 매우 기본적이라고 생각하지만 모든 설명은 크게 감사하겠습니다.