범주 형 변수 개념과 친숙성을 피하기 위해 한 수준을 기준선으로 맞출 수있는 각각의 더미 변수 코딩에 익숙합니다. 또한 이러한 모델의 모수 추정값을 해석하는 방법에 대해서도 잘 알고 있습니다. 기준선 범주를 기준으로 주어진 적합 수준의 범주 형 예측 변수에 대한 예상 결과 변화입니다.
내가 확실하지 않은 것은 1 에 비례하는 독립 변수 세트 를 해석하는 방법 입니다. 모델의 모든 비율을 맞추면 공선 성이 다시 나타납니다. 따라서 아마도 하나의 범주를 기준선으로 남겨 두어야 할 것입니다. 또한이 변수의 유의성에 대한 전체 검정을 위해 III 형 SS를 살펴 보겠다고 가정합니다. 그러나 모델과 기준에 맞는 수준에 대한 모수 추정치를 어떻게 해석합니까?
예 : 우편 번호 수준에서 독립 변수는 변성암, 화성암 및 퇴적암의 비율입니다. 아시다시피, 이들은 세 가지 주요 암석 유형이며 모든 암석은 이들 중 하나로 분류됩니다. 이와 같이, 3 개 모두에 대한 비율은 1에 합산된다. 결과는 각각의 우편 번호의 평균 라돈 수준이다.
예를 들어, 모델에서 예측 변수로서 변성 및 화성 비율 을 맞추고 퇴적물 을 기준선으로 남겨두면 두 가지 적합 레벨 의 전체 유형 III SS F- 검정은 암석 유형이 전체적으로 중요한지 여부를 나타냅니다 결과 예측 자 (평균 라돈 수준). 그런 다음 개별 p- 값 ( t 분포를 기준으로 )을 확인하여 하나 또는 두 개의 암석 유형이 기준선과 크게 다른지 여부를 확인할 수 있습니다.
그러나 매개 변수 추정치와 관련하여 내 두뇌는 그룹 (암 유형) 간의 결과 변화를 순전히 해석하기를 원하며 비율에 적합하다는 사실을 통합하는 방법을 이해하지 못합니다 .
는 IF 대한 추정 변성이 있었다, 말하자면, 0.43는 해석은 바위가 변성 대 함정이있을 때이 0.43 단위로 평균 라돈 수준의 증가를 예측하는 것이 단순히이다. 그러나, 해석은 단순히 변성암 유형의 비율에서 어떤 종류의 단위 증가 (예 : 0.1)에 대한 것이 아닙니다. 왜냐하면 이것은 그것이 기준선 ( 침강 ) 과도 관련이 있다는 사실을 반영하지 않기 때문 입니다. 변성 의 비율은 본질적으로 화성에 맞는 다른 암석 수준의 비율을 변경합니다 .
누구든지 그러한 모델의 해석을 제공하는 출처를 가지고 있습니까? 아니면 여기에서 간단한 예를 제공 할 수 있습니까?