인가


12

동료가 반응 변수를 1 의 거듭 제곱으로 높여서 변수를 변환 한 후 일부 데이터를 분석하려고합니다. (즉,y0.125).18y0.125

나는 이것에 불편하지만, 이유를 분명히하기 위해 고군분투하고있다. 나는이 변화에 대한 어떤 기계적인 근거도 생각할 수 없다. 전에도 본 적이 없으며, 제 1 종 오류율이나 그 이상이 부풀려 질까 걱정됩니다. 그러나 이러한 우려를지지 할만한 것은 없습니다!

또한 저의 동료는 이러한 변환 된 모델이 AIC 비교에서 변환되지 않은 모델보다 우수한 것을 발견했습니다. 이것이 그 자체로 그 사용을 정당화합니까?


9
그냥 참고로, 보이는 많은 같은 로그 ( Y ) 의 많은 범위에 대해 y를 . 로그 변환은 많은 경우에 정당화되는 경우가 많지만, 정당하지 않은 경우에도 종종 사용됩니다. y1/8log(y)y
Cliff AB


5
변환 된 종속 변수와 모델 간의 AIC를 의미있게 비교할 수 없습니다. (독립 변수를 변환하는 것은 좋습니다.)
Stephan Kolassa

5
y=(xp1)/pp

3
이것은 0이 발생하면이 변환이 대수를 대신 할 수 있다는 생각에 대한 작은 리프입니다. 일반화 선형 모형에 대한 로그 링크는 평균 반응이 기하 급수적으로 다양하지만 모든 값이 양수라고 가정하지는 않습니다. 따라서 데이터에서 0을 허용합니다. 예를 들어,보고 된 제로 (시료의 제로 표본, 기계에 따른 제로 농도)는 때때로 감지되지 않음을 의미합니다. 훌륭한 이름에도 불구하고 Box-Cox는 GLM에 자연스럽게 연결될 때마다 과매도 된 것으로 보입니다.
닉 콕스

답변:


10

응답에 임의의 값으로 전력 변환 (Tukey, Box-Cox)을 적용하는 것이 일반적입니다. 그 관점에서, 나는 당신의 1/8의 가치에 대해 특별한 관심을 보지 못합니다-그 변환이 당신에게 좋은 잔차를 제공한다면, 가십시오.

물론, 어떤 변형이든 당신이 맞는 기능적 관계를 변화 시키며, 1/8은 기계적으로 이해가되지 않을 수도 있지만, 목적이 물리적 인 변수를 외삽하거나 적합하지 않을 때 나에게는 관심이되지 않을 것입니다 법칙, 그러나 효과의 표시에 대한 적절한 p- 값을 얻으려면 (회귀의 일반적인 사용 사례라고 주장합니다). 이를 위해서는 함수가 예측 변수 값 (wrt 평균 및 잔차 변동)의 도메인 데이터에 적합하며 확인하기 쉽다는 것이 유일한 관심사입니다.

전력 변환에 대한 최상의 값을 모르고 다른 옵션을 비교 하려면 전력 변환이 반응의 규모를 변경하기 때문에 AIC / 우도 값을 직접 비교해서는 안됩니다 . 운 좋게도, 변환에 대한 수정을 계산하는 것이 비교적 간단하다는 점이 밝혀 져서 (수정 된) 가능성을 통해 다른 변환을 비교할 수 있습니다 (예 : 여기 참조 ).

R에서는 MASS :: boxcox에서 구현됩니다. 이는 전력에 적합한 값을 선택하는 편리한 방법입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.