회귀를 피팅 할 때 직교 다항식을 사용하지 않는 이유가 있습니까?


13

일반적으로 고차 변수로 회귀를 피팅 할 때 직교 다항식을 사용하지 않는 것이 더 좋은지 궁금합니다. 특히 R을 사용하는 것이 궁금합니다.

만약 poly()raw = FALSE같은 장착 값을 생성 poly()raw = TRUE, 그리고 poly함께 raw = FALSE해결할 수있는 문제 다항식 회귀와 관련된 문제 중 일부는 다음해야 poly()raw = FALSE 항상 다항식 회귀를 피팅에 사용? 어떤 상황에서 사용하지 않는 것이 좋 poly()습니까?

답변:


16

이유? 확실한; 아마 몇 가지.

예를 들어, 원시 계수의 값 (가설 된 값과 비교)에 관심이 있고 공선 성이 특별한 문제가 아닌 경우를 고려하십시오. 내가 보통 선형 선형 회귀 중심을 의미하지 않는 이유와 거의 같은 이유입니다 (선형 직교 다항식)

직교 다항식을 통해 처리 할 수없는 것은 아닙니다. 그것은 편의의 문제이지만 편의는 내가 많은 일을하는 큰 이유입니다.

즉, 나는 다항식을 피팅하는 동안 직교 다항식에 의존합니다. 다수의 이점이 있기 때문입니다.


직교 다항식 회귀로 인한 계수를 가정 된 값과 비교할 수 있습니까?
user2374133

2
예. 예를 들어, "원시"다항식에서 암시 적 계수 및 표준 오류로 다시 변환 할 수 있습니다.
Glen_b-복귀 모니카

2
종종보다 상기 단항식 기초로 직교 다항식 기반으로 변환하는 것은 잘못 컨디셔닝 과정 (높은 정도에 대한이 낮은도 변환도 나쁘지 않다) 하나는 그렇다면 선험적 임의의 단항식 기준 계수 관심 직교 다항식을 사용하여 얻은 수치 안정성은 변환 할 때 창에서 제외되므로 처음에 단항식을 사용할 수도 있습니다. 주의의 위험 부담 물론,.
JM은 통계학자가 아닙니다.

1
@JM 감사합니다, 그것은 훌륭한 지적입니다. 운 좋게도 요즘 통계 응용에서는 상당히 낮은 차수 다항식보다 더 적합하지 않을 것입니다. (평상시의 조언은 3-4도를 넘어 설 이론적 인 이유가 없다면 다른 접근법을 살펴보아야한다는 것입니다. 상황에 따라 가장 좋을 수도 있지만 스플라인과 같은 것이 일부 상황에 적합 할 수도 있습니다.)
Glen_b-복지 주 모니카

13

모델이 자랄 때 R을 떠나면 중심 및 정규화 상수를 압축해야한다는 것을 기억해야합니다. 언젠가 SQL에 하드 코딩 된 코드를 발견했다고 상상해보십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.