비모수 적 회귀를 언제 사용해야합니까?


9

SAS에서 PROC GLM을 사용하여 다음 형식의 회귀 방정식에 적합합니다.

와이=0+1엑스1+2엑스2+엑스+4

결과 redsiduals의 QQ 플롯은 정규 성과의 편차를 나타냅니다. 변환은 잔차를 정규화하는 데 유용하지 않습니다.와이

이 시점에서 PROC LOESS와 같은 비모수 적 방법으로 안전하게 전환 할 수 있습니까?

이미 PROC LOESS를 사용했으며 PROC GLM보다 적합합니다. 그러나 비모수 회귀에 대한 지식이 많지 않습니다. 파라 메트릭 회귀 분석보다 비모수적인 회귀 분석을 선택할시기를 모르겠습니다.

누군가 나를 도울 수 있습니까?

계속해서 다른 질문을 추가하겠습니다. 다음은 모델의 변수에 대한 설명입니다. 때로는 부정적인 예상 비용이 발생합니다. 이것은 말이되지 않습니다. 이 문제를 어떻게 해결할 수 있습니까?

와이=의료 비용엑스1=주사 횟수엑스2=수술 횟수엑스=물리 치료의 수=시각

2
물론 로그를 모델링하여 마이너스 비용을 예측하지 않아도됩니다. 영형(와이)=0+1엑스1+2엑스2+엑스+4
Dirk Horsten

답변:


10

잔차의 QQplots를 살펴보기 전에 모형의 예측 변수 (및 가능하지 않은 다른 변수)에 대해 잔차를 플로팅하여 적합도를 평가해야합니다. 이 그림에는 비선형 성이 표시되어야합니다. 변수의 효과가엑스 실제로는 선형 적입니다. 엑스 눈에 보이는 구조없이 "수평"이어야합니다.

                                                                   *
*                 *
      *                               *
        *   
                                                  *
--------------------------------------*------------------------------x
   *     
           *

                                     *
       *                                                    *
                                *

즉, 라인 resid = 0을 중심으로하는 임의의 수평 "점"지점.

효과가 비선형 인 경우이 그림에서 약간의 곡률이 나타납니다. (위의 그림을 사용하여 비선형이 정렬 될 때까지 QQplots를 무시하십시오!)

또한 가능한 상호 작용 (일반적으로 제품 용어로 모델링)에 대해 생각해야합니다. 즉, 한 변수의 효과는 다른 변수의 수준에 따라 다릅니다 (세 개의 변수가 동시에 높은 값을 갖는 경우 특히 어려울 수 있음) 그렇다면, 상호 작용이 필요할 수 있습니다).

비선형 모델을 사용하는 경우 상호 작용 및 변환을 시도한 후 (시도 log(Cost)했습니까?) 상자 콕스 변환을 시도 했습니까? 다중 회귀가 있기 때문에 loess이것이 필요한 것이라고 생각하지 않습니다 gam(일반적인 추가 모델, SAS는 R에서 패키지로 제공해야 함 mgcv).


1
소중한 정보 감사합니다. 선형 회귀로 로그 (비용)를 시도했지만별로 도움이되지 않았습니다. 상호 작용 효과를 추가하고 어떤 일이 발생하는지 관찰하겠습니다. 또한 변환을 다시 실험 해 보겠습니다. 나는 모든 사람들에게 나의 발전과 결과를 게시하도록하겠습니다.
ann

6

데이터가 실제로 직선을 따르지 않는 한 LOESS는 항상 회귀보다 더 적합합니다. LOESS는 데이터에 가깝게 전달되도록 설계된 로컬 선형 근사치입니다. 이러한 방법은 기본적으로 탐색 적입니다. 그리고 적합 한계를 초과하는 선형 모형을 외삽하는 것은 위험하지만 LOESS의 경우 외삽은 무모합니다.

모형이 음수 비용을 제공하는 경우 선형 회귀가 변수에 적합하지 않다는 아주 좋은 신호입니다. 당신은 당신이 변형을 시도했다고 말합니다. 예측 변수에 대해 비용 로그를 기록 했습니까?

사물의 특성상 비용과 언급 한 변수 사이에 간단한 관계가있을 가능성은 낮습니다. 때로는 선형 회귀의 목적은 일종의 상관 관계가 존재 함을 입증하고 합리적인 예측 변수 집합을 선택하는 것입니다.


1
음의 비용이 선형 회귀가 적합하지 않을 수 있음을 나타내는 것은 매우 의미가 있습니다. 분석을 계속하고 상호 작용을 추가하겠습니다. 감사합니다.
ann

3

잔차 분석을위한 브라보. 일반적인 분석가보다 앞서 나갑니다. (모델에 대한 설명은 오류 구조를 설명하지 못합니다.) X의 변환을 검토하고 Y의 변환을 검토해야합니다. 스플라인 맞춤 모델링에서 SAS가 R보다 낫다는 것을 알고 있지만 최신 버전이 그 용량을 제공했다는 것을 알고 있습니다. X 항에 대해 제한된 입방 스플라인 맞춤을 추가하십시오. 참고로 Frank Harrell의 텍스트 "Regression Modeling Strategies"는 이길 수 없습니다. 이 접근법에 대한 확실한 통계적 주장이 있습니다. 다른 현명하게 놓칠 수있는 데이터 구조를 발견 할 수있는 파라 메트릭 접근 방식입니다.


감사합니다 DWin. 방금 졸업했으며 이것이 분석가로서의 첫 번째 직업입니다. 우연히도, 이런 종류의 분석은 회사에도 새로운 것입니다. 그래서, 나는 완전히 말도 안되는 분석을하려고합니다. 나는 당신의 제안을 받아들이고 둘 다에 변형을 시도 할 것입니다와이엑스변수. 나는 또한 참조를 통해 갈 것입니다. 방금 pdf 버전을 온라인에서 찾았습니다. 입력 해 주셔서 감사합니다.
ann

직관적으로 선형 적으로 의존하는 로그 변환 및 출력에 문제가 있습니다. 모델링하면영형(와이)=0+1영형(엑스1)+2영형(엑스2) 어디 엑스1 오른팔에 주사하고 엑스2왼쪽 팔에 주사하는 경우, 같은 팔에 모든 주사를 한 사람과 양쪽에 절반 씩 주사 한 사람에 대해 완전히 다른 비용을 예측할 수 있습니다.
Dirk Horsten

귀하의 의견은 내 응답과는 무관 한 것 같습니다 (그리고 팔로 주입을 분할하는 것에 대해서는 언급하지 않았기 때문에). 스플라인 함수가 로그 변환과 동일하다고 생각하지 않기를 바랍니다. Y의 로그 변환은 비용 척도로 다시 변환 될 때 예측 변수에서 모형이 곱해지는 모델을 만듭니다. 그것은 상당히 큰 변화이며 문제가 질문자에게 적절하게 설명되지 않은 변화입니다.
DWin

2

나는 kjetil이 당신에게 좋은 제안을했다고 생각합니다. 비정규 잔차가 선형 또는 비선형 회귀에서 비모수 회귀로 이동해야한다는 의미는 아닙니다. 비모수 적 회귀 분석으로 이동하면 기능적 형태의 구조를 포기할 수 있습니다. OLS 회귀에 대한 강력한 회귀 대안이 있습니다. 다음 단계가 필요한 경우 일반화 선형 모형 및 일반화 가산 모형. 내 견해로는 LOESS가 최후의 수단이되어야합니다. 나는 kjetil에 동의한다고 생각합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.