특정 비선형 모델의 적합도를 평가하는 방법은 무엇입니까? [닫은]


10

비선형 모델 . 여기서 는 표준 정규 분포의 cdf이고 f는 비선형입니다 (아래 참조). 내가 매개 변수이 모델의 적합도 테스트 할 내 데이터 찾기 위해 사용되는 최대 우도 추정을 가진 후Φ a ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n ) ay=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn)a . 적절한 시험은 무엇입니까? 이 테스트를 사용하여 잘못된 적합을 나쁜 것으로 표시하고 더 많은 데이터를 수집해야하는지 여부를 결정하고 싶습니다.

이 모델을 포화 모델과 비교하여 분포를 사용하는 적합도 검정을 수행하는 편차를 사용하여 살펴 보았습니다 . 이것이 적절할까요? 이탈에 관해 읽은 대부분의 내용은 GLM에 적용됩니다. 이탈도 테스트가 적절한 경우 테스트를 유효하게하려면 어떤 가정을 유지해야합니까?χn12

업데이트 : 도움이되는 경우 에 대해f=x1ax2+1x>1,a>0


1
답은 분석 목적과 사용한 기본 확률 모델에 따라 다릅니다. 독특하거나 최상의 수학적 답은 없습니다. 예를 들어, 우리는 다른 형식의 모델의 적합도를 측정 할 형식의 하나 이상의 (iid 오류 ). y = Φ ( f ( x , a ) ) + ε εy=Φ(f(x,a)+ε)y=Φ(f(x,a))+εε
whuber

감사. 내 질문을 명확하게했습니다. 나는 최선의 대답이 없다는 것을 알고 있지만, 여기서 편차가 적합도를 테스트하기에 적합한 지, 그렇지 않은 경우 적합도를 표시하는 데 적합한 다른 테스트가 무엇인지 알고 싶습니다. 매우 열악하고 더 많은 데이터를 수집해야하거나 (모델이 올바르다 고 가정) 모델이 데이터를 설명하지 않는다고 말합니다.
spadequack

1
대상 변수 입니까, 아니면 연속입니까? 전자의 경우 가산 성 오차 항 대신 로 모델의 프레임을 구성하고 예측 된 실제 및 과 비교 하여 true 및 false 긍정 비율 또는 또는 이탈 또는 여러 다른 대안 이있는 기준선 모델과 비교합니다 . 후자의 경우 잔차에 대해 가정하는 분포는 무엇입니까? p ( y = 1 ) = Φ ( f ( x , a ) ) y = 0 y = 1 p ( y = 1 ) = ˉ yy0,1p(y=1)=Φ(f(x,a))y=0y=1p(y=1)=y¯
jbowman

1
설명 요청이 응답하지 않아 마감 투표.
whuber

답변:


1

R 플랫폼을 사용하는 경우 라이브러리 "NP"의 "npcmstest"패키지를 사용하십시오. 경고 : 모델을 평가하는 데 몇 분이 걸릴 수 있습니다.

응답 분포와 예측 분포 (예 : KL 발산, 교차 엔트로피 등)의 정보 이론적 비교를 고려할 수도 있습니다.


이 방법에는 lm또는 의 모델이 필요한 것 같습니다 glm. 비선형 모델에서 어떻게 작동합니까? (예, R을 사용하고 있습니다.) 도움이 될 수 있도록 질문에 가 무엇인지 추가했습니다 . 에프
spadequack

@ 등을 사용 gam하고 mgcv있습니까 ( 패키지)? 그렇지 않은 경우 확인해야합니다.
suncoolsu

1

기본적으로 우도 비 테스트를 수행하는 방법은 다음과 같습니다. 그러나 적합성 테스트의 우수성을 이해하는 데있어 "핵심"을 기억한다는 것은 테스트중인 대체 클래스를 이해하는 것입니다. 이제 각 개별 데이터 포인트에 대해 다음과 같은 가능성이 있습니다.

(와이나는|엑스나는,,나는)=(ϵ나는)=(와이나는에프나는)

여기서 는 모형에서 오차항 의 가능성이고, f i = x i1(ϵ)xia가주어지면 i 번째 데이터 점에 대한 모형 예측입니다. 이제 각 데이터 포인트(XI,YI)우리가 선택할 수등을 그f를내가=Y-은 "포화 모델"당신이 그것을 부르는. 따라서동일한 오류 가능성g(ϵ)을가진 클래스의 대안으로 만 테스트하고각 가능성에 대해 독립성을 갖는 경우 (즉, 다른 것을 아는경우)χ2테스트가 적합합니다.에프나는=엑스나는1엑스나는2+1엑스나는(엑스나는,와이나는)에프나는=와이나는χ2(ϵ) a 가 주어진 경우 y i 를 예측하는 데 도움이되지 않습니다. 엑스제이,와이제이와이나는


1
포화도 모델 에 대한 우도 비 검정의 자유도가 으로 증가하기 때문에 이것은 작동하지 않습니다 . 영형()
StasK

0

선형 회귀 상황에서 적합도 검정은보다 복잡한 대안에 대해 수행되는 경우가 많습니다. 선형 회귀가 있습니다. 다항식 항을 던져서 선형 형태가 충분한 지 테스트하십시오. 이미 비선형 함수 형태를 가지고 있기 때문에 고려해야 할 복잡한 대안은 비모수 적 회귀의 대안이어야합니다 . 주제에 대한 소개를 제공하려고 시도하지 않습니다. 주제 자체의 사고 방식이 필요하므로 별도의 적절한 소개가 필요합니다. 매개 변수와 비모수 적 회귀의 테스트 인 Wooldridge (1992) 또는 Hardle and Mammen (1993)의 경우 매우 유사한 일을합니다. Hardle은 또한 이 주제에 관한 훌륭한 을 썼습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.