SAS를 사용하여 Poisson 일반 첨가제 모델을 사용하여 일부 시계열 데이터를 피팅했습니다 PROC GAM
. 일반적으로 말해서, 내장 된 일반 교차 유효성 검사 절차를 통해 단일 스플라인에 대해 적어도 "시작점"을 생성했습니다. 이는 단일 파라 메트릭 용어와 함께 비선형 시간 함수입니다. 실제로 관심이 있습니다).
지금까지 내 데이터 세트 중 하나를 제외하고는 다소 수영을했습니다. 이 데이터 세트에는 132 개의 관측치가 있으며 GCV는 128 자유도의 스플라인을 제안합니다. 저것은 ... 잘못입니다. 매우 잘못되었습니다. 더 중요한 것은 또한 전혀 안정적이지 않다는 것입니다. 매개 변수 항의 추정값이 변경을 멈출 때 자유도 추가를 중지하기 위해 "추정 변경"기준과 같은 방법을 사용하여 두 번째 접근법을 시도했는데, 왜 다른 것이 없다면 제어를 계속 추가합니까?
문제는 추정치가 전혀 안정적이지 않다는 것입니다. 나는 다음과 같은 자유도를 시도했으며, 보시다시피, 파라 메트릭 용어는 격렬하게 튀어 오릅니다.
DF: Parametric Estimate:
1 -0.76903
2 -0.56308
3 -0.47103
4 -0.43631
5 -0.33108
6 -0.1495
7 0.0743
8 0.33459
9 0.62413
10 0.92161
15 1.88763
20 1.98869
30 2.5223
40-60 had convergence issues
70 7.5497
80 7.22267
90 6.71618
100 5.83808
110 4.61436
128 1.32347
나는이 특정 비트의 데이터에 대해 df 측면에서 사용해야하는 것에 대해 전혀 직관이 없습니다. df를 선택하는 방법에 대한 다른 아이디어가 있습니까? 스플라인의 중요성을 살펴 봐야합니까?
df = 10과 df = 15 사이에서 좀 더 살펴보면 df = 12가 128에 의해 생성 된 추정치에 가장 가깝고 "합리적인 자유도"범위에있는 것처럼 보입니다. 선형 항, 절편 및 단일 모수 항과 함께 상당히 포화 된 모형처럼 느껴집니다. 12와 함께가는 것이 타당합니까?
두 번째 업데이트로 스무딩을에서 spline(t)
로 변경하면 loess(t)
훨씬 더 잘 작동하는 df 추정치가 발생합니다.