평범한 영어로 : 나는 다중 회귀 또는 ANOVA 모델을 가지고 있지만 각 개인에 대한 반응 변수는 시간의 곡선 함수입니다.
- 커브의 모양 또는 수직 오프셋의 중요한 차이를 담당하는 오른쪽 변수를 어떻게 알 수 있습니까?
- 이것은 시계열 문제, 반복 측정 문제 또는 다른 것입니까?
- 이러한 데이터를 분석하는 가장 좋은 방법은 무엇입니까 (가급적
R
이지만 다른 소프트웨어를 사용하는 것이 좋습니다 )
더 정확한 용어로 : 하자 말 나는 모델이 하지만 Y_ {IJK는} 실제로에서 수집 된 데이터 포인트의 연속이다 많은 시점 t 에서 동일한 개별 k 로, 숫자 변수로 기록되었습니다. 데이터를 플로팅하면 각 개별 y_ {ijkt} 에 대해 수직 오프셋, 모양 또는 빈도 (순환 적 경우)가 공변량에 크게 의존 할 수있는 2 차 또는 주기적 함수가 있음을 알 수 있습니다. 공변량은 시간이 지남에 따라 변하지 않는다. 즉, 개체는 데이터 수집 기간 동안 일정한 체중 또는 치료 그룹을 갖는다.
지금까지 나는 다음과 같은 R
접근법 을 시도했다 .
마 노바
Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME);
... 여기서는
YT
열이 시점이고이 예에서는 열이 10이지만 실제 데이터에서는 훨씬 더 많은 행렬이 있습니다.문제 : 이것은 시간을 요인으로 취급하지만 시점이 각 개인에 정확히 일치하지는 않습니다. 또한 표본 크기와 관련하여 많은 수가 있으므로 모델이 포화됩니다. 시간이 지남에 따라 응답 변수의 모양이 무시되는 것처럼 보입니다.
혼합 모델 (Pinheiro 및 Bates와 동일, S 및 S-Plus의 혼합 효과 모델 )
lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
... 여기서는
ID
개인별로 데이터를 그룹화하는 요소입니다. 이 예에서 응답은 시간에 따라 주기적이지만, 2 차 항 또는 다른 시간 함수가있을 수 있습니다.문제 : 각 시간 항이 필요한지 (특히 2 차 항의 경우) 어떤 공변량에 의해 영향을 받는지 확실하지 않습니다.
- 인가
stepAIC()
를 선택하는 좋은 방법은? - 시간 종속 용어를 제거하면
random
인수 에서도 제거 됩니까? - 어떤 I는 자기 상관 함수 (예를 사용하는 경우
corEXP()
에서 화학식 소요)correlation
인 공방을 위해 해당 I는 수식해야corEXP()
에서와 동일한random
막 또는~1|ID
? - 이
nlme
패키지는 Pinheiro 및 Bates 외부의 시계열과 관련하여 거의 언급되지 않습니다.이 문제에 적합하지 않은 것으로 간주됩니까?
- 인가
이차 또는 삼각법 모델을 각 개인에 적합시킨 다음 각 계수를 다중 회귀 또는 분산 분석에 대한 반응 변수로 사용합니다.
문제 : 다중 비교 수정이 필요합니다. 내가 간과하고있는 것을 의심하게 만드는 다른 문제는 생각할 수 없다.
이 사이트에서 이전에 제안한대로 ( 예측자가 둘 이상인 시계열 회귀의 용어는 무엇입니까? ) ARIMAX 및 전달 함수 / 동적 회귀 모델이 있습니다.
문제점 : ARMA 기반 모델은 불연속적인 시간을 가정합니까? 역동적 인 회귀에 관해서는, 나는 오늘 처음으로 그것에 대해 들었지만, 결국 펼쳐지지 않을 또 다른 새로운 방법을 탐구하기 전에, 전에 이것을 한 사람들에게 조언을 구하는 것이 현명하다고 생각했습니다.