매우 불규칙적 인 시계열


10

약 5 년에 걸쳐 샘플링되었지만 여러 가지 다른 물고기의 개체수에 대한 데이터가 있지만 매우 불규칙적 인 패턴입니다. 때로는 샘플 사이에 개월이 있고 때로는 한 달에 여러 샘플이 있습니다. 0 카운트도 많다

그러한 데이터를 다루는 방법?

R로 쉽게 그래프를 그릴 수는 있지만 그래프는 특히 울퉁불퉁합니다.

모델링 측면에서 다양한 종의 함수로 모델링 된 종의 경우 혼합 모델 (일명 멀티 레벨 모델) 일 수 있습니다.

모든 참조 또는 아이디어 환영

의견에 대한 답변으로 일부 세부 사항

약 15 종이 있습니다.

각 물고기의 추세 또는 계절에 대한 아이디어를 얻으려고 노력하고 종들이 서로 어떻게 관련되어 있는지 살펴 봅니다 (고객은 원래 간단한 상관 관계 표를 원했습니다)

목표는 예측 적이 아니라 설명적이고 분석적인 것입니다.

추가 편집 : K. Rehfield et al. 이이 논문을 찾았습니다.이 보고서는 가우시안 커널을 사용하여 매우 불규칙한 시계열에 대한 ACF를 추정합니다.

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf


1
귀하의 질문에 대답하는 것이 올바른 사람은 아니지만 다단계 모델이 합리적으로 들립니다. 표본의 크기, 종의 수 및 제로 카운트가 어떻게 발생하는지에 대한 힌트가 있습니까? (마지막으로, 임의의 표본에서 표본을 추출하려고합니까, 아니면 메기를 생산하지 않을 저음 낚시 대회에서 카운트를 얻은 것처럼 편향되어 있습니까?)
Wayne

1
"거래하다"는 정확히 무엇을 의미합니까? 불규칙한 시간에 대처하는 방법에 대한 아이디어는 "+ 불규칙 + 시간"
whuber

샘플링과 목표를 명확히 할 수 있습니까? 예를 들어이 캡처 캡처입니까? 릴리스되지 않은 특정 기간 동안 스트림에 네트가 배치됩니까? 향후 표본 크기 또는 표본을 추출 할 더 많은 모집단을 추정하려고합니까? 샘플이 하나 이상의 위치에 있습니까? 불규칙한 시계열에는 아무런 문제가 없지만 샘플링 이벤트와 샘플 및 일부 대상 변수 (예 : 모델 응답) 간의 연결을 이해하기는 약간 어렵습니다. 또한 목표는 본질적으로 예측 적이거나 묘사 적인가?
Iterator

2
누군가이 질문에 투표 한 이유는 무엇입니까? 더 나은 질문이나 답변을 개발하도록 도와주십시오.
반복자

2
@Iterator 지금까지도 "추가 편집"이후에는 명확한 질문이 없습니다. 공감대 (내 첫 번째 의견에 대한 답변이 관찰되지 않은 후 전달됨)는 OP가 필요한 개선 사항을 제공하도록 장려하고, 부분적으로 형성된 질문의 유일한 상태에 대한 신호를 OP에게 제공하도록 장려했습니다. 의도 한 것을 추측하는 것은 모든 독자 (또는 그 문제에 대한 개조 자)의 역할이 아닙니다!
whuber

답변:


10

일정하지 않은 간격의 시계열에 대한 일반적인 프레임 워크를 구축하는 데 꽤 많은 시간을 보냈습니다. http://www.eckner.com/research.html

또한, 나는 불균일 한 간격의 시계열에 대한 추세 및 계절성 추정에 관한 논문을 썼습니다.

결과가 도움이 되길 바랍니다.


5
감사! 그 분석은 오래 전에 이루어졌고 더 이상 그렇게하지는 않지만 비슷한 일이 다시 일어날 수 있습니다. 다른 사람들은이 스레드를 많이 검색하므로 주석이 낭비되지 않습니다.
Peter Flom

정보에 감사드립니다 (실제로 인터넷상의 누군가가 그것을 찾고 있습니다!). 그러나 링크는 죽었습니다.
걸려

2

모든 시점의 데이터가 어떤 의미에서 서로 교환 가능해야한다고 생각하지 않는 한 혼합 모델이 매우 적합한 지 (임의 효과 구조가 선형 예측 변수 인 표준 패키지 사용) 알 수 없습니다 불규칙 간격은 문제가되지 않습니다)-실제 자기 상관을 합리적인 방식으로 모델링하지는 않습니다. lmer ()를 속여 일종의 공격적인 일을하도록 속일 수는 있지만 정확히 어떻게 당신이 그렇게 할 수 있습니까? (나는 똑바로 생각하지 않을 수도 있습니다). 또한 혼합 모델 시나리오에서 자동 상관을 유도하는 "그룹화 변수"가 무엇인지 잘 모르겠습니다.

시간 자기 상관이 성가신 매개 변수이고 너무 예측하지 않는 경우큰 경우에는 데이터를 상관 관계 측면에서 본질적으로 서로 분리 된 에포크 (epoch)로 묶을 수 있습니다 (예 : 데이터가없는 지점에서 시계열 분리). 그런 다음이 수정 된 데이터 세트에서 GEE와 같은 작업을 수행 할 수 있습니다. 여기서 "클러스터"는 사용자가 속한 에포크에 의해 정의되며, 작업 상관 매트릭스의 항목은 관측이 얼마나 멀리 떨어져 있는지에 대한 함수입니다. 회귀 함수가 올바른 경우 상관 구조가 잘못 지정되어 있어도 회귀 계수의 일관된 추정값을 얻을 수 있습니다. 예를 들어, 일반적으로 포아송 회귀 분석에서와 같이 로그 링크를 사용하여 카운트 데이터로 모델을 모델링 할 수도 있습니다. 종들 사이에 약간의 상관 관계를 구축 할 수도 있습니다. 여기서 각 시점은 시점 사이에 시간적으로 붕괴되는 연관성을 갖는 종의 다변량 벡터로 간주된다. 이를 위해서는 표준 GEE 패키지를 속이기 위해 사전 처리가 필요합니다.

시간 자기 상관이 성가신 매개 변수 가 아닌 경우 전체 데이터 세트를 큰 다변량 벡터의 하나의 관측 으로보고 종에 대한 관측치 와 같은 전체 데이터 세트를 보는 구조적 공분산 모델과 같은 것을 시도합니다. 인와이에스,와이,V

영형V(와이에스,와이)=에프θ(에스,,,V)

여기서 는 유한 한 수의 매개 변수 인 까지 알려진 일부 매개 변수 함수 이며 평균 구조를 제어하는 ​​여러 개의 매개 변수와 함께 사용됩니다. 이와 같은 모델에 대해 "자체 구축"이 필요할 수도 있지만, 카운트 데이터를 위해 이와 같은 작업을 수행하는 MPLUS 패키지가있는 경우에도 놀라지 않을 것입니다.에프θ


감사합니다 @macro. 내가 생각하는 그들은 종종 시간에 중첩 된 데이터에 사용되기 때문에 혼합 모델을 확인 할 수 있음; 나는 자기 상관 모델링에 관심이 없다. 즉, 그것은 귀찮은 일이다. 나는 시간이 선형이 아니라는 데 동의하지만 시간 효과를 추가 할 수 있습니다 (아직 어느 것이 확실하지 않지만 탐색 할 수 있음). 나는 MPLUS가 없지만 R과 SAS가 있습니다.
Peter Flom

1
이 상황에서는 표준 혼합 모델이 적합하지 않을 수 있습니다. 시점이 상관 관계 측면에서 교환 가능한 것으로 생각하지 않는 경우 임의 절편은 쓸모가 없습니다 (즉, '교환 가능한 상관 관계'세계 내에서 실제 상관 관계 구조에 대한 근사값 만 제공함). 시간에 임의의 기울기를 포함하면 궤도가 시간이 지남에 따라 "어딘가로 향하고있다"고 생각할 수 있습니다. 줄거리가 그다지 밝지 않기 때문에 이런 일이 일어나지 않을 것입니다. 그래도 lmer ()를 속여서 더 적절한 것을 할 수 있다는 것을 인정할 것입니다.
매크로

2
+1 내가 해결하고자하는 모든 주요 사항을 다루는 훌륭하고 간결한 답변. R의 패키지와 관련하여 [poisson regression temporal]에 대한 CRAN의 Google 검색은 여러 패키지를 나타냅니다. surveillance패키지는 기능을 원하는 수 있습니다. 이런 종류의 모델링은 생태 연구에서 드문 일이 아니므로 CRAN의 생태 구석에서 좋은 패키지를 찾는 것이 가장 좋습니다.
Iterator
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.