시간의 영향이 개인마다 기능적 형태가 다른 종단 데이터 모델링


32

맥락 :

200 명의 참가자를 대상으로 20 주 동안 일주일에 한 번 종속 변수 (DV)를 측정 한 종단 연구를 상상해보십시오. 나는 일반적으로 관심이 있지만, 내가 생각하는 전형적인 DV에는 고용 후의 업무 성과 또는 임상 심리적 개입에 따른 다양한 복지 조치가 포함됩니다.

다단계 모델링을 사용하여 시간과 DV 간의 관계를 모델링 할 수 있다는 것을 알고 있습니다. 계수 (예 : 절편, 경사 등)가 개인마다 다르고 참가자의 특정 값을 추정하도록 허용 할 수도 있습니다. 그러나 데이터를 육안으로 검사 할 때 시간과 DV 간의 관계가 다음 중 하나 인 경우 어떻게됩니까?

  • 기능적 형태가 다름 (일부는 선형이고 다른 것은 지수 적이거나 일부는 불연속적임)
  • 오차 차이가 다릅니다 (일부 시점에서 다음 시점까지 더 변동성이있는 개인이 있음)

질문 :

  • 이와 같은 모델링 데이터에 접근하는 좋은 방법은 무엇입니까?
  • 구체적으로, 서로 다른 유형의 관계를 식별하고 자신의 유형과 관련하여 개인을 분류하는 데 어떤 접근법이 좋습니까?
  • 이러한 분석을 위해 R에 어떤 구현이 있습니까?
  • 이를 수행하는 방법에 대한 참조가 있습니까 : 교과서 또는 실제 응용 프로그램?

답변:


20

다음 세 가지 방향을 살펴볼 것을 제안합니다.

  • 종단 클러스터링 : 이것은 감독되지 않지만, 분할의 품질 (패키지 kml 및 온라인 도움말에 포함 된 참조) 을 평가하기 위해 Calinsky 기준에 의존하는 k-mean 접근 방식을 사용합니다 . 기본적으로 개별 시간 과정에 대한 특정 모양을 식별하는 데 도움이되지 않고 균질 진화 프로파일을 분리하면됩니다.
  • 이분산성을 설명 하는 일종의 잠재 성장 곡선 : 내 최선의 추측은 MPlus 소프트웨어 에 대한 광범위한 참조 , 특히 FAQ 및 메일 링을 보는 것입니다. 나는 또한 무작위 효과 곱셈이 분산 모델 (그 키워드에 대해 인터넷 검색을 시도)에 대해 들었습니다. 나는이 논문들 ( 1 , 2 )이 흥미 롭다는 것을 알고 있지만, 그것들을 자세히 보지 않았다. 신경 심리학 적 평가에 대한 언급을 사무실로 다시 업데이트하겠습니다.
  • 기능적 PCA ( fpca 패키지)이지만 기능적 데이터 분석을 살펴볼 가치가 있습니다.

다른 참고 문헌 (방금 검색) :


1
감사. 클러스터링 절차를 사용한다는 아이디어가 나에게 일어났다. 가능한 개별 수준의 곡선 특징을 이론적으로 의미있는 방식으로 적절히 포착하고 가중치를 부여하는 것이 어려운 과제라고 생각합니다. kml에서 어떻게 작동하는지 살펴 보겠습니다.
Jeromy Anglim

1
글쎄, 인터페이스가 끔찍하지만 꽤 잘 작동합니다 (그리고 그것을 만드는 사람을 알고 있습니다 :)-나는 2 개월 전에 발달 측정에 대한 개별 프로파일을 기반으로 임상 그룹을 분리하는 데 사용했습니다 (Brunet-Lézine).
chl

1
다음은 FDA에 대한 또 다른 주요 참고 자료입니다. psych.mcgill.ca/misc/fda
Mike Lawrence

1
Ramsay (2008)의 FDA 링크에 대한 소개, 특히 gbi.agrsci.dk/~shd/public/FDA2008/FDA_Sage.pdf에
Jeromy Anglim


6

성장 혼합 모델에서 오차 분산을 조사 할 수있는 가능성이있는 것 같습니다 . ( PDF는 여기) (나는 곱셈이 분산 모델이 무엇인지 잘 모르겠지만 확실히 확인해야합니다).

잠재 그룹 기반 궤적 모델은 최근 범죄학에서 실제로 인기를 얻고 있습니다. 그러나 많은 사람들은 그룹이 실제로 존재한다는 것을 당연한 것으로 여깁니다. 는 무작위 데이터에서도 그룹을 찾을 수 있다고 지적했습니다. 또한 Nagin의 그룹 기반 모델링 접근 방식을 사용하면 오류를 평가할 수 없습니다 (솔직히 말하면 불연속처럼 보이는 모델을 본 적이 없습니다).

20 개 시점에서는 어려울 수 있지만, 탐색 목적으로 패턴을 식별하는 간단한 휴리스틱을 작성하면 도움이 될 수 있습니다 (예 : 항상 낮거나 항상 높은 변동 계수). 스프레드 시트 또는 평행 좌표 플롯에서 스파크 라인을 구상하고 있지만 도움이 될 것 같지는 않습니다 (정직하게 밝히는 평행 좌표 플롯을 본 적이 없습니다).

행운을 빕니다


@chl, 문제 없습니다. 여기에 나열된 모든 리소스에 감사드립니다.
Andy W

잠재 그룹에 대한 좋은 지적. 나는 잠재 클래스 분석 및 클러스터 분석의 여러 응용 프로그램을 보았을 때 저 & 고 ( jeromyanglim.blogspot.com/2009/09/… ) 와 같은 연속 변수 int 범주를 조각하는 것처럼 보입니다 . 그러나 나는 개인적으로 카테고리별로 구별되는 데이터 생성 프로세스 (예 : 항상 높음, 항상 낮음, 점진적 증가, 낮음-급격한 증가 등)에서 나오는 것처럼 보이는 개별 수준의 종단 데이터가 있습니다. 더 연속적인 변수 변화가 있습니다.
Jeromy Anglim

@ Jeeromy, 나는 내가 인용 한 연구가 잠재 그룹을 식별하기 위해 그러한 방법을 사용하지 못하게 할 것이라고 생각하지 않습니다. 작업의 요점은 그룹의 존재를 유추하기 위해 그러한 방법을 사용할 수 없다는 것입니다. 왜냐하면 무작위 데이터에서도 그룹을 항상 찾을 수 있기 때문입니다. 찾은 그룹이 실제인지 아니면 단순히 방법의 인공물인지 여부는 더 주관적인 해석에 달려 있습니다. 그러한 프로세스를 생성하는 일부 논리 이론을 식별 한 다음 식별 된 그룹이 해당 이론에 적합한 지 확인할 수 있습니다.
Andy W

5

이 질문을한지 4 년이 지난 지금, 몇 가지를 배웠으므로 몇 가지 아이디어를 추가해야 할 것입니다.

베이지안 계층 모델링이이 문제에 대한 유연한 접근 방식을 제공한다고 생각합니다.

소프트웨어 : jags, stan, WinBugs 등과 같은 도구는 해당 R 인터페이스 패키지 (예 : rjags, rstan)와 잠재적으로 결합되어 이러한 모델을보다 쉽게 ​​지정할 수 있습니다.

개인 오차 내 변화 : 베이지안 모델을 사용하면 개인 간 오차 편차를 사람마다 다른 임의의 요인으로 쉽게 지정할 수 있습니다.

와이나는=1,...,j=1,...J 같이

와이나는j(μ나는,σ나는2)
μ나는=γ
γ(μγ,σγ2)
σ나는에이에이(α,β)

따라서 각 개인의 표준 편차는 감마 분포로 모델링 될 수 있습니다. 나는 이것이 사람들이 시간이 지남에 따라 얼마나 많은 차이가 나는 많은 심리적 영역에서 중요한 매개 변수라는 것을 알았습니다.

잠재 된 곡선 클래스 : 이 아이디어를 아직 많이 탐구하지는 않았지만 각 개인에 대해 둘 이상의 가능한 데이터 생성 기능을 지정한 다음 베이지안 모델이 주어진 개인에 대해 가장 가능성이 높은 모델을 선택하도록하는 것이 비교적 간단합니다. 따라서 일반적으로 개별 데이터를 설명하는 기능적 형식과 관련하여 각 개인에 대한 후 확률을 얻게됩니다.

모델 아이디어의 스케치로서 다음과 같은 것을 가질 수 있습니다.

yijN(μij,σ2)
μij=γiλij(1)+(1γi)λij(2)
λij(1)=θ1i(1)+θ2i(1)exp(θ3i(1))
λij(2)=θ1i(2)+θ2i(2)xij+θ3i(2)xij2
γi=Bernoulli(πi)

Where xij is time and λij(1) represents expected values for a three parameter exponential model and λij(2) represents expected values for a quadratic model. πi represents the probability that model will choose λij(1).


I've also been moving to the Bayesian framework, and have been reading on using Gaussian Processes for time series analysis of uncertain function forms. Still unclear how it can be applied to the case of hierarchical data (see my unanswered query here: groups.google.com/d/msg/stan-users/yjDWtMhxQQE/2TiYevy0ZwUJ)
Mike Lawrence

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.