나는 코호트 연구 (로그 링크와 함께 포아송 회귀를 사용하여 상대 위험을 추정)를 제대로 분석하기 위해 GEE를 이해하려고 노력하는 역학자입니다. "작업 상관 관계"에 대해 몇 가지 질문이 있습니다.
(1) 같은 개인에서 측정을 반복 한 경우, 교환 가능한 구조를 취하는 것이 가장 합리적입니까? (또는 측정 값이 추세를 나타내는 경우 자동 회귀)? 독립성은 어떻습니까? 동일한 개인의 측정에 대해 독립성을 가정 할 수있는 경우가 있습니까?
(2) 데이터를 조사하여 적절한 구조를 평가하는 (합리적으로 간단한) 방법이 있습니까?
(3) 독립 구조를 선택할 때 간단한 포아송 회귀를 실행할 때 (R, 함수 glm()
및 geeglm()
패키지 사용 geepack
) 와 동일한 점 추정치 (그러나 표준 오류는 낮음)를 얻습니다 . 왜 이런 일이 발생합니까? GEE를 사용하면 모집단 평균 모델 (주제별과 달리)을 추정하므로 선형 회귀 분석의 경우에만 동일한 점 추정치를 얻어야합니다.
(4) 코호트가 여러 위치 사이트에 있지만 (개인당 한 번의 측정) 독립 또는 교환 가능한 작업 상관 관계를 선택해야하는 이유는 무엇입니까? 각 사이트의 개인은 여전히 서로 독립적입니다. 예를 들어, 주제별 모델의 경우 사이트를 임의의 효과로 지정합니다. 그러나 GEE를 사용하면 독립성과 교환이 서로 다른 추정치를 제공하므로 기본 가정의 측면에서 어느 것이 더 나은지 잘 모르겠습니다.
(5) GEE는 2 단계 계층 적 클러스터링, 즉 개인마다 반복되는 측정 값을 가진 다중 사이트 코호트를 처리 할 수 있습니까? 예인 경우, 클러스터링 변수로 무엇을 지정 geeglm()
해야하며, 예를 들어 첫 번째 수준 (사이트)에 대해 "독립성", 두 번째 수준에 대해 "교환 가능"또는 "자동 회귀"라고 가정하는 경우 작업 상관 관계는 무엇입니까 (개별)?
나는 이것들이 꽤 몇 가지 질문이라는 것을 이해하고, 그중 일부는 상당히 기본적이지만 여전히 나 (그리고 다른 초보자도) 이해하기가 매우 어렵습니다. 그래서 어떤 도움이라도 진심으로 감사하며 이것을 보여주기 위해 현상금을 시작했습니다.