R에서 betareg 함수를 사용하여 혼합 모델을 구현하는 방법은 무엇입니까?


12

개별 올챙이의 "활동 수준"을 측정하는 비율로 구성된 데이터 집합이 있으므로 값을 0과 1 사이로 제한합니다.이 데이터는 개인이 특정 시간 간격 내에서 이동 한 횟수를 세어 수집했습니다 (이동, 0으로 이동 한 다음 평균을 계산하여 개인당 하나의 값을 만듭니다. 나의 주요 고정 효과는 "밀도 수준"입니다.

내가 겪고있는 문제는 임의의 효과로 포함하고 싶은 인자 변수 "폰드"가 있다는 것입니다. 연못 사이의 차이는 신경 쓰지 않지만 통계적으로 설명하고 싶습니다. 연못에 대한 한 가지 중요한 점은 내가 3 개 밖에 없다는 점이며, 임의의 효과를 다룰 때 더 많은 요인 수준 (5+)을 갖는 것이 이상적이라는 것을 알고 있습니다.

가능한 경우 R을 사용 betareg()하거나 betamix()R 로 혼합 모델을 구현하는 방법에 대한 조언을 원합니다 . R 도움말 파일을 읽었지만 일반적으로 이해하기 어렵습니다 (각 인수 매개 변수가 문맥에서 실제로 의미하는 것) 내 자신의 데이터와 출력 값이 생태학 용어로 무엇을 의미하는지) 그래서 예제를 통해 더 잘 작동하는 경향이 있습니다.

관련 메모에 따르면, 대신 glm()이항 계열과 로짓 링크를 사용하여 이러한 종류의 데이터에 대한 임의의 효과를 설명 할 수 있는지 궁금합니다 .


아니오 glm ()에 오류 용어를 포함시킬 수 없습니다. 로짓 변환으로 응답을 변환하고 선형 혼합 모형을 고려하는 것은 어떻습니까?
utobi

@utobi 감사합니다, 나는 이것을 시도 할 것입니다. 그래서, 당신은 단지 3 레벨로 임의의 효과에 대한 걱정이 없습니까?
Kat Y

변수 "pond"의 의미를 모르지만 측정을 반복 한 경우 임의의 효과는 거의 필수입니다. 반복적 인 조치가없는 경우 무작위 대 고정은 공개 토론입니다. 3 가지 수준의 랜덤 효과는 괜찮을 수 있습니다. 원칙적으로 분산은 추정 가능합니다. 해당 분야의 문헌을 확인하시기 바랍니다. 랜덤 효과와 고정 효과에 대해 설명하는 좋은 책은 stat.columbia.edu/~gelman/arm 입니다.
utobi

1
@utobi 조언을 주셔서 감사합니다. 도움이되었습니다. 나는 그 책을 볼 것이다! 결국 로짓 변환을하고 lmer ()를 사용했습니다.
Kat Y

답변:


11

현재의 기능 betareg에는 무작위 / 혼합 효과가 포함되지 않습니다. 에서 betareg()당신은 당신의 세 가지 수준의 연못 변수에 대한 예를 들어 고정 효과를 포함 할 수 있습니다. 이 betamix()함수 는 혼합 효과 베타 회귀가 아닌 유한 혼합 베타 회귀를 구현합니다 .

귀하의 경우, 먼저 고정 연못 요인 효과가 어떤 영향을 미치는지 확인하려고합니다. 임의의 효과는 하나의 추가 자유도만으로 약간 저렴하지만이 방법은 2 자유도를 "비용"으로합니다. 그러나 두 가지 접근 방식이 매우 다른 정 성적 통찰력을 이끌어 낸다면 놀랄 것입니다.

마지막으로 glm()베타 회귀는 지원하지 않지만 mgcv패키지에는 함수 betar()와 함께 사용할 수있는 제품군이 있습니다 gam().


입력 해 주셔서 감사합니다. 베타 레그 기능의 일부 측면을 설명했습니다. 이 시점에서 나는 @utobi의 조언을 취하고 로짓 변환을 수행하여 lmer ()를 사용할 수 있습니다. 다음 데이터 세트도 0과 1 사이에 바인딩되어 있기 때문에 gam ()을 살펴볼 것입니다. 변환을 통해 분포를 정규화 할 수는 없습니다. :)
Kat Y

1
나는 그 접근법이 비슷한 결과를 반환하지만 당신이 무언가를 배울 수있는 약간의 차이점을 기대할 것입니다. 따라서 betareg고정 효과, 로짓 변환 lmer된 임의 효과 및 gam로 세 가지를 모두 사용하는 것이 좋습니다 betar. (또한 : 답변이 도움이된다면, 그것을
찬성

15

glmmTMB 패키지 는 비슷한 질문이있는 사람에게 도움이 될 수 있습니다. 예를 들어, 위의 질문에서 연못을 임의의 효과로 포함하려면 다음 코드를 사용하십시오.

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

이력서에 오신 것을 환영합니다. 당신의 기여에 감사합니다. 이것은 대답보다는 주석입니다. 답변을 연장 할 수 있습니까?
Ferdi

지연해서 죄송합니다. 댓글이 즉시 표시되지 않았습니다. 희망이 도움이됩니다.
Kori K

3

이것은 의견으로 시작되었지만 오래 걸렸습니다. 나는 임의의 효과 모델이 여기에 적합하지 않다고 생각합니다. 연못이 3 개뿐입니다. 3 개 숫자의 분산을 추정 하시겠습니까? 그것은 임의의 효과 모델과 관련이 있습니다. 나는 연못이 연구자들의 편의성 때문에 "미국의 연못"의 무작위 표본이 아니라 선택되었다고 생각합니다.

랜덤 효과 모델의 장점은 연못 대 연못 변동을 고려한 반응 (활동 수준)에 대한 신뢰 구간을 구성 할 수 있다는 것입니다. 즉, 연못을 블록처럼 취급하는 고정 효과 모델은 연못 효과에 대한 반응을 조정합니다. 각 연못에 2 종의 개구리가 추가 처리 효과가있는 경우 차단은 평균 제곱 오차 (F 테스트의 분모)를 줄이고 처리 효과를 밝게합니다.

이 예에서는 처리 효과가없고 임의 효과 모델 (및 아마도 "무작위")에 비해 연못 수가 너무 적으므로이 연구에서 어떤 결론을 도출 할 수 있는지 잘 모르겠습니다. 연못의 차이에 대한 좋은 추정치를 얻을 수는 있지만 그것에 관한 것입니다. 다른 연못 환경에서 더 많은 수의 개구리에게 추론이 유도되는 것을 보지 못했습니다. 하나는 그것을 파일럿 연구로 구성 할 수 있다고 생각합니다.

여기서 임의 효과 모델을 사용하면 연못 분산에 대해 매우 신뢰할 수없는 추정치가 제공되므로주의해서 사용해야합니다.

그러나 원래의 질문에 관해서는-이것은 속도 문제가 아닌가? 단위 시간당 이벤트의 이동 분배는 포아송입니다. 따라서 시간 간격이있는 카운트를 오프셋으로 사용하여 포아송 회귀를 수행 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.