lmer에서 모델을 올바르게 지정 했습니까?


26

많은 도움말 사이트를 and이 뒤져서 혼합 모델에서 더 복잡한 중첩 용어를 지정하는 방법에 대해 여전히 혼란 스럽습니다. 또한의 사용으로 혼란 스러워요 :/|상호 작용을 지정하고 사용하여 임의 요소와 중첩에 lmer()에서 lme4의 패키지 R.

이 질문의 목적을 위해이 표준 통계 모델로 내 데이터를 정확하게 묘사했다고 가정합니다. 고정되고, 및 무작위입니다. 안에 (내재적으로) 중첩되어 있습니다.

Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)케이
stationtowdayTowstation

즉, 내 모델에 Station (i, fixed), Tow (j, random, Station에 내재적으로 중첩 됨), Day (k, random) 및 Tow와 Day 간의 상호 작용 및 Day 간의 상호 작용이 포함되기를 바랍니다. 그리고 역. 나는 통계 학자와상의하여 내 모델을 만들었으며 현재 내 데이터를 대표한다고 생각하지만 내 게시물의 맨 아래에 관심이있는 사람들을 위해 내 데이터에 대한 설명을 추가하여 혼란을 피할 것입니다.

지금까지 내가 함께 조각 할 수 있었던 것은 다음과 lmer같습니다.

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

이것이 나의 통계 모델을 정확하게 묘사합니까? 코드가 올바르게 읽히지 않으면 코드를 개선하는 방법에 대한 제안 사항이 있습니까?

lmer 수식에 지정하기 어려운 특정 용어를 굵게 표시했습니다.

#1. 견인 무작위 때 견인 역 내에서 중첩 및 역은 고정되어
있지만 사용하여 무작위 중첩 및 상호 작용 측면 구별에 대해, 나는 혼란 스러워요 :/. 위의 예에서, 나는 (1|station:tow)스테이션 내에 중첩 된 견인 읽기를 기대하고 있습니다. 의 임의 형식 내에서 :또는 /여기를 사용해야하는지 여부에 관계없이 다양한 사이트에서 충돌하는 의견을 읽었습니다 . (1|...)lmer

# 2. 역이 고정되고 요일이 임의 일 때 역과 요일 사이의 상호 작용은
내가 가지고 (1|station:day)있지만 이번에는 역과 요일 사이의 상호 작용을 읽기를 바라고 있습니다. 스테이션 * 일을 사용하여 스테이션과 요일의 개별 효과와 상호 작용뿐만 아니라 위의 세 가지 용어를 별도로 포함시키지 않고 상호 작용을 설명 할 수있는 것처럼 보이지만 이것을 지정하는 방법을 알 수는 없습니다. 하나는 고정되고 다른 하나는 무작위입니다. station*(1|day)그렇게 하시겠습니까 ?

#삼. 견인은 (고정) 역에 중첩되어 견인 하루 (모두 랜덤) 사이의 상호 작용 그리고 마지막으로, 내가 가진 (1|tow:day)내가 바라고 있어요 이는의 상호 작용을 읽고 tow하고 day,하지만 난 견인이 중첩되어 있음을 다시 지정해야하는지 궁금하네요 (암시 적으로) 역에서?

나는 모두에 새로운 오전 Rlmer통계 모델링 가능하면 크게 내 질문에 어떤 응답에 대한 철저한 설명의 문제를 주셔서 감사합니다.

내 데이터에 대한 자세한 내용 : 플랑크톤의 농도가 근해의 물리적 전선에 따라 달라지는 지 묻고 있습니다. 이 전선의 내륙, 해상, 해상 세 역이 있습니다. 따라서 스테이션이 고정됩니다. 각 관측소에서, 나는 3 개의 복제 플랑크톤 토우를 취합니다. 견인은 무작위입니다. 3 개의 견인에서 특정 스테이션에서 플랑크톤의 일반적인 변동성을 설명하고자합니다. 견인은 각 견인에 고유 한 ID가 없기 때문에 본질적으로 스테이션에 중첩됩니다 (123,123,123은 각 역의 견인에 대한 ID입니다). 그런 다음 새로운 독립 전선으로 여러 개의 독립적 인 날에이 작업을 수행했습니다. 나는 날을 차단 요인으로 생각할 수 있다고 생각합니까? 여러 개의 독립된 프론트 데이에서 이것을 반복하여 매일 가변성을 캡처하려고하고이 프론트가 존재하는 모든 요일을 대표하려고하므로 데이는 임의입니다. 상호 작용 용어에 대해 Tows가 매일 변동성이 변하는 지, 그리고 스테이션이 항상 유사한 데이터를 산출하는지 또는 하루에 의존하는지 확인하고 싶습니다.

다시 한 번 시간을 내 주셔서 감사합니다. 감사합니다.


표준 통계 모델에서 아래 첨자가 누락되었다고 생각합니다 (실수로 추가하지 않으려 고 함).

1
FWIW,이 스레드를 접하고 R구문, IMO 에 중점을 두는 주제에 대해 궁금해하는 사람은 주제에 대해 충분히 통계적입니다 (지정된 모델이 중첩 및 상호 작용과 관련되는 방식을 이해하지 못함) 이력서.
궁 - 분석 재개 모니카

1
이것은 제 의견으로는 100 %입니다.

8
이 글들이 도움이 될 것입니다 : 1 R 'lmer cheat sheet ; 2 "혼합 모델"의 3 가지 형태 해석 ; 3 mer에서 랜덤 효과가 어떻게 지정되는지에 대한 질문 ; 4 중첩 구조가 추가 된 반복 측정 데이터에 대해 R로 선형 혼합 모델을 지정하는 방법에 대한 질문 . (그럼에도 불구하고, 이것은 복제본이 아니라는 점에서 충분히 뚜렷하다고 생각합니다.)
gung-Reinstate Monica

2
당신에 따르면 lmer()구문, 당신은 A A의 고정 효과가 모델 지정한 station동일한 (1) 조합으로 개인에 의해 공유 및 네 개의 무작위 차단, stationtow, (2) 값 Day, (3) 조합 stationday과 ( 4) tow및의 조합 day. 이것이 당신이 의도 한 것입니까? @BabekP에서 알 수 있듯이 모델 공식 작성 방법이 명확하지 않기 때문에 확실하지 않습니다. 매개 변수가 아닌 변수 이름을 작성했습니다. 일반적으로 이와 같은 모델에서는 변수 조합이 아래 첨자에 의해 캡처됩니다.
매크로

답변:


23

견인이 무작위이며 스테이션이 고정 된 경우 스테이션 내에 중첩 된 견인

station+(1|station:tow)맞다. @John이 그의 대답에서 말했듯 (1|station/tow)(1|station)+(1|station:tow)(스테이션의 주요 효과와 견인과 스테이션 간의 상호 작용)으로 확장 할 것 입니다. 스테이션을 이미 고정 효과로 지정했기 때문에 원하지 않습니다.

관측소가 고정되어 있고 요일이 임의 인 경우 스테이션과 요일 간의 상호 작용

고정 효과와 임의 효과 간의 상호 작용은 항상 임의입니다. @John이 말했듯이으로 station*day확장합니다 . 모델에서 station+day+station:day이미 지정했기 때문에 원하지 않습니다 day. 나는 당신이 원하는 것을하고 day(랜덤)과 station(고정) 의 교차 효과를 무너 뜨릴 수있는 방법이 없다고 생각 하지만 station+(1|day/station), 이전 답변에서 지정한 대로을 쓰고 싶다면 쓸 수 station + (1|day) + (1|day:station)있습니다.

견인과 견인이 스테이션에 중첩 된 날 간의 상호 작용

당신의 고유 값이 없기 때문에 tow변수를 당신으로 토우가 지정 아래 말한대로 (즉 때문에 1, 2, 3모든 역에서, 당신이 같이 중첩을 지정할 필요가 (1|station:tow:day). 당신은 토우가 고유하게 지정해야 않은 경우 중 하나를 사용할 수 있습니다 (1|tow:day)또는 (1|station:tow:day)(동일한 답변을 제공해야합니다.) 이 경우 중첩을 지정 하지 않으면lme4 모든 스테이션에서 견인 # 1이 공유하는 임의의 효과를 추정하려고 시도합니다 ...

station:tow:day××

인가 http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specificationhttp://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed는 당신에게 유용?


도움이되는 답변과 참조에 대해 대단히 감사합니다. 감사합니다. 위에서 설명한 것처럼 표기법 (1 | a : b)에 대해 혼란스러워합니다. ':'는 상호 작용뿐만 아니라 "중첩 됨"을 의미 할 수 있습니다. 둘 다 어떻게 지정할 수 있습니까? 다시 말해, lmer는 어떤 관계를 나타내는 지 어떻게 알 수 있습니까? 나는 여기에 기본적인 것이 빠져 있어야합니다. 죄송합니다.
wtree

4
이러한 맥락에서 상호 작용과 중첩 사이에는 그다지 큰 차이가 없습니다. B중첩 여부 A또는 상호 작용 여부는 주요 효과 A가 모델에 포함 되는지 여부에 따라 다릅니다 . 의 주요 효과는 경우 B입니다 또한 다음 모델에서이 돌파 ...
벤 Bolker

안녕하십니까, 여기에 관련 질문이 있습니다 : stats.stackexchange.com/questions/272377/… 누군가 (특히 @BenBolker)가 답을 찾고 제공 할 수있는 기회가 있다면.
Joshua Rosenberg

11

수식의 일부는 약간 혼동됩니다. 이 :(가) 동안 두 용어 사이의 상호 작용을위한 *주 효과 및 상호 작용을위한 것입니다. 는 /상호 작용에 대한 또 다른 하나입니다하지만이 일은 분모 (예에서 분자와 모든 조건 사이의 상호 작용을 생성이다 A/(B+C) = A:B + A:C). 은 |"별로 그룹화"같은입니다. 따라서 1|station스테이션별로 인터셉트되고 괄호 안에는 임의적 (1|station)입니다. 그것이 네가 중첩하는 방법입니다.

희망이 도움이됩니다. 고정 효과 내에 임의의 효과가 중첩되는 것은 약간 이상하며 어떻게 표현할 지 잘 모르겠습니다. 나는 상황을 상상조차 할 수 없습니다. 변수가 무엇인지, 달성하고자하는 것을 설명하면 더 나은 응답을 얻을 수 있습니다. 많은 사람들이 질문을하고 잘못된 용어를 사용하고 있으며 의사 소통하기가 어렵습니다. 변수가 무엇을 나타내고 무엇에 대해 알고 싶은지 설명하십시오.

마지막 단락의 설명에 중점을 두는 것은 견인이 단순히 수집 한 샘플의 지표 일 뿐이며 견인 1이 어떤 식 으로든 견인 2와 일관되게 다르게 예상된다는 의미에서 추정 할 필요는 없습니다. 견인은 단지 샘플을 나타냅니다. 당신이 정말로 견인차의 순서가 중요하다고 생각하지 않는다면, 당신은 그 변수를 신경 쓰지 않아도됩니다. 그리고 그들이 중요하다면, 그것은 고정 효과입니다 (그리고 임의적이지만, 전적으로 무작위 효과는 아닙니다). 토우의 변동성이 매일 바뀌는 지 알고 싶다고합니다. 대답은 어떻습니까? 그들이 매일 변하지 않는 것은 현실적인 확률의 영역에 있지 않습니다. 측정 값의 차이 일뿐입니다. 당신' 오차에 대한 분산이 남지 않기 때문에 모든 분산 사양을 고려하지 마십시오. 과도하게 지정된 모델이 있습니다. 각 측정 값을보고하는 시점에 있습니다.

역이 날마다 달라지는 지 궁금해하는 것에 대해 비슷한 진술을합니다. 물론 그렇습니다. 하지만 특정 일을 의미할까요? 계절, 음력 등으로 어떤 방식으로 날짜가 분류 되었습니까? 이 날 이외의 다른 것을 가지고 있지 않는 한,이 날은 둘째 날입니다. 방송국이 매일 다르다는 것을 아는 것은 방송국이 아닌 다른 것을 어떻게 알 수 있습니까? 따라서이 질문에 대한 대답은 물론 방송국마다 다릅니다. 물론 견인은 날마다 다르며 역마다 역이 다릅니다. 간단한 모델로 끝납니다.

aov(y ~ station, data = dat)

여기 당신이 가지고있는 하나의 고정 된 효과 인 스테이션은 여러 개의 토우와 여러 날에 걸쳐 샘플링됩니다. 여기에 다중 레벨 모델링이 실제로 필요한지 확실하지 않습니다. 모델을 과도하게 지정하는 것처럼 들립니다.

임의의 날 및 견인 효과를 원하고 여기에 지정하지 않은 정보가있는 경우이를 다중 레벨 모델로 확장 할 수 있습니다. 그것은 :

lmer(y ~ station + (two*day|station), data = dat)

그 모델을 사용하려면 각 스테이션과 날마다 여러 개의 견인이 필요합니다.


나는 당신이 말한 모든 것에 동의하지만 이것이 아마도 대답보다 더 많은 의견이라고 생각합니다.
매크로

@ 존 나는 "너희가 네 스팅하는 방법"이 될 때까지 너와 함께 있었어 네가 둥지를 짓는 방법의 실제 요점을 놓친 것 같아. 더 자세히 설명해 주시겠습니까? 나는 여전히 혼란스러워 생각합니다 | 더 자세히 살펴볼 것입니다. 그러나 귀하의 답변에 따르면, 예를 들어 견인 (무작위)이 스테이션 (고정) 내에 중첩되어 있는지 어떻게 나타내는 지 잘 모르겠습니다.
wtree

@ 존 오와 역은 바다에 관심있는 사이트 / 위치로 고정되어 있으며 견인은 무작위입니다. 왜냐하면 각 사이트의 플랑크톤의 변동성을 고려한 다음 무작위로 추정되는 플랑크톤 토우를 무작위로 가져 가기 때문입니다. 역에서 플랑크톤 인구를 나타냅니다.
wtree

1
샘플의 모든 레이블이 랜덤 변수 인 것은 아닙니다. 편집을 참조하십시오.
John

1
나는 여전히 그 견해에 대해 견인을 모델에 포함해서는 안된다고 생각합니다. 그러나 날은 잘 들린다.
John
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.