종속 변수가 백분율 인 반복 측정 실험이 있고 독립 변수로 여러 요인이 있습니다. 이 설정을 직접 수용하는 것처럼 보이기 때문에 glmer
R 패키지 를 사용 lme4
하여 로지스틱 회귀 문제 (을 지정하여 family=binomial
) 로 취급 하고 싶습니다 .
내 데이터는 다음과 같습니다
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
그리고 내가 원했던 R 명령이 적절합니다.
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
이 문제는 명령이 종속 변수가 정수가 아닌 것에 대해 불평한다는 것입니다.
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
이 (파일럿) 데이터를 분석하면 이상한 결과를 얻을 수 있습니다.
binomial
가족이 정수 (예-아니오)를 기대 하는 이유를 이해 하지만 백분율 데이터를 직접 회귀하는 것이 좋습니다. 이것을하는 방법?
1
10 개 중 5 개는 1000 개 중 500 개와 동일한 정보가 아니기 때문에 나에게는 괜찮지 않은 것 같습니다. "성공"& 하나의 카운트. "실패".
—
Scortchi-Monica Monica 복원
@ Scortchi 감사합니다, 당신이 옳을 수도 있습니다. 나는 stats.stackexchange.com/questions/77376/… 이 질문과 비슷한 비율 (확률 적 결정에서 파생 된)의 백분율의 지속적인 성격에 대해 부분적으로 생각 했지만 정수 수로의 의미있는 변환을 통해 데이터를 표현할 수 있다고 생각합니다.
—
Dan Stowell