«overdispersion» 태그된 질문

과대 산포는 데이터에 '필요한'것보다 더 큰 변동성이있는 경우입니다. 예를 들어, 개수의 분산은 종종 평균보다 크지 만 포아송의 분산은 평균과 같아야합니다.

4
GLM 과대 산포가 유의한지 여부를 확인하는 테스트가 있습니까?
R로 Poisson GLM을 만들고 있습니다.과 분산을 확인하기 위해 잔차 이탈과 자유도의 비율을보고 summary(model.name)있습니다. "중요한"것으로 간주 될 컷오프 값이나 테스트가 있습니까? 1보다 크면 데이터가 과도하게 분산되어 있지만 비율이 상대적으로 1에 가까울 경우 (예 : 1.7 (잔여 편차 = 25.48, df = 15) 및 1.3 (rd = 324, df) = 253)], 여전히 …

4
과도하게 분산 된 포아송 결과를 위해 다단계 모델을 어떻게 적합합니까?
R을 사용하여 Poisson 분포 (과도 분산 포함)와 다중 수준 GLMM을 맞추고 싶습니다. 현재 lme4를 사용 하고 있지만 최근에 quasipoisson가족이 제거 되었음을 알았 습니다. 다른 곳에서는 관측 당 하나의 수준으로 임의의 절편을 추가하여 이항 분포에 대한 추가과 분산을 모델링 할 수 있음을 알았습니다. 포아송 분포에도 적용됩니까? 더 좋은 방법이 있습니까? 추천 …

2
유사 이항 분포는 무엇입니까 (GLM의 맥락에서)?
나는 quasibinomial 분포가 무엇인지, 그리고 그것이 무엇인지에 대한 직관적 인 개요를 누군가가 제공 할 수 있기를 바랍니다. 특히 다음 사항에 관심이 있습니다. 유사 이항 분포가 이항 분포와 어떻게 다른가? 반응 변수가 비율 인 경우 (예 : 값에 0.23, 0.11, 0.78, 0.98 포함) 준이 항 모델은 R에서 실행되지만 이항 모델은 그렇지 …

4
카운트 데이터에 적합한 모델을 결정하기위한 전략
카운트 데이터와 함께 사용할 모델을 결정하기위한 적절한 전략은 무엇입니까? 나는 다중 레벨 모델로 모델링 해야하는 데이터를 계산 했으며이 사이트에서 버그 또는 MCMCglmm을 통해 가장 좋은 방법이라고 제안했습니다. 그러나 나는 여전히 베이지안 통계에 대해 배우려고 노력하고 있으며, 먼저 데이터를 일반 선형 모델로 맞추고 데이터의 중첩 구조를 무시해야한다고 생각했습니다 (그러므로 기대할 내용에 …

2
포아송 모델의 경우 잔류 이탈도 / df가 ~ 1이어야한다고 가정하면 대략적인 수치는 얼마입니까?
Poisson 모형 적합이 잔차 편차를 자유 도로 나누는 것과 관련하여 과도하게 분산되어 있는지 여부를 확인하기위한 조언을 자주 보았습니다. 결과 비율은 "약 1"이어야합니다. 문제는 우리가 "대략적인"범위에 대해 이야기하는 것입니다. 대체 모델 형태를 고려하기 위해 알람을 설정해야하는 비율은 무엇입니까?

2
카운트 데이터와 과대 산포가있는 회귀 분석에서 포아송 또는 준 포아송?
계산 데이터가 있습니다 (많은 요인에 따라 고객 수를 계산하여 요구 / 제공 분석). 정상적인 오류로 선형 회귀를 시도했지만 QQ 플롯이 실제로 좋지 않습니다. 나는 대답의 로그 변환을 시도했다 : 다시 한 번 나쁜 QQ 플롯. 이제 Poisson Errors로 회귀를 시도하고 있습니다. 모든 중요한 변수가있는 모델을 사용하면 다음과 같은 결과를 얻습니다. …

2
GLM의 과대 산포 테스트는 실제로 * 유용 *합니까?
응답 변수의 분산을 제한하는 모델을 사용할 때마다 GLM에서 '과도 분산'현상이 발생하며 데이터는 모델 제한이 허용하는 것보다 큰 분산을 나타냅니다. 이것은 Poisson GLM을 사용하여 카운트 데이터를 모델링 할 때 일반적으로 발생하며 잘 알려진 테스트로 진단 할 수 있습니다. 검정 결과 과대 산포의 통계적으로 유의미한 증거가있는 경우, 분산 모형을 사용하여 원래 모형에서 …

2
과대 산포를 갖는 포아송 분포 모델링
Poisson 분포를 따를 것으로 예상되는 데이터 세트가 있지만 약 3 배 정도 과대 산포되어 있습니다. 현재 R의 다음 코드와 같은 것을 사용하여이과 분산을 모델링하고 있습니다. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist + ((rawDist-med)*3) 시각적으로 이것은 경험적 데이터에 매우 잘 맞는 …

2
로지스틱 회귀 분석의 과대 산포
로지스틱 회귀 분석의 과대 산포 개념을 다루려고합니다. 과분 산은 반응 변수의 분산이 이항 분포에서 예상되는 것보다 클 때 관찰됩니다. 그러나 이항 변수에 두 개의 값 (1/0) 만있을 수있는 경우 어떻게 평균과 분산을 가질 수 있습니까? 나는 x 번의 Bernoulli 시행에서 성공의 평균과 분산을 계산하는 것이 좋습니다. 그러나 두 가지 값만 …

1
포아송 회귀 분석에서과 분산을 다루는 방법 : 준우도, 음성 이항 GLM 또는 주제 수준의 랜덤 효과?
Poisson 반응 변수의 과대 산포 및 모든 고정 효과 시작 모델을 다루는 세 가지 제안을 살펴 보았습니다. 유사 모델을 사용하십시오. 음 이항 GLM을 사용하십시오. 피사체 수준의 임의 효과가 혼합 된 모델을 사용하십시오. 그러나 실제로 어떤 것을 선택해야하며 왜 그런가? 이 중에서 실제 기준이 있습니까?

1
포아송 대 준-포아송 모형에서 추정 된 동일한 계수
보험 환경에서 클레임 수 데이터를 모델링 할 때 Poisson으로 시작했지만 과대 산포가 나타났습니다. Quasi-Poisson은 기본 Poisson보다 더 큰 평균-분산 관계를 더 잘 모델링했지만 계수가 Poisson과 Quasi-Poisson 모델에서 동일하다는 것을 알았습니다. 이것이 오류가 아닌 경우 왜 이런 일이 발생합니까? Poisson보다 Quasi-Poisson을 사용하면 어떤 이점이 있습니까? 참고 사항 : 근본적인 손실은 초과 …

1
오프셋이있는 포아송 랜덤 효과 모델의 과대 산포 및 모델링 대안
개체 내 실험을 사용하여 실험 연구의 카운트 데이터를 모델링 할 때 여러 가지 실용적인 질문에 부딪 쳤습니다. 실험, 데이터 및 지금까지 수행 한 작업에 대해 간단히 설명하고 질문을합니다. 응답자의 샘플에 4 개의 다른 영화가 순서대로 표시되었습니다. 각 영화가 끝난 후 인터뷰를 진행하여 RQ에 관심이있는 특정 진술 (예측 카운트 변수)의 발생 …

2
R에서 lmer ()를 사용하여 Poisson GLMM에서과 분산을 테스트하는 방법은 무엇입니까?
다음과 같은 모델이 있습니다. > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... 이것은 요약 출력입니다. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: …

2
카운트 데이터 분산의 파라 메트릭 모델링
일부 데이터를 모델링하려고하는데 어떤 유형의 모델을 사용할 수 있는지 잘 모르겠습니다. 카운트 데이터가 있고 데이터의 평균과 분산 모두에 대한 모수 추정치를 제공하는 모델을 원합니다. 즉, 다양한 예측 요소가 있으며 그룹 평균뿐만 아니라 분산에 영향을 미치는지 확인하고 싶습니다. 분산이 평균과 같기 때문에 포아송 회귀가 작동하지 않는다는 것을 알고 있습니다. 이 가정은 …

1
Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?
GLMM 형식이 있습니다. lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model) 조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.