«zero-inflation» 태그된 질문

지정된 참조 분포와 비교하여 변수에 과도한 0이 있습니다. 회귀 접근법에는 제로 팽창 모델 및 허들 (2 파트) 모델이 포함됩니다. 카운트 데이터의 경우, 포아송 또는 음 이항 분포를 기반으로 제로 팽창 및 허들 모델이 일반적입니다 (ZIP / ZINB 및 HP / HNB).

4
카운트 회귀에 대한 진단 플롯
결과가 카운트 변수 인 회귀에 대한 가장 유용한 정보는 무엇입니까? 특히 포아송 및 음 이항 모델뿐만 아니라 제로 팽창 및 허들 대응에 관심이 있습니다. 내가 찾은 대부분의 소스는 단순히 이러한 플롯이 어떻게 보이는지에 대한 설명없이 잔차 대 적합치 값을 플로팅합니다. 지혜와 참고 문헌은 크게 감사합니다. 관련이 있는지 묻는 이유에 대한 …


3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
카운트 데이터에 포아송 대 기하 대 음 이항 GLM을 언제 사용해야합니까?
GLM 프레임 워크 내에서 카운트 데이터와 함께 어떤 회귀 유형 (형상, 포아송, 음 이항)을 사용하는 것이 적절할 때 나 자신을 위해 레이아웃하려고합니다 (8 개의 GLM 분포 중 3 개만 카운트 데이터에 사용됩니다. 음의 이항 분포와 포아송 분포 중심을 읽었습니다). 카운트 데이터에 포아송 대 기하 대 음 이항 GLM을 언제 사용해야합니까? …

4
베타 회귀에서 0.1 값 다루기
[0,1]에 베타 회귀 분석으로 분석하려는 데이터가 있습니다. 물론 0,1 값을 수용하려면 무언가를 수행해야합니다. 모델에 맞게 데이터 수정을 싫어합니다. 또한 나는 0과 1 인플레이션이 좋은 생각이라고 생각하지 않습니다.이 경우 0은 매우 작은 양수 값으로 간주해야한다고 생각하기 때문에 (그러나 나는 어떤 값이 적절한 지 정확하게 말하고 싶지 않습니다. .001 및 .999와 같은 …

5
1과 0을 포함한 비율 데이터의 베타 회귀
0과 1 사이의 비율 인 응답 변수가있는 모델을 만들려고하는데 여기에는 꽤 많은 0과 1이 있지만 그 사이의 많은 값이 포함됩니다. 베타 회귀 분석을 시도하고 있습니다. R (betareg)에 대해 찾은 패키지는 0과 1 사이의 값만 허용하지만 0이나 1은 포함하지 않습니다. 이론적으로 베타 분포가 0 또는 1의 값을 처리 할 수 ​​있어야한다는 …

2
베타 회귀 분석이 반응 변수에서 0과 1을 정확히 처리 할 수없는 이유는 무엇입니까?
베타 회귀 (즉, 베타 분포 및 일반적으로 로짓 링크 함수가있는 GLM)는 분수, 비율 또는 확률과 같이 0과 1 사이의 값을 취하는 반응 일명 종속 변수를 처리하는 데 권장됩니다 . 결과에 대한 회귀 (비율 또는 분수) 0과 1 사이 입니다. 그러나 베타 회귀 분석은 응답 변수가 적어도 한 번은 0 또는 …

3
R에서 제로 팽창 된 음 이항 혼합 효과 모델
R에서 0으로 팽창 된 음 이항 혼합 효과 모델 추정을 제공하는 패키지가 있습니까? 그 말은 : pscl 패키지의 zeroinfl 함수에서와 같이 제로 인플레이션에 대한 이항 모델을 지정할 수있는 제로 인플레이션 : zeroinfl (y ~ X | Z, dist = "네 그빈") 여기서 Z는 제로 인플레이션 모델의 공식입니다. 모형의 카운트 부분에 …

1
음이 아닌 제로 팽창 연속 데이터를 모델링하는 방법은 무엇입니까?
현재 family = gaussian0보다 낮은 값을 가질 수 없으며 0으로 팽창하고 연속적 인 생물 다양성의 지표에 선형 모델 ( ) 을 적용하려고합니다 . 값의 범위는 0에서 0.25를 약간 상회합니다. 결과적으로, 내가 제거하지 못한 모델의 잔차에는 분명한 패턴이 있습니다. 누구든지 이것을 해결하는 방법에 대한 아이디어가 있습니까?

3
0으로 덩어리가있는 음이 아닌 데이터 모델 (Tweedie GLM, 0 팽창 GLM 등)이 정확한 0을 예측할 수 있습니까?
Tweedie 분포는 모수 (평균-분산 관계에서 지수)가 1과 2 사이 일 때 0으로 점 질량을 사용하여 치우친 데이터를 모델링 할 수 있습니다 .ppp 유사하게 0 팽창 된 (그렇지 않으면 연속적이든 불연속적인) 모델은 많은 수의 0을 가질 수 있습니다. 이러한 종류의 모델로 적합치를 예측하거나 계산할 때 모든 예측값이 0이 아닌 이유를 이해하는 …

3
부풀려진 분포가 없는데 실제로 무엇입니까?
제로 팽창 분포를 이해하기 위해 고심하고 있습니다. 그들은 무엇인가? 점은 무엇인가? 0이 많은 데이터가있는 경우 로지스틱 회귀에 적합하고 먼저 0의 확률을 계산 한 다음 모든 0을 제거한 다음 선택한 분포 (예 : 포아송)를 사용하여 정기적 회귀에 적합합니다. 그런 다음 누군가 나에게 "이봐, 제로 팽창 분포를 사용하십시오."라고 말했지만 그것을 찾으면 위에서 …

1
제로 팽창 된 포아송 회귀
가정 독립적이며Y=(Y1,…,Yn)′Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! } 또한 가정 파라미터 및 P = ( P 1 , ... , P는 N을 ) 충족λ=(λ1,…,λn)′λ=(λ1,…,λn)′\mathbf{\lambda} …

1
ZINB 또는 다른 효과가 혼합 된 카운트 데이터에 적합한 모델을 찾는 데 어려움이 있습니까?
나는 고독한 꿀벌 풍부도에 대해 매우 작은 데이터 세트를 가지고 있는데, 분석하는데 문제가 있습니다. 그것은 계수 데이터이며, 거의 모든 계수는 다른 처리에서 대부분의 0으로 처리됩니다. 6 개의 사이트 중 2 개에 각각 하나씩 두 개의 매우 높은 값이 있으므로 카운트 분포가 매우 긴 꼬리를 갖습니다. R에서 일하고 있습니다. lme4와 glmmADMB의 …

2
JAGS에서 제로 팽창 포아송을 어떻게 설정합니까?
R과 JAGS에서 제로 팽창 포아송 모델을 설정하려고합니다. 나는 JAGS를 처음 사용하고 있으며이를 수행하는 방법에 대한 지침이 필요하다. 나는 y [i]가 관측 된 변수 인 다음을 시도 해왔다 model { for (i in 1:I) { y.null[i] <- 0 y.pois[i] ~ dpois(mu[i]) pro[i] <- ilogit(theta[i]) x[i] ~ dbern(pro[i]) y[i] <- step(2*x[i]-1)*y.pois[i] + …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.