«poisson-distribution» 태그된 질문

평균이 분산과 같은 특성을 갖는 음이 아닌 정수에 정의 된 불연속 분포입니다.

3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
포아송과 지수 분포의 관계
포아송 분포의 대기 시간은 매개 변수 람다를 사용한 지수 분포입니다. 그러나 나는 그것을 이해하지 못한다. 포아송은 예를 들어 단위 시간당 도착 수를 모델링합니다. 이것은 지수 분포와 어떤 관련이 있습니까? 시간 단위로 k 도착 확률이 P (k) (poisson으로 모델링 됨)이고 k + 1 확률이 P (k + 1)라고 가정하면 지수 분포는 …

1
푸 아송 회귀 분석에서 계수를 해석하는 방법은 무엇입니까?
푸 아송 회귀 분석에서 주 효과 (더미 코딩 된 요인의 계수)를 해석하려면 어떻게해야합니까? 다음 예제를 가정하십시오. treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, 2, 3), labels …

1
카운트 데이터에 왜 제곱근 변환이 권장됩니까?
카운트 데이터가있을 때 제곱근을 취하는 것이 종종 권장됩니다. (CV에 대한 몇 가지 예는 @HarveyMotulsky의 대답은 여기 또는 @whuber의 대답은 여기를 참조하십시오 .) 반면 포아송으로 분포 된 반응 변수가있는 일반화 된 선형 모형을 피팅 할 때 로그는 정식 링크 입니다. 이것은 응답 데이터의 로그 변환을 수행하는 것과 비슷합니다 (더 정확하게 는 …

2
이항 결과의 상대 위험을 추정하기위한 포아송 회귀
간단한 요약 포아송 회귀 (상대 위험이있는)와 반대로 이진 결과를 가진 코호트 연구에서 로지스틱 회귀 (확률이있는)가 더 일반적으로 사용되는 이유는 무엇입니까? 배경 필자의 경험에 따르면 학부 및 대학원 통계 및 역학 과정은 일반적으로 로지스틱 회귀를 이진 결과로 데이터를 모델링하는 데 사용해야하며 위험 평가는 확률 비율로보고됩니다. 그러나 포아송 회귀 (및 관련 : …


3
로지스틱 회귀 95 % 신뢰 구간을 수동으로 계산하는 것과 R에서 confint () 함수를 사용하는 것 사이에 차이가있는 이유는 무엇입니까?
사랑하는 여러분, 제가 설명 할 수없는 이상한 것을 발견했습니다. 요약 : 로지스틱 회귀 모델에서 신뢰 구간을 계산하는 수동 방법과 R 함수 confint()는 다른 결과를 제공합니다. Hosmer & Lemeshow의 Applied Logistic Regression (2 판)을 진행했습니다. 세 번째 장에는 승산 비와 95 % 신뢰 구간을 계산하는 예가 있습니다. R을 사용하면 모델을 쉽게 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 


4
과도하게 분산 된 포아송 결과를 위해 다단계 모델을 어떻게 적합합니까?
R을 사용하여 Poisson 분포 (과도 분산 포함)와 다중 수준 GLMM을 맞추고 싶습니다. 현재 lme4를 사용 하고 있지만 최근에 quasipoisson가족이 제거 되었음을 알았 습니다. 다른 곳에서는 관측 당 하나의 수준으로 임의의 절편을 추가하여 이항 분포에 대한 추가과 분산을 모델링 할 수 있음을 알았습니다. 포아송 분포에도 적용됩니까? 더 좋은 방법이 있습니까? 추천 …



4
두 포아송 표본의 평균이 같은지 확인
이것은 기본적인 질문이지만 답을 찾을 수 없었습니다. 두 가지 측정이 있습니다 : 시간 t1의 n1 이벤트와 시간 t2의 n2 이벤트, 둘 다 람다 값이 다른 Poisson 프로세스에 의해 생성됩니다. 이것은 실제로 뉴스 기사에서 유래 한 것으로, 본질적으로 이기 때문에 두 가지가 다르다고 주장하지만 주장이 유효한지 확실하지 않습니다. 기간이 악의적으로 선택되지 …


5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
포아송 분포는 정규 분포와 어떻게 다릅니 까?
다음과 같이 포아송 분포를 갖는 벡터를 생성했습니다. x = rpois(1000,10) 를 사용하여 히스토그램을 만들면 hist(x)분포는 익숙한 종 모양의 정규 분포처럼 보입니다. 그러나 Kolmogorov-Smirnoff 테스트 ks.test(x, 'pnorm',10,3)는 분포가 매우 작은 p값 으로 인해 정규 분포와 크게 다릅니다 . 그래서 내 질문은 히스토그램이 정규 분포와 너무 비슷해 보일 때 포아송 분포와 정규 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.