«negative-binomial» 태그된 질문

다음의 수를 모델링하는 불연속 일 변량 분포 Bernoulli(p) 지정된 수의 실패가 발생할 때까지 시험 성공.

4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
카운트 데이터에 대한 음 이항 GLM 대 로그 변환 : 유형 I 오류율 증가
여러분 중 일부는이 멋진 논문을 읽었을 것입니다. O'Hara RB, Kotze DJ (2010) 카운트 데이터를 로그 변환하지 마십시오. 생태와 진화의 방법 1 : 118–122. 톡 . 제 연구 분야 (생태 독성)에서는 제대로 복제되지 않은 실험을 다루고 있으며 GLM은 널리 사용되지 않습니다. 그래서 O'Hara & Kotze (2010)와 비슷한 시뮬레이션을 수행했지만 생태 독성 …

2
음 이항 분포 변수의 차이를 설명하는 분포?
Skellam 분포는 푸 아송 분포를 가진 두 변수 사이의 차이를 설명한다. 음의 이항 분포를 따르는 변수 간의 차이를 설명하는 유사한 분포가 있습니까? 내 데이터는 포아송 프로세스에 의해 생성되지만 상당한 양의 노이즈가 포함되어 분포가 과도하게 분산됩니다. 따라서 음 이항 (NB) 분포로 데이터를 모델링하면 효과적입니다. 이 두 NB 데이터 세트의 차이점을 모델링하려면 …

3
N 성공까지 어떻게 플립을 모델링 할 수 있습니까?
당신과 저는 동전을 뒤집는 게임을하기로 결정했습니다. 총 10 헤드를 뒤집은 첫 번째 플레이어가 게임에서 승리합니다. 당연히 누가 먼저 가야하는지에 대한 논쟁이 있습니다. 이 게임의 시뮬레이션에 따르면 첫 번째로 뒤집는 플레이어는 두 번째로 뒤집는 플레이어보다 6 % 더 많이 이깁니다 (첫 번째 플레이어는 약 53 %의 시간을 이깁니다). 나는 이것을 분석적으로 …

2
불가능한 추정 문제?
질문 음 이항 분포 (NB)의 분산은 항상 평균보다 큽니다. 표본의 평균이 분산보다 큰 경우 최대 가능성 또는 모멘트 추정으로 NB의 모수를 맞추려고하면 실패합니다 (유한 모수를 가진 해는 없습니다). 그러나 NB 분포에서 추출한 표본의 평균이 분산보다 큽니다. 다음은 R의 재현 가능한 예입니다. set.seed(167) x = rnbinom(100, size=3.2, prob=.8); mean(x) # 0.82 …

2
데이터를 계산하기 위해 불연속 분포를 맞추는 방법은 무엇입니까?
다음과 같은 카운트 데이터 히스토그램이 있습니다. 그리고 나는 이것에 개별 분포를 적용하고 싶습니다. 어떻게해야할지 모르겠습니다. 먼저 히스토그램에 불연속 분포와 같은 불연속 분포를 중첩하여 이산 분포의 모수를 구한 다음 Kolmogorov–Smirnov 검정을 실행하여 p- 값을 확인해야합니까? 이 방법이 올바른지 확실하지 않습니다. 이와 같은 문제를 해결하는 일반적인 방법이 있습니까? 카운트 데이터의 빈도 표입니다. …

3
R에서 제로 팽창 된 음 이항 혼합 효과 모델
R에서 0으로 팽창 된 음 이항 혼합 효과 모델 추정을 제공하는 패키지가 있습니까? 그 말은 : pscl 패키지의 zeroinfl 함수에서와 같이 제로 인플레이션에 대한 이항 모델을 지정할 수있는 제로 인플레이션 : zeroinfl (y ~ X | Z, dist = "네 그빈") 여기서 Z는 제로 인플레이션 모델의 공식입니다. 모형의 카운트 부분에 …

3
감마-포아송이 무엇인지에 따라 포아송은 기하 급수적으로 증가합니까?
푸 아송 분포는 단위 시간당 이벤트를 측정 할 수 있으며 모수는 λλ\lambda 입니다. 지수 분포는 매개 변수 1을 사용하여 다음 이벤트까지의 시간을 측정합니다.1λ1λ\frac{1}{\lambda} . 이벤트 또는 시간을 모델링하기 쉬운 지 여부에 따라 하나의 분포를 다른 분포로 변환 할 수 있습니다. 이제 감마-포아송은 더 큰 분산을 갖는 "신축 된"포아송입니다. 와 이블 …

4
DNA 시퀀싱을위한 음 이항 분포 구하기
음의 이항 분포는 생물 정보학에서 카운트 데이터 (특히 주어진 실험으로부터 게놈의 주어진 영역 내에서 예상되는 수의 서열 판독 횟수)에 대한 대중적인 모델이되었다. 설명은 다양합니다. 일부는 이것을 포아송 분포와 같이 작동하지만 추가 모수를 가지므로 평균과 반드시 ​​같지 않은 분산으로 실제 분포를 더 자유롭게 모델링 할 수 있습니다. 일부는 이것을 포아송 분포의 …

4
카운트 데이터에 적합한 모델을 결정하기위한 전략
카운트 데이터와 함께 사용할 모델을 결정하기위한 적절한 전략은 무엇입니까? 나는 다중 레벨 모델로 모델링 해야하는 데이터를 계산 했으며이 사이트에서 버그 또는 MCMCglmm을 통해 가장 좋은 방법이라고 제안했습니다. 그러나 나는 여전히 베이지안 통계에 대해 배우려고 노력하고 있으며, 먼저 데이터를 일반 선형 모델로 맞추고 데이터의 중첩 구조를 무시해야한다고 생각했습니다 (그러므로 기대할 내용에 …

2
포아송 모델의 경우 잔류 이탈도 / df가 ~ 1이어야한다고 가정하면 대략적인 수치는 얼마입니까?
Poisson 모형 적합이 잔차 편차를 자유 도로 나누는 것과 관련하여 과도하게 분산되어 있는지 여부를 확인하기위한 조언을 자주 보았습니다. 결과 비율은 "약 1"이어야합니다. 문제는 우리가 "대략적인"범위에 대해 이야기하는 것입니다. 대체 모델 형태를 고려하기 위해 알람을 설정해야하는 비율은 무엇입니까?


2
발생률 비율의 해석
그래서 저는 랜덤 효과 마이너스 이항 모형에 적합하고 싶습니다. 이러한 모델의 경우 STATA는 지수화 된 계수를 생성 할 수 있습니다. 도움말 파일에 따르면 이러한 계수는 발생률 비율로 해석 될 수 있습니다. 불행히도 나는 영어 원어민이 아니며 발생률 비율이 무엇인지 또는 어떻게 번역 할 수 있는지 이해하지 못합니다. 그래서 제 질문은, …

1
범주 형 데이터를 사용하여 음 이항 GLM에서 .L 및 .Q 출력 해석
방금 음 이항 GLM을 실행했으며 출력입니다. Call: glm.nb(formula = small ~ method + site + depth, data = size.dat, init.theta = 1.080668549, link = log) Deviance Residuals: Min 1Q Median 3Q Max -2.2452 -0.9973 -0.3028 0.3864 1.8727 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.6954 0.1152 14.720 < 2e-16 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.