통계 및 빅 데이터 poisson-distribution

1

카운트를 예측하려는 모델을 교차 검증하고 있습니다. 이진 분류 문제인 경우 접기 AUC를 계산하고이 문제가 회귀 문제인 경우 접기 RMSE 또는 MAE를 계산합니다. 포아송 모델의 경우 표본 외 예측의 "정확도"를 평가하기 위해 어떤 오류 메트릭을 사용할 수 있습니까? 예측이 실제 값을 얼마나 잘 정렬하는지 보여주는 AUC의 포아송 확장이 있습니까? 카운트에 대한 …

29 cross-validation poisson-distribution count-data deviance scoring-rules

3

R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]

캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

29 r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

1

lmer 모델의 효과 반복 계산

방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

3

내 글머 출력에서 '고정 효과의 상관 관계'를 어떻게 해석합니까?

다음과 같은 출력이 있습니다. Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) AIC BIC logLik deviance 4062 4093 -2022 4044 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) 0.82453 0.90804 Number of obs: 239, groups: landscape, 45 Fixed effects: …

26 mixed-model poisson-distribution lme4-nlme

4

이항, 음성 이항 및 포아송 회귀의 차이점

이항, 음 이항 및 포아송 회귀의 차이점과 이러한 회귀가 가장 적합한 상황에 대한 정보를 찾고 있습니다. SPSS에서 수행 할 수있는 테스트 중 어떤 상황이 내 상황에 가장 적합한 지 알려주는 테스트가 있습니까? 또한 회귀 부분에서 볼 수있는 것과 같은 옵션이 없으므로 SPSS에서 포아송 또는 음 이항을 어떻게 실행합니까? 유용한 링크가 …

26 spss references binomial poisson-distribution negative-binomial

2

R의 포아송 분포를 따르는 데이터를 아는 방법?

저 학년생이며 확률 수업을위한 프로젝트가 있습니다. 기본적으로 저는 몇 년 동안 우리나라에 영향을 준 허리케인에 대한 데이터 세트를 가지고 있습니다. 확률 책 (Probability and Statistics with R)에는 데이터가 포아송 분포를 따르는 지 확인하는 방법에 대한 (완료되지 않은) 예가 있습니다. 120 (기준) 122-123 페이지 예) 1- 겹치지 않는 간격의 결과 수는 …

25 r self-study poisson-distribution poisson-process

3

분산되지 않은 카운트 데이터에 적합한 모델은 무엇입니까?

분명히 분산되지 않은 R의 카운트 데이터 를 모델링하려고합니다 (분산 매개 변수 ~ .40). 이것은 glmwith family = poisson또는 negative 이항 ( glm.nb) 모형이 유의하지 않은 이유 일 수 있습니다. 내 데이터의 설명을 볼 때 일반적인 카운트 데이터 왜곡이 없으며 두 실험 조건의 잔차도 균질합니다. 그래서 내 질문은 : 카운트 데이터가 …

24 r poisson-distribution negative-binomial beta-binomial underdispersion

9

카운트 <20 인 카운트 데이터의 시계열

나는 최근 결핵 클리닉에서 일하기 시작했습니다. 우리는 현재 치료중인 결핵 사례 수, 시행되는 검사 횟수 등을 논의하기 위해 정기적으로 회의를합니다.이 수치를 모델링하기 시작하여 무언가가 비정상적인지 아닌지 추측하지 않습니다. 불행히도, 시계열에 대한 교육은 거의 없었으며 대부분의 노출은 매우 지속적인 데이터 (주가) 또는 매우 많은 수의 인플루엔자 모델에 노출되었습니다. 그러나 우리는 다음과 …

23 r time-series poisson-distribution count-data epidemiology

2

두 포아송 랜덤 변수의 비율 분포는 무엇입니까?

임의 변수에 관한 질문이 있습니다. 두 개의 랜덤 변수 와 가 있다고 가정 해 봅시다 . 의 말을하자 포아송 매개 변수와 함께 배포되는 , 및 포아송 매개 변수와 함께 배포되는 .XXXYYYXXXλ1λ1\lambda_1YYYλ2λ2\lambda_2 에서 골절을 구축하고 이를 임의의 변수 , 이것이 어떻게 분포되고 평균은 무엇입니까? 그것은이다 ?X/YX/YX/YZZZλ1/λ2λ1/λ2\lambda_1/\lambda_2

22 random-variable poisson-distribution

3

포아송 회귀 vs 로그 수 최소 제곱 회귀?

포아송 회귀는 로그 링크 기능 이있는 GLM 입니다. 비정규 분산 카운트 데이터를 모델링하는 다른 방법은 로그 (또는 log (1 + count)를 0으로 처리)를 사용하여 사전 처리하는 것입니다. 로그 카운트 반응에 대해 최소 제곱 회귀 분석을 수행하면 포아송 회귀 분석과 관련이 있습니까? 비슷한 현상을 처리 할 수 있습니까?

21 regression poisson-distribution generalized-linear-model

4

연속 데이터를 모델링 할 때 포아송 분포는 어떻게 작동하며 정보 손실이 발생합니까?

한 동료가 불쾌한 이분산성을 가지고 논문에 대한 생물학적 데이터를 분석하고 있습니다 (아래 그림). 그녀는 혼합 모델로 분석하고 있지만 여전히 잔차에 문제가 있습니다. 응답 변수를 로그 변환하면 문제가 해결되고이 질문에 대한 피드백을 바탕으로 적절한 접근 방법 인 것 같습니다. 그러나 원래는 혼합 모델에서 변환 된 변수를 사용하는 데 문제가 있다고 생각했습니다. …

20 mixed-model poisson-distribution biostatistics

4

엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?

정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

4

포아송 랜덤 변수의 반올림 평균 분포는 무엇입니까?

변수 λ 1 , λ 2 , … , λ n 으로 포아송 분포 된 랜덤 변수 X1,X2,…,XnX1,X2,…,XnX_1,X_2,\ldots,X_n 있으면 Y = ⌊ ∑ n i = 1 X i 의 분포는 무엇입니까?λ1,λ2,…,λnλ1,λ2,…,λn\lambda_1, \lambda_2,\ldots, \lambda_nY=⌊∑ni=1Xin⌋Y=⌊∑i=1nXin⌋Y=\left\lfloor\frac{\sum_{i=1}^n X_i}{n}\right\rfloor(즉, 평균의 정수 층)? Poissons의 합계도 Poisson이지만 위의 경우와 동일한 지 여부를 결정할 통계에 대해서는 확신이 …

20 poisson-distribution average

2

음 이항 분포 변수의 차이를 설명하는 분포?

Skellam 분포는 푸 아송 분포를 가진 두 변수 사이의 차이를 설명한다. 음의 이항 분포를 따르는 변수 간의 차이를 설명하는 유사한 분포가 있습니까? 내 데이터는 포아송 프로세스에 의해 생성되지만 상당한 양의 노이즈가 포함되어 분포가 과도하게 분산됩니다. 따라서 음 이항 (NB) 분포로 데이터를 모델링하면 효과적입니다. 이 두 NB 데이터 세트의 차이점을 모델링하려면 …

18 distributions modeling poisson-distribution negative-binomial skellam

2

데이터를 계산하기 위해 불연속 분포를 맞추는 방법은 무엇입니까?

다음과 같은 카운트 데이터 히스토그램이 있습니다. 그리고 나는 이것에 개별 분포를 적용하고 싶습니다. 어떻게해야할지 모르겠습니다. 먼저 히스토그램에 불연속 분포와 같은 불연속 분포를 중첩하여 이산 분포의 모수를 구한 다음 Kolmogorov–Smirnov 검정을 실행하여 p- 값을 확인해야합니까? 이 방법이 올바른지 확실하지 않습니다. 이와 같은 문제를 해결하는 일반적인 방법이 있습니까? 카운트 데이터의 빈도 표입니다. …

17 r poisson-distribution discrete-data computational-statistics negative-binomial

«poisson-distribution» 태그된 질문