통계 및 빅 데이터 chi-squared

1

이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …

10 r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction

1

상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델

예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …

9 machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

1

2 x 2를 초과하는 테이블에 대한 독립성을위한 카이 제곱 테스트의 대안

클래스를 병합하지 않으려는 경우 2 x 2보다 큰 테이블과 5보다 작은 셀을 가진 범주 형 변수에 대한 카이 제곱 검정의 대안은 무엇입니까?

9 chi-squared fishers-exact

1

연속 변수에 대한 최적의 이산 화법을 찾고 평가하는 방법

연속 변수와 이진 대상 변수 (0 및 1)가있는 데이터 세트가 있습니다. 목표 변수와 관련하여 연속 변수 (로지스틱 회귀 분석)를 불연속 화하고 각 구간의 관측 빈도가 균형을 이루도록 제한해야합니다. Chi Merge, 의사 결정 트리와 같은 기계 학습 알고리즘을 시도했습니다. Chi merge는 각 구간에서 매우 불균형 한 수의 구간을 제공했습니다 (3 개의 …

9 r machine-learning chi-squared discrete-data supervised-learning

1

Excel에서 R의 카이 제곱을 계산하는 이상한 방법

계산한다고 주장하는 Excel 시트를보고 있지만이 방법을 인식하지 못하고 뭔가 빠졌는지 궁금합니다.χ2χ2\chi^2 분석하는 데이터는 다음과 같습니다. +------------------+----------+----------+ | Total Population | Observed | Expected | +------------------+----------+----------+ | 2000 | 42 | 32.5 | | 2000 | 42 | 32.5 | | 2000 | 25 | 32.5 | | 2000 | 21 …

9 r chi-squared excel

1

카이 제곱 검정에 p- 값의 Monte Carlo 시뮬레이션을 적용하는 규칙

chisq.test()R 의 함수에서 Monte Carlo 시뮬레이션의 사용을 이해하고 싶습니다 . 128 레벨 / 클래스를 가진 질적 변수가 있습니다. 샘플 크기는 26입니다 (더 많은 "개체"를 샘플링 할 수 없었습니다). 분명히, 나는 "개인"이 0 인 레벨을 가질 것입니다. 그러나 사실 나는 가능한 127 개 중에서 매우 적은 수의 클래스 만 가지고 있다는 …

9 r chi-squared monte-carlo

2

Benjamini-Hochberg 의존성 가정이 정당화 되었습니까?

약 50 가지 변수와 관련하여 세 모집단 간의 중요한 차이를 테스트하는 데이터 세트가 있습니다. 나는 Kruskal-Wallis 검정을 사용하고 중첩 GLM 모형 적합 (인구가 독립적 인 변수가 있거나없는)의 우도 비 검정을 사용하여이를 수행합니다. 결과적으로 Kruskal-Wallis 의 목록이 있고 LRT 비교에서 Chi square 이라고 생각 합니다.피피p피피p 50 가지가 넘는 다른 테스트가 있기 …

9 chi-squared multiple-comparisons likelihood-ratio kruskal-wallis false-discovery-rate

1

관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?

4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

4

2 X 3 테이블에서 다중 사후 카이-제곱 테스트를 수행하는 방법은 무엇입니까?

내 데이터 세트는 해안, 미드 채널 및 해양의 세 가지 사이트 유형에서 유기체의 총 사망률 또는 생존율로 구성됩니다. 아래 표의 숫자는 사이트 수를 나타냅니다. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 100 % 사망률이 발생한 사이트 수가 사이트 유형에 따라 중요한지 알고 싶습니다. 2 …

9 logistic multiple-comparisons chi-squared r text-mining clustering classification feature-selection unsupervised-learning time-series references mode hypothesis-testing confidence-interval bootstrap normal-distribution order-statistics correlation statistical-significance spss bayesian beta-binomial

2

데이터에 대한 ROC 곡선 계산

그래서, 나는 16 개의 시험을 가지고 있는데, 여기에서 Hamming Distance를 사용하여 생체 특성으로부터 사람을 인증하려고합니다. 임계 값이 3.5로 설정되었습니다. 내 데이터는 다음과 같으며 1 번 시험 만 참 긍정입니다. Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 …

9 mathematical-statistics roc classification cross-validation pac-learning r anova survival hazard machine-learning data-mining hypothesis-testing regression random-variable non-independent normal-distribution approximation central-limit-theorem interpolation splines distributions kernel-smoothing r data-visualization ggplot2 distributions binomial random-variable poisson-distribution simulation kalman-filter regression lasso regularization lme4-nlme model-selection aic r mcmc dlm particle-filter r panel-data multilevel-analysis model-selection entropy graphical-model r distributions quantiles qq-plot svm matlab regression lasso regularization entropy inference r distributions dataset algorithms matrix-decomposition regression modeling interaction regularization expected-value exponential gamma-distribution mcmc gibbs probability self-study normality-assumption naive-bayes bayes-optimal-classifier standard-deviation classification optimization control-chart engineering-statistics regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

2

2 x 2 비 상표에 대한 Yates 연속성 수정

2 x 2 비상 테이블의 Yates 연속성 수정에 대한 필드의 사람들로부터 입력을 수집하고 싶습니다. Wikipedia 기사 는 너무 멀리 조정되어 제한된 의미로만 사용된다고 언급했습니다. 여기에 관련 게시물이 훨씬 더 통찰력을 제공하지 않습니다. 이 테스트를 정기적으로 사용하는 사람들에게 당신의 생각은 어떻습니까? 수정을 사용하는 것이 좋습니까? 그리고 95 % 신뢰 수준에서 다른 …

9 categorical-data chi-squared yates-correction

2

여러 비율을 비교하기 위해 Marascuilo 절차를 사용한 사람이 있습니까?

여기에 설명 된 Marascuilo 절차 는 전체 카이-제곱 검정에서 null을 거부 한 후 서로 다른 특정 비율을 테스트하려는 경우 비율에 대한 다중 비교 문제를 해결하는 테스트 인 것 같습니다. 그러나 나는이 테스트에 익숙하지 않습니다. 그래서 내 질문 : 이 테스트를 사용할 때 어떤 뉘앙스 (있는 경우)에 대해 걱정해야합니까? 나는 같은 …

9 multiple-comparisons chi-squared

«chi-squared» 태그된 질문