통계 및 빅 데이터 paired-comparisons

5

예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

lmer 모델의 효과 반복 계산

방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

5

교차 실험 (페어링) 실험에 대한 오차 막대를 표시하는 방법

다음 시나리오는 플롯 생성자로 조사자 (I), 검토 자 / 편집자 (CRAN과 관련이없는 R) 및 나 (M)의 트리오에서 가장 자주 묻는 질문이되었습니다. 우리는 (R)이 전형적인 의료 대장 검토 자라고 가정 할 수 있으며, 각 플롯에는 오류 막대가 있어야한다는 것을 알고 있어야합니다. 그렇지 않으면 잘못됩니다. 통계 검토자가 참여하면 문제는 훨씬 덜 중요합니다. …

19 data-visualization standard-error paired-comparisons paired-data crossover-study

4

반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.

caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

3

피구 팀이 플레이어의 승리 기록을 바탕으로 이길 확률을 어떻게 예측할 수 있습니까?

세계에 80 명의 피구 선수가 있다고 상상해보십시오. 그들 각각은 다른 79 명의 플레이어와 무작위로 무작위로 수천 개의 피구 게임을했습니다. 이것은 팀이없는 세계입니다 (예를 들어, 모든 플레이어는 각 팀마다 게임 초안을받을 수 있습니다). 각 플레이어의 이전 승률을 알고 있습니다 (예 : 하나는 모든 이전 게임의 46 %를, 다른 하나는 그의 모든 …

13 probability games paired-comparisons odds

2

평균 차이와 평균 차이

두 개의 독립적 인 표본 수단을 연구 할 때 "두 수단의 차이"를보고 있다고 들었습니다. 이는 모집단 1 에서 평균을 ( ) 모집단 2에서 평균을 빼는 것을 의미합니다 ( ). (그래서, 우리의 "두 가지 방법의 차이는" - ).와이¯1와이¯1\bar y_1와이¯2와이¯2\bar y_2와이¯1와이¯1\bar y_1와이¯2와이¯2\bar y_2 쌍을 이룬 표본을 연구 할 때 우리는 "평균 차이", …

11 paired-comparisons paired-data mean

«paired-comparisons» 태그된 질문