«prediction» 태그된 질문

통계 모델을 사용하여 알려지지 않은 난수 예측.

1
모형에 척도 데이터가 적합했을 때 예측을하기 위해 새로운 관측치를 축척하는 방법
선형 회귀 모델에 사용하기 위해 데이터 매트릭스를 스케일링하는 개념을 이해합니다. 예를 들어 R에서는 다음을 사용할 수 있습니다. scaled.data <- scale(data, scale=TRUE) 내 유일한 질문은 출력 값을 예측하려는 새로운 관찰에 대해 어떻게 정확하게 스케일링되는 것입니까? 그럴까요 scaled.new <- (new - mean(data)) / std(data)?

1
혼합 효과 모델에 대한 예측 : 임의 효과로 무엇을해야합니까?
이 가상의 데이터 세트를 고려해 봅시다 : set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) lme랜덤 효과 모델로 응답을 모델링하는 데 사용할 수 있습니다 . require(nlme) model …


1
Fisher의 정확한 테스트 및 초기 하 분포
피셔의 정확한 테스트를 더 잘 이해하고 싶기 때문에 f와 m이 남성과 여성에 해당하고 n과 y가 "소다 소비"에 해당하는 다음 장난감 예제를 고안했습니다. > soda_gender f m n 0 5 y 5 0 분명히 이것은 과감한 단순화이지만 컨텍스트가 방해되는 것을 원하지 않았습니다. 여기서 나는 남자들이 음료수를 마시지 않고 여자들은 음료수를 마시고 …

1
캐럿 패키지와 함께 RandomForest의 FinalModel을 사용하여 예측 전에 사전 처리가 필요합니까?
10x10CV로 randomForest 객체를 훈련하기 위해 캐럿 패키지를 사용합니다. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) 그 후, testSet (새 데이터)에서 randomForest를 테스트합니다. RF.testSet$Prediction <- predict(RFFit, newdata=testSet) 혼란 매트릭스는 모델이 그렇게 나쁘지 않다는 것을 보여줍니다. confusionMatrix(data=RF.testSet$Prediction, RF.testSet$Defect) Reference Prediction 0 1 …

1
Netflix가 5 성급 등급 시스템에서 유사 / 싫음 시스템으로 전환하는 이유는 무엇입니까?
Netflix는 사용자가 제출 한 다른 영화 / 쇼의 등급을 기준으로 제안을 사용했습니다. 이 등급 시스템에는 별 5 개가있었습니다. 이제 Netflix를 통해 사용자는 영화 / 쇼를 좋아하거나 싫어함 (thumbs-up / thumbs-down) 할 수 있습니다. 그들은 영화를 평가하는 것이 더 쉽다고 주장합니다. 이 2-way 분류가 5-way 분류 시스템보다 통계적으로 덜 예측 적이 …

1
예측 구간 = 신뢰할 수있는 구간?
예측 간격과 신뢰할 수있는 간격이 동일한 것을 평가하는지 궁금합니다. 예를 들어 선형 회귀 분석을 사용하면 적합치의 예측 구간을 추정 할 때 값이 떨어질 것으로 예상되는 구간 의 한계 를 추정합니다 . 신뢰 구간과 반대로 평균값과 같은 분포 모수에 초점을 맞추지 않고 설명 된 변수가 주어진 X 값에 대해 취할 수있는 …

1
R 신경망-계산은 일정한 대답을합니다
예측 을 위해 R neuralnet패키지 (documentation here ) 를 사용하려고합니다 . 여기 내가하려는 일이 있습니다. library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse = ' + '))) …

1
ABC 모델 선택
Bayes 계수를 사용한 ABC 모델 선택은 요약 통계 사용으로 인한 오류가 있으므로 권장되지 않는 것으로 나타 났습니다. 이 논문의 결론은 Bayes 계수 (알고리즘 2)를 근사화하기 위해 널리 사용되는 방법의 거동에 대한 연구에 의존합니다. 베이 즈 요인이 모델 선택을 수행하는 유일한 방법은 아니라는 것이 잘 알려져 있습니다. 모델의 예측 성능과 같이 …

2
예측 및 공차 구간
예측 및 공차 구간에 대한 몇 가지 질문이 있습니다. 공차 구간의 정의에 먼저 동의합시다. 신뢰 수준, 예를 들어 90 %, 포착 할 모집단의 비율, 99 %, 표본 크기 (예 : 20)가 주어집니다. 확률 분포는 알려져 있습니다. 편의상. 이제 위의 세 가지 숫자 (90 %, 99 % 및 20)와 기본 분포가 …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
R의 각 예측에 대해 회귀에서 신뢰 점수 (임의의 포리스트 / XGBoost 포함)를 계산하는 방법은 무엇입니까?
Random Forests 또는 Extreme Gradient Boosting (XGBoost)과 같은 알고리즘을 사용할 때 각 예측 값에 대한 신뢰 점수를 얻는 방법이 있습니까? 이 신뢰 점수의 범위는 0에서 1까지이며 특정 예측에 대해 내가 얼마나 확신하는지 보여 줍니다 . 인터넷에서 신뢰에 대해 찾은 것에서 일반적으로 간격으로 측정됩니다. 다음은 라이브러리의 confpred함수를 사용하여 계산 된 신뢰 …

1
mgcv gam에서 랜덤 효과로 예측
개별 선박에 대한 간단한 무작위 효과를 모델링하기 위해 mgcv에서 gam을 사용하여 총 어획량을 모델링하는 데 관심이 있습니다 (어업에서 시간이 지남에 따라 반복적으로 이동 함). 저는 98 개의 주제를 가지고 있으므로 임의의 효과를 모델링하기 위해 gamm 대신 gam을 사용할 것이라고 생각했습니다. 내 모델은 : modelGOM <- gam(TotalFish ~ factor(SetYear) + factor(SetMonth) …

2
인과 추론과 예측의 관계는 무엇입니까?
인과 추론과 예측 (분류 및 회귀)의 관계와 차이점은 무엇입니까? 예측 컨텍스트에는 예측 변수 / 입력 변수와 응답 / 출력 변수가 있습니다. 그것은 입력 변수와 출력 변수 사이에 인과 관계가 있다는 것을 의미합니까? 그렇다면 예측은 인과 추론에 속합니까? 내가 올바르게 이해하면, 인과 추론은 다른 임의의 변수가 주어진 한 임의의 변수의 조건부 …

2
표본 외 예측을 개선하지 않는``중요 변수 ''-해석 방법?
많은 사용자에게 매우 기본적이라고 생각되는 질문이 있습니다. 선형 회귀 모델을 사용하여 (i) 여러 설명 변수와 내 응답 변수의 관계를 조사하고 (ii) 설명 변수를 사용하여 내 응답 변수를 예측합니다. 하나의 특정 설명 변수 X가 내 응답 변수에 큰 영향을 미치는 것으로 보입니다. 응답 변수에 대한 표본 외 예측을 목적으로이 설명 변수 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.