«predictive-models» 태그된 질문

예측 모델은 특정 가설을 테스트하거나 현상을 기계적으로 설명하는 모델과 달리 시스템의 다른 관측을 최적으로 예측하는 것이 주된 목적인 통계 모델입니다. 따라서 예측 모델은 해석 가능성에 중점을 두지 않고 성능에 중점을 둡니다.

15
미국 선거 결과 2016 : 예측 모델에 어떤 문제가 있었습니까?
먼저 그것은 미국 선거인 Brexit 이었다 . 많은 모델 예측이 크게 한계에 이르렀으며 여기서 배울 교훈이 있습니까? 어제 오후 4시 (PST)까지 베팅 시장은 여전히 ​​힐러리 4 대 1을 선호했습니다. 나는 실제 돈을 가지고 베팅 시장이 모든 가능한 예측 모델의 앙상블 역할을해야한다고 생각합니다. 따라서 이러한 모델이 잘 작동하지 않았다고 말할 수는 …



8
기존 변수와 정의 된 상관 관계를 갖는 랜덤 변수 생성
시뮬레이션 연구를 위해 기존 변수 와의 미리 정의 된 (인구) 상관 관계를 나타내는 임의의 변수를 생성해야합니다 .YYY I는 들여다 R패키지 copula와 CDVine소정 의존성 구조 랜덤 변수 분포를 생성 할 수있다. 그러나 결과 변수 중 하나를 기존 변수에 고정 할 수 없습니다. 기존 기능에 대한 아이디어와 링크를 부탁드립니다! 결론 : 서로 …

15
설명 적 모델링과 예측 모델링에 대한 실질적인 생각
지난 4 월에 UMD 수 학부 통계 그룹 세미나 시리즈에서 "설명 또는 예측"이라는 주제의 연설에 참석했습니다. 이 연설은 UMD의 Smith Business School에서 가르치는 Galit Shmueli 교수에 의해 진행되었습니다 . 그녀의 연설은 "IS Research의 예측 대 설명 모델링" 이라는 제목의 논문 과 "설명 또는 예측할 것인가?" 라는 제목의 후속 작업 논문 …

8
테스트 데이터가 교육 데이터로 누출되지 않도록하려면 어떻게해야합니까?
예측 모델을 구축하는 사람이 있지만 적절한 통계 또는 기계 학습 원칙에 정통한 사람이 아니라고 가정합니다. 어쩌면 우리는 그 사람이 배우면서 도움을 줄 수도 있고, 또는 그 사람이 최소한의 지식이 필요한 소프트웨어 패키지를 사용하고있을 수도 있습니다. 이제이 사람은 실제 테스트가 샘플 외부 데이터 의 정확도 (또는 다른 메트릭)에서 온 것임을 잘 …


6
R에서 로지스틱 회귀에 대한 대안
로지스틱 회귀와 동일한 작업을 수행하는 많은 알고리즘을 원합니다. 그것은 설명 변수 (X)가있는 이진 반응 (Y)에 대한 예측을 제공 할 수있는 알고리즘 / 모델입니다. 알고리즘 이름을 지정한 후에 R에서 알고리즘을 구현하는 방법을 보여 주면 기쁠 것입니다. 다른 모델로 업데이트 할 수있는 코드는 다음과 같습니다. set.seed(55) n <- 100 x <- c(rnorm(n), …

5
다중 비교를 위해 다중 회귀 분석에서 p- 값을 조정하는 것이 좋은 생각입니까?
귀하가 서비스에 대한 관련 수요 예측자를 찾으려고하는 사회 과학 연구원 / 경제학자라고 가정 해 봅시다. 수요를 설명하는 2 개의 결과 / 종속 변수가 있습니다 (서비스 예 / 아니오 및 횟수 사용). 이론적으로 수요를 설명 할 수있는 10 개의 예측 변수 / 독립 변수가 있습니다 (예 : 연령, 성별, 소득, 가격, …

5
기계 학습에서 불균형 데이터가 실제로 문제가되는시기는 언제입니까?
로지스틱 회귀 , SVM , 의사 결정 트리 , 배깅 및 기타 여러 가지 유사한 질문을 사용할 때 불균형 데이터에 대한 여러 가지 질문이 이미있었습니다 . 불행히도, 각 질문은 알고리즘에 특정한 것으로 보이며 불균형 데이터를 다루는 일반적인 지침을 찾지 못했습니다. Marc Claesen의 답변 중 하나를 인용 하여 불균형 데이터 처리 …

3
로그 변환 예측 변수 및 / 또는 응답의 해석
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
수동으로 계산 된 가 새 데이터를 테스트하기 위해 randomForest () 와 일치하지 않습니다.
나는 이것이 상당히 구체적인 R질문 이라는 것을 알고 있지만, R ^ 2 설명 된 비율 분산에 대해 R2R2R^2잘못 생각하고있을 수 있습니다 . 간다 R패키지 를 사용하려고 합니다 randomForest. 훈련 데이터와 테스트 데이터가 있습니다. 임의 포리스트 모델에 적합하면이 randomForest기능을 통해 테스트 할 새 테스트 데이터를 입력 할 수 있습니다. 그런 다음이 …

3
로서
TL, DR은 : 그것은 그 표시 반대로 조언을 자주 반복하는, 교차 검증 (LOO-CV)두고 온 아웃 -이며,KKK 와 -fold CVKKK (주름의 수)와 동일한NNN (개수 관찰) 훈련의 -있는 일반화 오류의 수익률 추정치 적어도 어떤을위한 변수KKK , 아닌 대부분의 변수를 특정 가정 안정성 (잘 모르겠어요 모델 / 알고리즘, 데이터 세트, 또는 두 가지 …

2
선형 회귀 분석에서 표준화 된 설명 변수를 사용하는시기와 방법
선형 회귀에 대한 두 가지 간단한 질문이 있습니다. 설명 변수를 표준화하는 것이 언제 권장됩니까? 일단 표준화 된 값으로 평가를 수행하면 새로운 값으로 어떻게 예측할 수 있습니까 (새로운 값을 어떻게 표준화해야합니까)? 일부 참조가 도움이 될 것입니다.

5
"자체를 물리 치는"예측 모델을 처리하는 방법?
저는 주요 소매점의 ML 전문가가 프레젠테이션을보고 있었는데 여기서 재고 부족 이벤트를 예측하는 모델을 개발했습니다. 시간이 지남에 따라 모델이 매우 정확 해 졌다고 가정 해 보자. 즉, 모델이 실제로 제대로 작동하면 품절 이벤트를 예상하고 피할 수 있으며 결국 품절 이벤트가 거의 또는 전혀없는 지점에 도달 할 수 있습니다. 그러나이 경우 모델을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.