«predictive-models» 태그된 질문

예측 모델은 특정 가설을 테스트하거나 현상을 기계적으로 설명하는 모델과 달리 시스템의 다른 관측을 최적으로 예측하는 것이 주된 목적인 통계 모델입니다. 따라서 예측 모델은 해석 가능성에 중점을 두지 않고 성능에 중점을 둡니다.

1
희귀 사건을 어떻게 예측합니까?
보험 위험 예측 모델을 개발 중입니다. 이 모델은 항공사 노쇼 예측, 하드웨어 오류 감지 등과 같은 "희귀 이벤트"입니다. 데이터 세트를 준비 할 때 분류를 적용하려고했지만 부정적인 사례가 많기 때문에 유용한 분류기를 얻을 수 없었습니다. . 고등학교 통계 과정 이외의 통계 및 모델링 데이터에 대한 경험이 많지 않아 다소 혼란 스럽습니다. …

1
스플라인 / 부드러운 회귀로 새 데이터를 예측하는 방법
예측 모델에 스무딩 / 스플라인을 사용할 때 새 데이터에 대한 예측을 수행하는 방법에 대한 개념적인 설명을 누구나 도울 수 있습니까? 예를 들어, 사용하여 작성된 모델 특정 gamboost에서 mboostP 스플라인과, R의 패키지, 어떻게 새로운 데이터 예측을 만들어? 훈련 데이터에서 무엇을 사용합니까? 독립 변수 x의 새로운 값이 있고 y를 예측하고 싶다고 가정하십시오. …

7
모델 구축에서 사회적 차별을 피하십시오
아마존의 최근 채용 스캔들에서 영감을 얻은 질문이 있는데, 채용 과정에서 여성에 대한 차별로 기소되었습니다. 더 많은 정보는 여기에 : Amazon.com Inc의 머신 러닝 전문가는 큰 문제를 발견했습니다. 새로운 채용 엔진은 여성을 좋아하지 않았습니다. 이 팀은 2014 년부터 최고 인재 검색을위한 기계화를 목표로 취업 지원자의 이력서를 검토하기 위해 컴퓨터 프로그램을 구축해 …


3
선형 회귀 모델 또는 비선형 회귀 모델 사이에서 결정
선형 회귀 모델 또는 비선형 회귀 모델을 사용하려면 어떻게 결정해야합니까? 나의 목표는 Y를 예측하는 것입니다. 간단한 및 데이터 집합의 경우 산점도를 그려 어떤 회귀 모델을 사용해야하는지 쉽게 결정할 수 있습니다.y엑스xx와이yy 같은 다중 변이체 경우 및 . 어떤 회귀 모델을 사용해야하는지 어떻게 알 수 있습니까? 즉, 간단한 선형 모델 또는 2 …

1
공간 데이터에 적합한 분포
mathoverflow에서 내 질문을 교차 게시 하여 통계 관련 도움말을 찾으십시오. 음수가 아닌 값으로 2 차원으로 훌륭하게 투영되는 데이터를 생성하는 물리적 프로세스를 연구하고 있습니다. 각 프로세스에는 - 포인트 의 (투영 된) 트랙이 있습니다 (아래 이미지 참조).엑스엑스x와이와이y 샘플 트랙은 파란색이며, 귀찮은 유형의 트랙은 녹색으로 손으로 그려졌으며 관심 영역은 빨간색으로 그려졌습니다. 각 트랙은 …

1
Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?
GLMM 형식이 있습니다. lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model) 조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
이항 반응과 연속 반응을 결합하는 가장 좋은 방법
수금 대행사의 지불 금액을 예측하는 가장 좋은 방법을 찾으려고합니다. 지불이 이루어진 경우 종속 변수는 0이 아닙니다. 이해할 수 있듯이 대부분의 사람들이 빚을 갚을 수 없거나 갚을 수 없기 때문에 압도적 인 0이 있습니다. 부채 금액과 지불 가능성 사이에는 매우 강한 음의 상관 관계가 있습니다. 일반적으로, 나는 지불 / 비 지불의 …

3
온라인 데이트 사이트 통계
온라인 데이트 시스템에서 설문 조사 데이터를 사용하여 일치 항목을 찾는 방법이 궁금합니다. 과거 경기 결과 데이터가 있다고 가정합니다 (예 : 1 = 행복한 결혼, 0 = 두 번째 날짜 없음). 다음으로, 그들이 두 가지 선호 질문을 가지고 있다고 가정 해 봅시다. "야외 활동을 얼마나 즐기십니까? (1 = 강하게 싫어함, 5 …


2
표본 외 예측을 개선하지 않는``중요 변수 ''-해석 방법?
많은 사용자에게 매우 기본적이라고 생각되는 질문이 있습니다. 선형 회귀 모델을 사용하여 (i) 여러 설명 변수와 내 응답 변수의 관계를 조사하고 (ii) 설명 변수를 사용하여 내 응답 변수를 예측합니다. 하나의 특정 설명 변수 X가 내 응답 변수에 큰 영향을 미치는 것으로 보입니다. 응답 변수에 대한 표본 외 예측을 목적으로이 설명 변수 …

2
베이지안 선형 회귀 분석의 사후 예측 분포 평가
베이지안 선형 회귀 분석에 대한 사후 예측 분포를 평가하는 방법에 대해 혼란스러워 합니다. 여기 에서 3 페이지에 설명 된 기본 사례를지나 아래에 복사되었습니다. p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y)p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int p(\tilde y \mid \beta, \sigma^2) p(\beta, \sigma^2 \mid y) 기본 사례는이 선형 회귀 모형입니다. y=Xβ+ϵ,y∼N(Xβ,σ2)y=Xβ+ϵ,y∼N(Xβ,σ2) y = X \beta + …

4
R의 이산 시간 이벤트 기록 (생존) 모델
R에 이산 시간 모델을 맞추려고하지만 어떻게 해야할지 모르겠습니다. 종속 변수를 각 시간 관찰마다 하나씩 다른 행 glm으로 구성하고 logit 또는 cloglog 링크와 함께 함수를 사용할 수 있다는 것을 읽었습니다. 이런 의미에서, 나는 세 개의 열이 있습니다 : ID, Event(각 시간 경과시 1 또는 0) 및 Time Elapsed(관측 시작부터 ) 그리고 …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
고차원 데이터 세트에 대한 가우스 프로세스 회귀
누구나 가우시안 프로세스 회귀 (GPR)를 고차원 데이터 세트에 적용한 경험이 있는지 알고 싶었습니다. 다양한 희소 GPR 방법 (예 : 희박 의사 입력 GPR) 중 일부를 조사하여 이상적 특성 선택이 매개 변수 선택 프로세스의 일부인 고차원 데이터 세트에 어떤 효과가 있는지 확인합니다. 시도 할 논문 / 코드 / 또는 다양한 방법에 …

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.