«prediction» 태그된 질문

통계 모델을 사용하여 알려지지 않은 난수 예측.

1
로지스틱 회귀 문제에 대한 decision_function, predict_proba 및 예측 함수의 차이점은 무엇입니까?
나는 sklearn 문서를 살펴 보았지만 로지스틱 회귀의 맥락에서 이러한 기능의 목적을 이해할 수 없습니다. 들어 decision_function그것이라고 그 초평면과 테스트 인스턴스 사이의 거리. 이 특정 정보는 어떻게 유용합니까? 방법이 어떤 관련이 있습니까 predict및 predict-proba방법?

2
베이지안 선형 회귀 분석의 사후 예측 분포 평가
베이지안 선형 회귀 분석에 대한 사후 예측 분포를 평가하는 방법에 대해 혼란스러워 합니다. 여기 에서 3 페이지에 설명 된 기본 사례를지나 아래에 복사되었습니다. p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y)p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int p(\tilde y \mid \beta, \sigma^2) p(\beta, \sigma^2 \mid y) 기본 사례는이 선형 회귀 모형입니다. y=Xβ+ϵ,y∼N(Xβ,σ2)y=Xβ+ϵ,y∼N(Xβ,σ2) y = X \beta + …

1
교차 검증을 사용할 때 예측 간격 계산
표준 편차 추정치는 다음을 통해 계산됩니까? 에스엔=1엔∑엔나는 = 1(엑스나는−엑스¯¯¯)2−−−−−−−−−−−−−√.에스엔=1엔∑나는=1엔(엑스나는−엑스¯)2. s_N = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}. ( http://en.wikipedia.org/wiki/Standard_deviation#Sample_standard_deviation ) 10 배 교차 검증에서 샘플링 된 예측 정확도에 대해? 각 폴드 사이에서 계산 된 예측 정확도는 트레이닝 세트 사이의 실질적인 오버랩 때문에 (예측 세트는 독립적이지만) 걱정됩니다. 이를 논의하는 모든 자료는 매우 …

1
WinBUGS에서 특정 변수에 대한 예측을 얻는 방법?
저는 WinBUGS의 새로운 사용자이며 귀하의 도움에 대해 한 가지 질문이 있습니다. 다음 코드를 실행 한 후 beta0through 매개 변수 beta4(통계, 밀도)를 얻었지만 코드에서 모델링하도록 h설정 한 마지막 값을 예측하는 방법을 모르겠습니다 NA. 누구든지 힌트를 줄 수 있습니까? 모든 조언을 주시면 감사하겠습니다. model { for(i in 1: N) { CF01[i] ~ …

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
편향-분산 분해 : 예측 된 제곱 예측 오차에 대한 항으로 돌이킬 수없는 오차
Hastie et al. "통계 학습의 요소" (2009)는 데이터 생성 프로세스를 고려합니다 Y=f(X)+εY=f(X)+ε Y = f(X) + \varepsilon 와 E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0 과 Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon}. 이 시점에서 예상되는 제곱 예측 오차의 다음과 같은 바이어스-분산 분해를 제시합니다. x0x0x_0 (p. 223, 공식 7.9) : 오류 (엑스0)= E ( [ y−에프^(엑스0)]2| 엑스=엑스0)= …=σ2ε+편견2(에프^(엑스0) ) + Var (에프^(엑스0) …

2
회귀 결과에 예기치 않은 상한이 있습니다.
균형 점수를 예측하고 여러 가지 회귀 분석 방법을 시도했습니다. 내가 주목 한 것은 예측 값에 일종의 상한이있는 것 같습니다. 즉, 실제 균형은 이지만 내 예측은 약 입니다. 다음 그림은 실제 대 예측 잔액을 보여줍니다 (선형 회귀로 예측 됨).[ 0.0 , 1.0 )[0.0,1.0)[0.0, 1.0)0.80.80.8 다음은 동일한 데이터에 대한 두 가지 분포도입니다. …

3
R을 사용한 능선 회귀에 대한 K- 폴드 또는 홀드 아웃 교차 검증
200 과목과 1000 변수로 내 데이터 예측의 교차 유효성 검사를 진행하고 있습니다. 변수 수 (사용하고 싶습니다)가 샘플 수보다 많기 때문에 능선 회귀에 관심이 있습니다. 그래서 수축 견적 도구를 사용하고 싶습니다. 다음은 예제 데이터로 구성됩니다. #random population of 200 subjects with 1000 variables M <- matrix(rep(0,200*100),200,1000) for (i in 1:200) { …

3
베이지안 예측 분포 이해
Bayes 입문 과정을 진행 중이며 예측 분포를 이해하는 데 어려움이 있습니다. 왜 그것들이 유용하고 그 정의에 익숙한 지 이해하지만 이해하지 못하는 것이 있습니다. 1) 새로운 관측치 벡터에 대한 올바른 예측 분포를 얻는 방법 데이터에 대한 샘플링 모델 와 이전 고 가정 해 봅시다 . 관측 값 가 주어지면 조건에 독립적 …

1
시계열 예측 성능 평가
몇 가지 시간 변수에 대해 훈련 된 Dynamic Naive Bayes Model이 있습니다. 모델의 결과는 P(Event) @ t+1각각의 추정치 t입니다. P(Event)vs 의 도표는 time아래 그림에 나와 있습니다. 이 그림에서 검은 선 은 P(Event)내 모델에서 예측 한대로 나타냅니다 . 수평 적색 라인 이벤트 일어나는의 사전 확률을 나타내고; 그리고 점선 수직선은 시계열에 (오) …

1
일부 입력에 결 측값 (NA)이있는 경우 randomForest (R)로 예측
randomForest새로운 사례의 클래스를 예측하는 응용 프로그램에서 사용하려는 훌륭한 분류 모델이 있습니다. 새 사례에는 필연적으로 누락 된 값이 있습니다. NA에게는 예측이 작동하지 않습니다. 그러면 어떻게해야합니까? data(iris) # create first the new case with missing values na.row<-45 na.col<-c(3,5) case.na<-iris[na.row,] case.na[,na.col]<-NA iris.rf <- randomForest(Species ~ ., data=iris[-na.row,]) # print(iris.rf) myrf.pred <- predict(iris.rf, case.na[-5], …

1
관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?
4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
회귀 모델을 사용하여 예측 : 언제 중지해야합니까?
예측을하기 위해 실험 척도에서 간단한 선형 회귀 모델을 계산했습니다. 사용 가능한 데이터에서 너무 멀리 떨어진 포인트에 대한 예측을 계산해서는 안된다는 것을 읽었습니다. 그러나 얼마나 외삽 할 수 있는지 알 수있는 지침을 찾지 못했습니다. 예를 들어, 50GB의 디스크 크기에 대한 읽기 속도를 계산하면 결과가 실제와 비슷할 것입니다. 100GB, 500GB의 디스크 크기는 …

1
오프셋을 사용하여 GLM 푸 아송 예측
나는 이것이 아마도 기본적인 질문이라는 것을 알고 있습니다 ... 그러나 나는 대답을 찾지 못하는 것 같습니다. Poisson 제품군에 GLM을 적용한 다음 예측을 살펴 보려고했지만 오프셋이 고려되는 것 같습니다. model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003), offset=(log(population)), data=data, subset=28:36, family=poisson()) predict (model_glm, type="response") 요금이 아닌 경우가 있습니다 ... 나는 또한 시도했다 model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003)+ offset(log(population)), data=data, subset=28:36, family=poisson()) 같은 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.