«standard-error» 태그된 질문

표본에서 계산 된 통계량의 표본 추출 분포의 표준 편차를 나타냅니다. 통계량을 추출한 모집단에 대한 신뢰 구간 또는 가설을 검정 할 때 표준 오차가 종종 필요합니다.




3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
선형 회귀 분석에서 예측 된 값에 대한 신뢰 구간
선형 회귀 분석에서 예측 된 값에 대한 신뢰 구간이 예측 변수의 평균 주변에서 좁고 예측 변수의 최소 및 최대 값 주변에서 뚱뚱한 경향이 있음을 알았습니다. 이것은 다음 4 가지 선형 회귀의 도표에서 볼 수 있습니다. 처음에 이것은 예측 변수의 대부분의 값이 예측 변수의 평균에 집중되어 있기 때문이라고 생각했습니다. 그러나 왼쪽 …

6
R을 사용한 올가미 예측의 표준 오차
예측을 위해 LASSO 모델을 사용하려고하는데 표준 오류를 추정해야합니다. 분명히 누군가가 이미 이것을하기 위해 패키지를 작성했습니다. 그러나 내가 알 수있는 한, LASSO를 사용하여 예측을 수행하는 CRAN의 패키지는 해당 예측에 대한 표준 오류를 반환하지 않습니다. 그래서 내 질문은 : 패키지 또는 일부 R 코드가 LASSO 예측에 대한 표준 오류를 계산할 수 있습니까?

4
이항 랜덤 변수의 표본 평균에 대한 표준 오차
내가 2 개의 결과를 가질 수있는 실험을 실행 중이고 2 개의 결과의 기본 "진정한"분포가 모수 엔nn 및 갖는 이항 분포라고 가정합니다 피pp. B i n o m i a l (n,p)Binomial(n,p){\rm Binomial}(n, p) . 표준 오류를 계산할 수 있습니다. 에스이자형엑스= σ엑스엔√SEX=σXnSE_X = \frac{\sigma_X}{\sqrt{n}} 의 변화의 형태로부터 B i n o …

1
분위수 회귀 : 표준 오류는 무엇입니까?
quantreg 비네팅 의 summary.rq기능 은 Quantile 회귀 계수의 표준 오차 추정에 대한 다양한 선택을 제공합니다. 이들 각각이 최적 / 바람직하게되는 특별한 시나리오는 무엇입니까? Koenker (1994)에 설명 된대로 순위 테스트를 반전하여 추정 된 매개 변수에 대한 신뢰 구간을 생성하는 "순위". 기본 옵션은 오류가 iid 인 것으로 가정하고 iid = FALSE 옵션은 …

3
잔차 표준 오차는 무엇입니까?
R에서 다중 회귀 모델을 실행할 때 출력 중 하나는 자유도 95,161에서 0.0589의 잔류 표준 오차입니다. 표본의 관측치 수와 모형의 변수 수의 차이로 95,161 자유도가 주어진다는 것을 알고 있습니다. 잔차 표준 오차는 무엇입니까?

4
R의 표준 오류 클러스터링 (수동 또는 plm)
표준 오류 "클러스터링"과 R에서 실행하는 방법을 이해하려고합니다 (Stata에서는 사소합니다). RI에서 plm나 자신의 기능을 사용 하거나 작성하는 데 실패했습니다 . 패키지 의 diamonds데이터를 사용하겠습니다 ggplot2. 더미 변수로 고정 효과를 할 수 있습니다 > library(plyr) > library(ggplot2) > library(lmtest) > library(sandwich) > # with dummies to create fixed effects > fe.lsdv <- …

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
부트 스트랩 배포의 평균을보고하지 않는 이유는 무엇입니까?
표준 오류를 얻기 위해 매개 변수를 부트 스트랩하면 매개 변수의 분포를 얻습니다. 왜 우리는 그 분포의 평균을 우리가 얻으려는 모수에 대한 결과 또는 추정치로 사용하지 않습니까? 분포가 실제 분포와 비슷하지 않아야합니까? 그러므로 우리는 "실제"가치의 좋은 추정치를 얻을 수 있을까요? 그러나 샘플에서 얻은 원래 매개 변수를보고합니다. 왜 그런가요? 감사

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …


3
NPS (Net Promoter Score) 결과에서 오차 한계를 어떻게 계산할 수 있습니까?
Wikipedia에서 NPS 계산 방법을 설명하겠습니다 . 순 발기인 점수는 고객에게 0에서 10까지의 평가 척도로 단일 질문을함으로써 얻습니다. 여기서 10은 "매우 가능성이 높고"0은 "아마도 없을 것"입니다. 친구 또는 동료? " 고객의 답변에 따라 고객은 발기인 (9–10 등급), 수동적 (7–8 등급) 및 비도 인 (0–6 등급)의 세 그룹 중 하나로 분류됩니다. 그런 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.