«variance» 태그된 질문

평균에서 랜덤 변수의 예상 제곱 편차; 또는 평균에 대한 데이터의 평균 제곱 편차입니다.

3
로서
TL, DR은 : 그것은 그 표시 반대로 조언을 자주 반복하는, 교차 검증 (LOO-CV)두고 온 아웃 -이며,KKK 와 -fold CVKKK (주름의 수)와 동일한NNN (개수 관찰) 훈련의 -있는 일반화 오류의 수익률 추정치 적어도 어떤을위한 변수KKK , 아닌 대부분의 변수를 특정 가정 안정성 (잘 모르겠어요 모델 / 알고리즘, 데이터 세트, 또는 두 가지 …

3
간단한 선형 회귀 분석에서 회귀 계수의 편차 도출
간단한 선형 회귀 분석에서 y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u . 여기서 u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . 추정값을 도출했습니다 : β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , 여기서x¯x¯\bar{x} 및y¯y¯\bar{y} 는xxx와y의 표본 평균입니다.yyy . 지금은의 분산 찾으려면 β 1 . 나는 …

6
공분산 추정량의 분모가 왜 n-1이 아닌 n-2가 아니어야합니까?
(편향되지 않은) 분산 추정기의 분모는 이며, 관측치 가 개이고 하나의 모수 만 추정되기 때문입니다.Nn−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} 같은 토큰으로 두 개의 모수를 추정 할 때 왜 공분산의 분모가 가되지 않아야하는지 궁금합니다 .n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

4
분포가 어떻게 무한 평균과 분산을 가질 수 있습니까?
다음과 같은 예를들 수 있다면 감사하겠습니다. 무한 평균 및 무한 분산을 갖는 분포. 무한 평균 및 유한 분산을 갖는 분포. 유한 평균과 무한 분산을 갖는 분포입니다. 유한 평균과 유한 분산을 갖는 분포. 필자는 Wilmott 포럼 / 웹 사이트 에서 읽고, 인터넷 검색하고 스레드를 읽는 기사에 사용 된 익숙하지 않은 용어 …

5
표본 크기를 늘리면 (샘플링) 분산이 낮아지는 이유는 무엇입니까?
큰 그림: 샘플 크기를 늘리면 실험의 힘이 어떻게 증가하는지 이해하려고합니다. 강사의 슬라이드는 두 가지 정규 분포, 하나는 귀무 가설에 대한 것과 다른 하나는 대립 가설에 대한 것, 그리고 그 사이의 결정 임계 값 c를 사용하여 설명합니다. 그들은 표본 크기가 증가하면 분산이 낮아지고 첨도가 높아져 곡선 아래의 공유 영역이 줄어들어 유형 …

3
로지스틱 회귀 95 % 신뢰 구간을 수동으로 계산하는 것과 R에서 confint () 함수를 사용하는 것 사이에 차이가있는 이유는 무엇입니까?
사랑하는 여러분, 제가 설명 할 수없는 이상한 것을 발견했습니다. 요약 : 로지스틱 회귀 모델에서 신뢰 구간을 계산하는 수동 방법과 R 함수 confint()는 다른 결과를 제공합니다. Hosmer & Lemeshow의 Applied Logistic Regression (2 판)을 진행했습니다. 세 번째 장에는 승산 비와 95 % 신뢰 구간을 계산하는 예가 있습니다. R을 사용하면 모델을 쉽게 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

4
(왜) 과적 합 된 모델이 큰 계수를 갖는 경향이 있습니까?
변수에 대한 계수가 클수록 모델이 해당 차원에서 "스윙"할 수있는 능력이 커지고 잡음에 대한 기회가 증가한다고 생각합니다. 모델의 분산과 큰 계수 사이의 관계에 대한 합리적인 감각을 가지고 있다고 생각하지만 왜 과적 합 모델에서 발생 하는지에 대한 감각은 없습니다 . 이들이 과적 합의 증상이며 계수 수축이 모형의 분산을 줄이는 기술이라고 말하는 것이 …


2
하나의 랜덤 변수 함수의 분산
알려진 분산과 평균을 갖는 임의의 변수 가 있다고 가정 해 봅시다 . 문제는 주어진 함수 f에 대한 의 분산은 무엇인가입니다 . 내가 아는 유일한 일반적인 방법은 델타 방법이지만 근사치 만 제공합니다. 이제 에 관심이 있지만 일반적인 방법을 알고 있으면 좋을 것입니다.f ( X ) f ( x ) = √XXXf(X)f(X)f(X)f(x)=x−−√f(x)=xf(x)=\sqrt{x} …

3
알려진 그룹 분산, 평균 및 표본 크기를 고려하여 둘 이상의 그룹의 풀 분산을 계산하는 방법은 무엇입니까?
요소가 두 그룹 ( 과 ) 으로 나뉘어 있다고 가정 합니다. 첫 번째 그룹의 분산은 이고 두 번째 그룹의 분산은 입니다. 요소 자체는 알 수없는 것으로 가정되지만 및 수단을 알고 있습니다.m+n엠+엔m+nm엠mn엔nσ2mσ엠2\sigma_m^2σ2nσ엔2\sigma^2_nμmμ엠\mu_mμnμ엔\mu_n 결합 분산 을 계산하는 방법이 있습니까?σ2(m+n)σ(엠+엔)2\sigma^2_{(m+n)} 분모가되도록 분산 바이어스 될 필요가 없다 아닌 .(m+n)(엠+엔)(m+n)(m+n−1)(엠+엔−1)(m+n-1)
32 variance  pooling 

1
시계열의 혼합 효과 모델에서 예측 된 값의 합계에 대한 편차
시계열에 대한 예측을 제공하는 혼합 효과 모델 (사실 일반화 첨가제 혼합 모델)이 있습니다. 자기 상관에 대응하기 위해 데이터가 누락되었다는 사실을 감안할 때 corCAR1 모델을 사용합니다. 데이터는 총로드를 제공해야하므로 전체 예측 간격을 합산해야합니다. 그러나 그 총 부하에 대한 표준 오차의 추정치를 얻어야합니다. 모든 예측이 독립적이라면 다음과 같이 쉽게 해결할 수 있습니다. …

2
종속 변수 곱의 편차
종속 변수 곱의 분산에 대한 공식은 무엇입니까? 독립 변수의 경우 공식은 간단합니다. var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y) + {\rm var}(X)E(Y)^2 + {\rm var}(Y)E(X)^2 그러나 상관 변수의 공식은 무엇입니까? 그런데 통계 데이터를 기반으로 상관 관계를 어떻게 찾을 수 있습니까?

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

6
유한 분산을 테스트 하시겠습니까?
표본이 주어진 랜덤 변수의 분산의 유한성 (또는 존재)을 테스트 할 수 있습니까? 널 (null)로서 {분산이 존재하고 유한함} 또는 {분산이 존재하지 않거나 무한함}이 허용됩니다. 철학적으로 (그리고 계산적으로), 유한 분산이없는 모집단과 매우 큰 분산이있는 모집단 (> ) 사이에 차이가 없어야하기 때문에 이것은 매우 이상하게 보입니다 . 해결되었습니다.104001040010^{400} 나에게 제안 된 한 가지 …

4
분포의 불균일성을 어떻게 측정합니까?
내가 실행중인 실험에 대한 분포의 불균일성을 측정하기위한 메트릭을 만들려고합니다. 나는 대부분의 경우 균일하게 분포되어야하는 임의의 변수를 가지고 있으며 변수가 어느 정도의 범위 내에서 균일하게 분포되어 있지 않은 데이터 세트의 예를 식별하고 가능한 정도를 측정하고 싶습니다. 내가 측정하고있는 것의 발생 빈도를 나타내는 10 개의 측정치가있는 각각 3 개의 데이터 시리즈의 예는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.