«variance» 태그된 질문

평균에서 랜덤 변수의 예상 제곱 편차; 또는 평균에 대한 데이터의 평균 제곱 편차입니다.

2
* 통계 학습 소개 *에서 * 함수 *의 차이는 무엇을 의미합니까?
pg. 통계 학습 입문의 34 : \newcommand{\Var}{{\rm Var}} 수학적 증명이 책의 범위를 넘어이지만, 예상 시험 MSE는, 주어진 값에 대한 것을 보여 할 수 x0x0x_0 : 항상 세 가지 기본 수량의 합계로 분해 될 수있는 분산 의 f^(x0)f^(x0)\hat{f}(x_0) , 제곱 바이어스 의 f^(x0)f^(x0)\hat{f}(x_0) 에러 조건의 편차 εε\varepsilon . 그건, E(y0−f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ε)E(y0−f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ε) E\left(y_0 …

1
지니 계수 및 오차 한계
각 시점에서 N = 14 카운트의 시계열 데이터가 있으며 각 시점 에서이 추정치에 대한 Gini 계수 및 표준 오류를 계산하려고합니다. 각 시점에서 N = 14 카운트 만 있기 때문에 jackknife 분산을 계산하여 진행했습니다. 즉 톰슨 Ogwang의 식 (7)로부터표준 오차 '지니 인덱스와를 계산하는 편리한 방식'. 여기서G는(N,K는)요소없이 N 값 지니 계수K와 ˉ …

2
부트 스트랩의 장단점
부트 스트랩 개념에 대해 방금 배웠으며, 데이터의 많은 부트 스트랩 샘플을 항상 생성 할 수 있다면 더 많은 "실제"데이터를 얻는 것이 귀찮은 이유는 무엇입니까? 설명이 있다고 생각합니다. 정확한지 알려주십시오. 부트 스트래핑 프로세스는 분산을 줄인다고 생각합니다.하지만 원래 데이터 세트가 BIASED 인 경우 복제본의 수에 관계없이 낮은 분산과 높은 바이어스에 갇힌 것보다 …

2
PCA가 예상의 총 분산을 최대화하는 이유는 무엇입니까?
Christopher Bishop은 자신의 저서 인 Pattern Recognition and Machine Learning 을 통해 데이터가 이전에 선택한 구성 요소에 직교 공간으로 투영 된 후 각 연속 주성분이 투영의 분산을 1 차원으로 최대화한다는 증거를 작성합니다. 다른 사람들도 비슷한 증거를 보여줍니다. 그러나 이는 분산을 최대화한다는 점에서 연속 된 각 구성 요소가 하나의 차원으로 가장 …


5
단어 빈도 데이터의 분산을 측정하는 방법은 무엇입니까?
단어 개수로 구성된 벡터에서 분산 량을 어떻게 정량화 할 수 있습니까? 자주 발생하지 않는 여러 단어가 포함되어 있기 때문에 문서 A에 대해 높은 통계를 찾고 있는데, 자주 발생하는 단어 하나 (또는 ​​몇 단어)가 포함되어 있기 때문에 문서 B에 대해서는 낮습니다. 보다 일반적으로 명목 데이터의 분산 또는 "확산"을 어떻게 측정합니까? 텍스트 …

1
PCA 고유 벡터가 아닌 벡터의 "고유 값"(설명 된 분산의 백분율)을 얻는 방법?
PCA가 제공하는 좌표 공간이 아니라 약간 다른 (회전) 벡터 세트에 대해 데이터 세트의 분산 백분율을 얻는 방법을 이해하고 싶습니다. set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, yy) plot(vecs, xlim = c(-4, 4), ylim = c(-4, 4)) vv <- eigen(cov(vecs))$vectors ee …


3
두 개의 유사한 시계열이 언제 발산하기 시작하는지 확인하기위한 통계 테스트
제목에서와 같이, 나는 두 개의 유사한 시계열 사이의 상당한 차이를 식별하는 데 도움이되는 통계 테스트가 존재하는지 알고 싶습니다. 구체적으로, 아래 그림을 보면, 시간 t1에서, 즉 이들 간의 차이가 커지기 시작할 때 계열이 분기되기 시작한다는 것을 감지하고 싶습니다. 또한 시리즈 간 차이가 중요하지 않은 시점을 감지합니다. 이를 위해 유용한 통계 테스트가 …

1
이 추정기의 분산은 무엇입니까
함수 f의 평균, 즉 의 평균을 추정하고 싶습니다 여기서 와 는 독립적 인 랜덤 변수입니다. 나는 F의 샘플을 가지고 있지만 IID하지 : 대한 IID 샘플이 있습니다 하고 각 있다 에서 샘플 :EX,Y[f(X,Y)]EX,Y[f(X,Y)]E_{X,Y}[f(X,Y)]XXXYYYY1,Y2,…YnY1,Y2,…YnY_1,Y_2,\dots Y_nYiYiY_ininin_iXXXXi,1,Xi,2,…,Xi,niXi,1,Xi,2,…,Xi,niX_{i,1},X_{i,2},\dots, X_{i,n_i} 총 샘플f(X1,1,Y1)…f(X1,n1,Y1)…f(Xi,j,Yi)…f(Xn,nn,Yn)f(X1,1,Y1)…f(X1,n1,Y1)…f(Xi,j,Yi)…f(Xn,nn,Yn)f(X_{1,1},Y_1) \dots f(X_{1,n_1},Y_1 ) \dots f(X_{i,j},Y_i) \dots f(X_{n,n_n},Y_n) 평균을 계산하려면 분명히 그래서 공평 추정기이다. 무엇인지 …

2
정밀도 기반 (즉, 역 분산) ​​가중치가 메타 분석에 필수적인가?
정밀 분석 기반 가중치가 메타 분석의 중심입니까? Borenstein et al. (2009)는 메타 분석이 가능하기 위해서는 다음과 같은 것이 필요하다고 썼다. 연구에 따르면 단일 숫자로 표현할 수있는 포인트 추정치가보고됩니다. 해당 포인트 추정치에 대한 분산을 계산할 수 있습니다. 왜 (2)가 엄격하게 필요한지는 분명하지 않습니다. 그러나 실제로 널리 받아 들여진 메타 분석 방법은 …

3
두 장치의 정밀도를 비교하기위한 통계 테스트
저는 마취 된 환자에서 체온을 정확히 37 도로 유지하도록 설계된 두 개의 온도 조절 장치를 비교하고 있습니다. 이 장치는 두 그룹을 형성하는 500 명의 환자에게 장착되었습니다. 그룹 A (400 명의 환자)-장치 1, 그룹 B (100 명의 환자)-장치 2. 각 환자는 36 시간 동안 1 시간마다 한 번씩 온도를 측정하여 두 …

1
일반화 된 가산 모델에 대한 분산 팽창 계수
선형 회귀에 대한 일반적인 VIF 계산에서 각 독립 / 설명 변수 는 보통 최소 제곱 회귀 분석에서 종속 변수로 처리됩니다. 즉엑스제이엑스제이X_j 엑스제이= β0+ ∑i = 1 , i ≠ j엔β나는엑스나는엑스제이=β0+∑나는=1,나는≠제이엔β나는엑스나는 X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i 값이 각각 저장되는 회귀 및 VIF 의해 결정 n아르 자형2아르 …

2
한 표본 t- 검정에서 분산 추정기에서 표본 평균이 대체되면 어떻게됩니까 ?
귀무 가설이 1- 표본 t- 검정을 가정 합니다. 그런 다음 표본 표준 편차 사용하여 통계는 입니다. 추정 할 때 관측 값을 표본 평균 과 비교합니다 .μ=μ0μ=μ0\mu=\mu_0t=x¯¯¯−μ0s/n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s=1n−1∑ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} 입니다. 그러나 주어진 이 참 이라고 가정 하면 표본 평균 대신 사용하여 표준 편차 를 추정 할 수도 있습니다 .μ0μ0\mu_0s∗s∗s^*μ0μ0\mu_0x¯¯¯x¯\overline{x} s∗=1n−1∑ni=1(xi−μ0)2−−−−−−−−−−−−−−−−√s∗=1n−1∑i=1n(xi−μ0)2s^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\mu_0)^2} …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.