요소가 두 그룹 ( 과 ) 으로 나뉘어 있다고 가정 합니다. 첫 번째 그룹의 분산은 이고 두 번째 그룹의 분산은 입니다. 요소 자체는 알 수없는 것으로 가정되지만 및 수단을 알고 있습니다.
결합 분산 을 계산하는 방법이 있습니까?
분모가되도록 분산 바이어스 될 필요가 없다 아닌 .
요소가 두 그룹 ( 과 ) 으로 나뉘어 있다고 가정 합니다. 첫 번째 그룹의 분산은 이고 두 번째 그룹의 분산은 입니다. 요소 자체는 알 수없는 것으로 가정되지만 및 수단을 알고 있습니다.
결합 분산 을 계산하는 방법이 있습니까?
분모가되도록 분산 바이어스 될 필요가 없다 아닌 .
답변:
평균의 정의를 사용하십시오
및 표본 분산
모든 데이터 x i 의 제곱 의 합 을 찾기 위해 ( 괄호 안의 마지막 용어는 종종 통계 소프트웨어에서 기본적으로 계산되는 편향 분산 추정량입니다 ) . i = 1 , … , n 이 첫 번째 그룹의 요소를 지정하고 i = n + 1 , … , n + m 이 두 번째 그룹의 요소를 지정 하도록 인덱스 i를 정렬합시다 . 그룹으로 제곱합을 나누고 데이터 부분 집합의 분산과 수단으로 두 조각을 다시 표현하십시오.
다른 (알려진) 수량 측면에서 에 대해 대수적으로 해결
물론, 동일한 방법을 사용하여, 도 상기 그룹 수단으로 표현 될 수있다.
익명의 기고자는 표본 평균이 같을 때 ( ) σ 2 m + n 에 대한 해는 가중 평균임을 나타냅니다. 그룹 표본 분산
sqrt(weighted.mean(u^2 + rho^2, n) - weighted.mean(u, n)^2)
여기서 n
, u
및 rho
동일한 길이의 벡터이다. 예 n=c(10, 14, 9)
를 들어 세 가지 샘플의 경우
질문에 사용 된 표기법 대신이 답변에서 표본 평균 및 표본 분산에 표준 표기법을 사용합니다. 표준 표기법을 사용하여 O'Neill (2014) (결과 1) 에서 두 그룹의 풀링 된 표본 분산에 대한 또 다른 공식을 찾을 수 있습니다 .
이 공식은 두 하위 그룹의 기본 표본 평균 및 표본 분산과 직접 작동하며 풀링 된 표본 평균의 중간 계산이 필요하지 않습니다. (연결된 용지의 결과 증명)
예, 두 개 이상의 표본 그룹 각각의 평균, 표본 수 및 분산 또는 표준 편차를 고려하면 결합 된 그룹의 분산 또는 표준 편차를 정확하게 계산할 수 있습니다.
이 웹 페이지는 그 작동 방법과 작동 이유를 설명합니다. 또한 Perl의 소스 코드도 포함합니다 : http://www.burtonsys.com/climate/composite_standard_deviations.html
BTW는 위에 주어진 답변과 달리
예를 들어 R에서 직접 확인하십시오.
> x = rnorm (10,5,2) > x [1] 6.515139 8.273285 2.879483 3.624233 6.199610 3.683164 4.921028 8.084591 [9] 2.974520 6.049962 > 평균 (x) [1] 5.320502 > sd (x) [1] 2.007519 > 합 (x ** 2) [1] 319.3486 > 10 * (평균 (x) ** 2 + sd (x) ** 2) [1] 323.3787
R
숫자 집합의 표준 편차가 아닌 표준 편차의 바이어스되지 않은 추정값을 계산합니다. 예를 들어, 대신에을 sd(c(-1,1))
반환합니다 . 대신에 예제를 사용해야 합니다. "해석1.414214
1
sqrt(9/10)*sd(x)
sd(x)
데이터 의 SD로 "" 데이터 의 평균으로 , BTW 발언이 잘못되었습니다.이를 보여주는 프로그램은 다음과 같습니다.n <- 10; x <- rnorm(n,5,2); m <- mean(x); s <- sd(x) * sqrt((n-1)/n); m2 <- sum(x^2); c(lhs=n * (m^2 + s^2), rhs=m2)