이것은 오래된 질문이지만 실제로 받아 들여진 대답은 정확하지 않습니다. 사용자는 평균 및 표준 편차가 이미 매월 계산 된 12 개월 데이터에 대한 표준 편차를 계산하려고합니다. 각 달의 표본 수가 같다고 가정하면 각 달의 데이터에서 연도에 대한 표본 평균 및 분산을 계산할 수 있습니다. 간단히하기 위해 두 개의 데이터 세트가 있다고 가정하십시오.
X={x1,....xN}
Y={y1,....,yN}
표본 평균 및 표본 분산의 알려진 값은 , , , 입니다.μxμyσ2xσ2y
이제 동일한 추정치를 계산하려고합니다.
Z={x1,....,xN,y1,...,yN} .
고려하는 것이 , 같이 계산된다 :μxσ2x
μx=∑Ni=1xiN
σ2x=∑Ni=1x2iN−μ2x
총 집합에 대한 평균 및 분산을 추정하려면 다음을 계산해야합니다.
μz=∑Ni=1xi+∑Ni=1yi2N=(μx+μy)/2
σ2z=∑Ni=1x2i+∑Ni=1y2i2N−μ2z
σ2z=12(∑Ni=1x2iN−μ2x+∑Ni=1y2iN−μ2y)+12(μ2x+μ2y)−(μx+μy2)2
σ2z=12(σ2x+σ2y)+(μx−μy2)2
따라서 각 부분 집합에 대한 분산이 있고 전체 집합에 대한 분산을 원한다면 각 부분 집합의 평균이 동일한 경우 각 부분 집합의 분산을 평균 할 수 있습니다. 그렇지 않으면 각 부분 집합의 평균 분산을 추가해야합니다.
상반기 동안 우리는 하루에 정확히 1000MWh를 생산하고 초반에는 하루에 2000MWh를 생산한다고 가정 해 봅시다. 그런 다음 상반기와 초반 에너지 생산의 평균 및 분산은 평균에 대해 1000 및 2000이고 양 절반에 대한 분산은 0입니다. 이제 우리가 관심을 가질만한 두 가지가 있습니다.
1- 우리는 일년 내내 에너지 생산의 분산을 계산하려고합니다 . 그런 다음 두 분산을 평균하여 0에 도달합니다. 이는 일년 내내 하루의 에너지가 일정하지 않기 때문에 정확하지 않습니다. 이 경우 각 부분 집합에서 모든 평균의 분산을 추가해야합니다. 수학적으로이 경우 임의의 관심 변수는 매일 에너지 생산입니다. 서브 세트에 대한 샘플 통계가 있으며 더 긴 시간에 걸쳐 샘플 통계를 계산하려고합니다.
2- 우리는 매년 에너지 생산의 분산을 계산하려고합니다. 즉, 우리는 1 년에서 다른 해로 얼마나 많은 에너지 생산이 변화하는지에 관심이 있습니다. 이 경우 평균을 분산하면 평균 1500MHW를 생산하기 때문에 분산의 평균을 구하면 정답이 0이됩니다. 수학적으로이 경우 임의의 관심 변수는 일 년 내내 평균화가 수행되는 일일 평균 에너지 생산량입니다.