예, 두 예제 (무가 중 vs 가중)가 동일한 결과를 제공 할 것으로 기대해야합니다.
Wikipedia 기사에서 두 가지 알고리즘을 구현했습니다.
이것은 작동합니다 :
모든 xi 가 동일한 분포에서 도출되고 정수 가중치 wi 가 표본에서 발생 빈도를 나타내는 경우 가중 모집단 분산의 편견 추정기는 다음과 같이 제공됩니다.
s2 =1V1−1∑Ni=1wi(xi−μ∗)2,
그러나이 (분수 가중치 사용)는 저에게 효과적이지 않습니다.
xi1/wi
s2 =V1V21−V2∑Ni=1wi(xi−μ∗)2
나는 여전히 두 번째 방정식이 의도 한대로 작동하지 않는 이유를 조사하고 있습니다.
/ 편집 : 두 번째 방정식이 생각대로 작동하지 않는 이유를 발견했습니다. 두 번째 방정식을 정규화 된 가중치 또는 분산 ( "신뢰성") 가중치가있는 경우에만 사용할 수 있으며 편향되지 않은 경우 두 번째 방정식을 사용할 수 있습니다 "반복"가중치를 사용하면 (관찰이 관찰 된 횟수를 계산하여 수학 연산에서 반복해야 함) 총 관측 수를 계산하는 기능이 상실되므로 보정 계수를 사용할 수 없습니다.
가중 및 비가 중 분산을 사용하여 결과의 차이를 설명합니다. 계산이 편향됩니다.
따라서 편향 가중 분산을 원하면 "반복"가중치 만 사용하고 위에 게시 한 첫 번째 방정식을 사용하십시오. 그것이 가능하지 않으면, 당신은 그것을 도울 수 없습니다.
추가 정보가 필요하면 Wikipedia의 기사도 업데이트했습니다.
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
그리고 편향되지 않은 가중 공분산에 대한 관련 기사 (사실, Polarization Identity 로 인해 동일한 분산 ) :
가중 된 편향되지 않은 표본 공분산에 대한 올바른 방정식