차이는 요약 통계입니다 : Gini 계수 및 표준 편차


12

몇 가지 요약 통계가 있습니다. 분포의 분포를 설명하려는 경우 표준 편차 또는 Gini 계수 등을 사용할 수 있습니다 .

표준 편차는 중심 경향, 즉 평균 편차와 Gini 계수, 분산의 일반적인 측정치를 기반으로한다는 것을 알고 있습니다. 또한 Gini 계수는 하한과 상한을 가지고 있으며 표준 편차는 없습니다 . 이러한 속성을 아는 것이 좋지만 표준 편차가 Gini가 수행 할 수없는 것과 반대의 결과를 줄 수있는 통찰력은 무엇입니까? 두 가지 중 하나를 사용하기로 선택했다면 유익하고 통찰력이있을 때 다른 것을 사용하는 것의 장점은 무엇입니까?


1
당신은 이상한 태그를 선택했습니다. 나는 그들을 편집했다.
amoeba

답변:


8

고려해야 할 두 가지

Gini는 스케일에 독립적이지만 SD는 원래 단위에 있습니다

위와 아래에 경계가 있다고 가정합니다. 절반 측정 값이 각 경계에있는 경우 SD는 최대 값을 사용하지만 Gini가 최대 값을 사용하는 것은 하나의 경계에 있고 나머지는 다른쪽에 있습니다.


메타 분석에서 농도 / 이질성을 설명하기 위해 Gini 사용을 확대 할 수 있다고 생각하십니까? 이질성의 농도를 정량화하는 수단으로서 흥미로울 수있다.
Joe_74

1
효과가 정상이라고 가정하기 때문에 그렇지 않습니다. 그러나 저는이 글에서 주제에 대해 더 많은 논의가 이루어지지 않는다고 생각합니다
mdewey

@mdewey 그 마지막 문장은 통찰력이 있었고 가장 도움이되었습니다. 고마워!
Olivier_s_j 2014 년

@mdewey 나는 이것을 약간의 코드로 테스트했지만, 이것을 어딘가에 게시하는 것이 있습니까? 아니면 증거? (나는 마지막 문장을 참조하고 있습니다)
Olivier_s_j

@Ojtwist Wikipedia 기사 en.wikipedia.org/wiki/Gini_coefficient 가 도움이됩니다.
mdewey

10

Gini 계수는 스케일이 변하지 않으며 제한, 표준 편차가 시프트에 변하지 않고 제한되지 않으므로 직접 비교하기가 어렵습니다. 이제 평균 (변동 계수)으로 나누어 표준 편차의 스케일 불변 버전을 정의 할 수 있습니다.

그러나 Gini 지수는 여전히 값을 기반으로하며, 두 번째는 제곱 된 값을 기반으로하므로 두 번째 지수는 특이 치 (과도하게 낮은 값 또는 높은 값)의 영향을 더 많이받을 것으로 예상 할 수 있습니다. 이것은 소득 불평등 대책 , F De Maio, 2007 에서 찾을 수 있습니다 :

이 소득 불평등 척도는 소득 분포의 표준 편차를 평균으로 나누어 계산합니다. 더 많은 소득 분배는 표준 편차가 더 작습니다. 따라서 CV는 평등 한 사회에서 더 작아 질 것입니다. 가장 단순한 불평등 척도 중 하나 임에도 불구하고 CV의 사용은 공중 보건 문헌에서 상당히 제한적이며 소득 불평등 가설에 대한 연구에서는 다루지 않았습니다. 이는 CV 측정의 중요한 한계 때문일 수 있습니다. (1) Gini 계수와 달리 상한이 없으므로 해석 및 비교가 다소 어렵습니다. 그리고 (2) CV의 두 가지 구성 요소 (평균 및 표준 편차)는 매우 낮은 또는 높은 소득 값에 의해 크게 영향을받을 수 있습니다. 다시 말해,

1(xm)=|xnm|1/2N2(x)1(x)N2(x)

1/2

1/2

따라서 거의 가우스 분포를 특성화하지 않으려면 희소성을 측정하려면 Gini 지수를 사용하십시오. 다른 모델 사이에서 희소성을 높이려면 표준 비율을 사용해보십시오.

추가 강의 : Gini의 평균 차이 : 비정규 분포에 대한 뛰어난 변동성 측정 , Shlomo Yitzhaki, 2003 :

모든 변동성 측정 값 중에서 분산이 가장 많이 사용됩니다. 이 논문은 대안의 변동 지수 인 지니의 평균 차이 (GMD)가 분산과 많은 특성을 공유하지만 정규성을 벗어난 분포의 특성에 대해 더 많은 정보를 제공 할 수 있다고 주장합니다.


1

표준 편차에는 스케일 (예 : ° K, 미터, mmHg, ...)이 있습니다. 보통 이것은 규모에 대한 우리의 판단에 영향을 미칩니다. 따라서 우리는 변동 계수 또는 표준 오차보다 더 나은 (유한 샘플에서) 선호하는 경향이 있습니다.

[0,1]

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.