효과 크기가 아닌 설명 통계는 무엇입니까?


12

위키 백과 는 말합니다

효과 크기는 현상의 강도 또는 해당 수량의 샘플 기반 추정치입니다. 데이터에서 계산 된 효과 크기는 데이터의 겉보기 관계가 모집단의 실제 관계를 반영하는지 여부에 대한 진술없이 관계의 추정 된 크기를 전달하는 설명 통계량입니다.

그것을 더 잘 이해하기 위해 그래프와 플롯을 제외하고 설명 통계가 효과 크기가 아닌 것이 무엇인지 궁금했습니다.


그래프와 플롯은 실제로 효과 크기 측정 값보다 더 직관적 인 방식으로 효과 크기를 측정하는 데 유용 할 수 있습니다. 실제로 일부 측정에서 두 그룹 사이의 겹침을 경우 (대략 작은 d에 해당 ), 유의미한 차이가 한 그룹의 구성원이 다른 그룹의 구성원보다 점수가 낮다는 것을 의미하지는 않습니다. 등
갈라

답변:


18

효과 크기

  • 일반적인 표준화 된 효과 크기는 일반적으로 관계 또는 효과의 양 또는 정도를 정량화합니다. 가장 일반적인 효과 크기 측정 값은 cohen 's d, Pearson 's r 및 승산 비 (특히 이진 예측 변수의 경우)입니다.
  • 덜 일반적인 효과 크기 측정 :즉, 표준화 및 비표준 효과 크기 측정을 할 수 있습니다. 관계의 정도를 전달하고 표본 크기에 의해 특별히 오염되지 않은 통계는 아마도 효과 크기 측정 일 것입니다. 따라서 베타 계수, R- 제곱, 공분산, 그룹 간의 원시 평균 차이 등은 모두 효과의 정도를 포착합니다. 즉, 일부 연구자들은 효과 크기 측정을 다소 맹목적으로 적용하고 더 넓은 목표는 독자에게 효과의 정도를 제공하는 것임을 잊어 버렸습니다. 따라서 그들은 종종 평균 차이 또는 원시 회귀 계수와 같은 측정 값이 어떤 의미에서는 효과 크기 측정 값임을 인식하지 못합니다. 효과 크기를 맹목적으로 사용하는 또 다른 예는 직관적 인 해석은 없지만 일부 교과서에서 권장 한 효과 크기 측정을 사용하는 것입니다.

영향을받지 않는 크기 :

  • 대부분의 테스트 통계 는 효과 크기가 아닙니다. 예를 들어, 카이-제곱 검정, t- 검정, z- 검정, F- 검정. 모집단 효과의 크기가 증가하고 표본 크기가 증가함에 따라 더 커집니다. 연구자들은 효과 크기가 얼마나 큰지보다는 테스트 통계가 얼마나 큰지에 너무 많은 초점을 맞추기 때문에 많은 측면에서 효과 크기의 전체 언어가 최근 몇 년 동안 강조되었습니다. 작은 효과라도 통계적으로 유의할 수있는 경우 샘플 크기가 큰 경우에 특히 중요합니다.
  • 대부분의 일 변량 통계량 은 효과 크기가 아닙니다. 대부분의 경우 효과 크기는 적어도 두 변수 간의 관계에 관한 것입니다. 따라서 표본 평균, 표준 편차, 왜곡, 첨도, 최소, 최대 등은 효과 크기 측정 값이 아닙니다.
  • 관계의 정도와 관련 이없는 통계 는 효과 크기 측정이 아닙니다. 예를 들어, 다변량 정규성, 행렬의 고유 값 등의 테스트는 일반적으로 단어의 일반적인 의미에서 효과를 정량화하는 데 직접적인 목적이 아닙니다.

더 넓은 고려 사항

  • 스케일링 고려 사항 : 효과 크기 측정치로서 통계의 유용성은 주로 효과의 크기를 전달하는 기능과 관련이 있습니다. 때때로 이것은 익숙한 표준화 된 효과 측정법 (예 : cohen 's d)을 사용하여 달성됩니다. 다른 경우, 변수의 스케일링을 신중하게 고려하면 효과의 크기를보다 명확하게 해석 할 수 있습니다. 예를 들어, 소득 수준에 대한 훈련 프로그램을 조사한 연구가 있다고 가정 해 봅시다. 나는 훈련 프로그램이 .2 표준 편차만큼 소득을 증가 시켰다고보고하거나 프로그램이 $ 3,500 미국 달러만큼 소득을 증가 시켰다고 말할 수 있습니다. 둘 다 유용합니다. 둘 다 효과 크기 측정입니다. 첫 번째는 표준화 (cohen 's d)이고 두 번째는 비 표준화 (raw group 평균 차이)입니다.
  • 효과 크기 추정의 정밀도 : 종종 효과 크기 측정의 샘플 추정치 (예 : cohen 's d, pearson 's r 등)를 추출합니다. 이 맥락은 효과 크기 측정과 유의성 테스트의 대조로 이어질 수 있습니다. 그럼에도 불구하고, 목표는 여전히 인구 효과 규모를 정확하고 편견없이 추정하는 것이어야합니다. 빈번한 관점에서, 효과 크기 주변의 신뢰 구간은 정확한 추정치를 제공합니다. 베이지안 관점에서, 효과 크기에는 후방 밀도가 있습니다. 대부분의 경우 편향되지 않은 효과 크기 측정을 사용하도록주의를 기울여야합니다.

1
(+1) 좋은 대답입니다.
chl

세 번째이자 마지막 요점은 Wikipedia 기사의 저자가 어디에서 왔는지 설명합니다. 심리학에 중점을 둔 점은 효과 크기를 다른 기술 통계와 대조하는 것이 아니라 테스트 통계 및 p- 값 (즉, 추론 통계)과 대조하는 것이 아니라 효과 크기 측정이 샘플링 변동성에 대해 아무 말도하지 않는다는 점을 강조하는 것입니다.
Gala

좋은 답변 주셔서 감사합니다. 그래도 질문이 있습니다. 신뢰 구간이 샘플 크기와 직접 관련되어 있기 때문에 효과 크기 측정으로 사용할 수 없다는 것을 의미합니까? (신뢰 구간에서 CI의 상한 및 하한이 아닌 유병률, 평균 등에서 더하거나 뺀 값을 의미합니다).
Vic

2
@Vic 효과 크기 측정에 대한 신뢰 구간을 가질 수 있지만 신뢰 구간 자체는 효과 크기가 아닙니다.
Jeromy Anglim

여보, 고마워 이 모든 시간 동안 나는 착각했다. :)
Vic

6

첫째, 효과 크기는 설명뿐만 아니라 추론 적으로 사용될 수 있습니다. r과 OR은 모두 효과 크기이며 반드시 모두 추론 통계에 사용됩니다.

일 변량 통계는 일반적으로 크기에 영향을 미치지 않지만 실제로는 크기에 영향을 미치지 않습니다. 예 : 서로 결혼 한 남녀의 연령을 비교하는 경우 남성의 평균 연령은 효과 크기가 아닙니다 (그런 다음 평균 차이는 하나의 효과 크기 임). 그러나 무언가의 평균이 0인지 확인하려면 평균이 효과 크기가됩니다.

효과를 측정하면 효과 크기입니다!


필자는 @Peter가 사실이라고 생각하지만 효과 크기는 Cohen에 의해 더 좁게 정의 된 용어입니다 : (Mean1-Mean2) / PooledSD. 이것은 통계 용어를 정의하기 위해 공통 단어를 사용하여 차이가 중요하거나 통계적으로 유의 한 것처럼 들립니다.
doug.numbers

2
코헨은 그것을 어떻게 정의합니까? Power Analysis에 관한 그의 책을 의미한다면, 그는 이것을 다른 효과 크기로 변환하는 표준으로 사용한다고 생각합니다. 그러나 그 책에있는 모든 전력 분석표 (그리고 LOT가 있습니다)는 일부 효과 크기를 사용합니다 (모두 다 사용하지는 않습니다)
Peter Flom-Reinstate Monica

1
코헨의 d는 항상 내가 이해 한 방식입니다. en.wikipedia.org/wiki/Effect_size 와 유사합니다 . 그러나 효과 크기로 설명되는 많은 방법이 있습니다.
doug.numbers

4
t- 검정 및 z- 검정은 효과 크기가 아닙니다. 동일한 효과 크기는 다른 샘플 크기에 대해 실질적으로 다른 t 및 z 값을 산출합니다.
Jeromy Anglim

1
@JeromyAnglim이 옳습니다. +1. 내 답변을 편집했습니다
Peter Flom-Reinstate Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.