표준 편차를 어떻게 평가합니까?


15

특정 작업을 수행 할 수있는 능력에 대한 85 명의 응답을 수집했습니다.

응답은 5 점 리 커트 척도에 있습니다.

5 = 매우 좋음, 4 = 좋음, 3 = 평균, 2 = 나쁨, 1 = 매우 나쁨,

평균 점수는 2.8이고 표준 편차는 0.54입니다.

평균 및 표준 편차의 의미를 이해합니다.

내 질문은이 표준 편차가 얼마나 좋은지 또는 나쁜지입니다.

다시 말해 표준 편차 평가에 도움이되는 지침이 있습니까?


SD가 여기서 좋거나 나쁘다는 것은 무엇을 의미합니까?
gung-모니 티 복원

7
다음과 같은 데이터로 작은 SD를 얻는 것은 다소 어렵습니다. 평균 2.8의 경우 SD는 최소한 . (2.8이 반올림 된 값을 나타내더라도 SD는 여전히 0.357을 초과해야합니다.) 0.54의 SD는 2 명 이하 만 5 (21 2와 62 3)로 대답 할 수 있었고 6 명 이하는 대답 할 수 없음을 나타냅니다. 1로 (5 2와 74 3으로). 이것은 규모가 효과적으로 식별되지 않기 때문에이 질문이 아주 적은 정보를 제공 할 수 있음을 시사합니다. 0.2×0.8=0.4
whuber

@whuber 우수한 데이터 포렌식! 그러나 나는 그가 다른 질문들에 대해 평균을 내거나 계산에서 뭔가 잘못했다고 상상할 수 있습니다. 사람들이 실제로 자신의 능력에 대해 이야기 할 때 실제로 그렇게 균일하게 반응했다고 상상하기 어렵습니다.
Erik

답변:


17

표준 편차는 "양호"또는 "나쁨"이 아닙니다. 데이터가 얼마나 널리 퍼져 있는지를 나타냅니다. 때때로 등급 척도에서 우리는 질문 / 평가가 우리가 평가하는 그룹의 범위를 포괄한다는 것을 나타 내기 때문에 광범위한 확산을 원합니다. 다른 경우에는 모든 사람이 "높은"상태를 원하기 때문에 작은 sd를 원합니다.

+2

그래서. 시험의 목적은 무엇입니까? 샘플에 누가 있습니까?


2
(+1) "표준 편차는 '좋은'또는 '나쁜'이 아닙니다."에 약간의 추가 만하면됩니다. 표준 편차가 큰 예측 변수를 갖는 것은 회귀 분석에서 표준과 반비례하기 때문에 "좋은"것일 수 있습니다. 회귀 계수 추정치의 오차. 반면에, 측정의 정확성에 관심이 있다면 큰 표준 편차는 "나쁜"것입니다. 원래 포스터의 관심이 전자에 더 가깝다고 생각하지만 명확하지 않습니다.
매크로

10

짧은 대답, 그것은 설문 조사 데이터에서 예상했던 것보다 훌륭하고 조금 낮습니다. 그러나 아마도 귀하의 비즈니스 스토리는 평균 또는 상위 2 박스 퍼센트에 가깝습니다.

사회 과학 연구의 불연속 척도의 경우 실제로 표준 편차는 평균의 직접 함수입니다. 특히, 5 점 척도에 대한 조사에서 실제 표준 편차가 최대 가능한 변동의 40 % -60 % (여기서는 문서화되지 않음)라는 많은 연구에 대한 경험적 분석을 통해 확인했습니다.

가장 간단한 수준에서 극단을 고려하고 평균이 5.0이라고 상상하십시오. 평균 5의 유일한 방법은 모든 사람이 5에 답하는 것이므로 표준 편차는 0이어야합니다. 반대로 평균이 1.0 인 경우 표준 오차도 0이어야합니다. 따라서 표준 편차는 평균이 주어지면 정확하게 정의됩니다.

이제 회색 영역이 더 많습니다. 사람들이 5.0 또는 1.0으로 대답 할 수 있지만 그 사이에는 아무 것도 대답 할 수 없다고 상상하십시오. 그런 다음 표준 편차는 평균의 정확한 함수입니다.

stdev = sqrt ((5- 평균) * (평균 -1))

경계 스케일의 답에 대한 최대 표준 편차는 스케일 폭의 절반입니다. 여기 sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2입니다.

물론 사람들은 그 사이의 가치에 답할 수 있습니다. 우리 회사의 설문 데이터에 대한 메타 스터디를 통해 실제로 수치 척도의 표준 편차가 최대 값의 40 % -60 % 인 것으로 나타났습니다. 구체적으로 특별히

  • 100 % 포인트 스케일의 경우 40 %
  • 10 포인트 스케일의 경우 50 %
  • 5 포인트 스케일의 경우 60 %
  • 이진 스케일의 경우 100 %

따라서 데이터 세트의 경우 표준 편차 60 % x 2.0 = 1.2를 기대합니다. 0.54를 얻었습니다. 결과가 자체 설명 등급 인 경우 예상했던 것의 약 절반입니다. 기술이 평균보다 복잡한 시험 배터리의 결과를 평가하여 분산이 더 낮습니까?

그러나 실제 이야기는 아마도 다른 작업에 비해 능력이 너무 낮거나 높다는 것입니다. 기술 간의 평균 또는 상위 2 상자 비율을보고하고 그에 대한 분석에 집중하십시오.


-1

데이터가 정규 분포 인 경우 모집단의 위치를 ​​확인할 수 있습니다.

  • 모든 사람의 68 %가 평균 ( 2.26 - 3.34) 의 1 표준 편차 내에 있습니다 .

여기에 이미지 설명을 입력하십시오

  • 모든 사람의 95 %는 평균 ( 1.72 - 3.88) 의 2 표준 편차 내에 있습니다 .

여기에 이미지 설명을 입력하십시오

숫자가 얼마나 "확산"되는지 알려줍니다.


1
이 답변은 정확하지 않기 때문에 공표되지 않았습니다. 적용 할 수없는 경우 대략적인 경험 법 (정확한 것처럼)을 사용합니다. (의 적어도 75 %한다고 답은 체비 쇼프의 불평등의 결론으로 대체하는 경우는 true 것이 관찰 , 응답의 적어도 75 %는 2 나 3 개의있다, 즉, 평균 관찰의 두 표준 편차 내에있는)하지만,이 많은 통찰력을 제공하지 않습니다.
whuber

또한 실제로 정규적으로 분포 된 모집단에 대해서만 적용됩니다. 여기에서 평균 주변의 sd에 의해 주어진 경계와 함께 일반 pdf에 대한 적분을 평가함으로써 임의로 숫자를 정확하게 계산할 수 있습니다. 여기서는 실제로 도움이되지 않습니다.
Douba
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.