표준 편차의 매우 기본적인 개념을 이해하려고합니다.
공식
왜 우리가 인구 "N"을 반으로 줄여야 하는지를 이해할 수 없습니다. 즉, 하지 않았을 때 왜 을 취하고 싶 습니까? 그것은 우리가 고려하고있는 인구를 왜곡시키지 않습니까?
수식이
표준 편차의 매우 기본적인 개념을 이해하려고합니다.
공식
왜 우리가 인구 "N"을 반으로 줄여야 하는지를 이해할 수 없습니다. 즉, 하지 않았을 때 왜 을 취하고 싶 습니까? 그것은 우리가 고려하고있는 인구를 왜곡시키지 않습니까?
수식이
답변:
분산은 평균으로부터 데이터의 평균 제곱 거리입니다. 평균은 합계를 합한 항목 수로 나눈 값이므로 분산 공식은 다음과 같습니다.
다시, 표준 편차는 단순히 이것의 제곱근이므로 표준 편차의 공식은 다음과 같습니다.
추가되거나 변경된 내용이 없습니다. 여기에서 가정 또는 분산을 사용하면 분산의 제곱근을 취했습니다 . 표준 편차 가 바로 그 때문입니다 .
가장 먼저 이해해야 할 것은 표준 편차 (std)가 평균 절대 편차 와 다르다는 것 입니다. 이 두 가지는 데이터에 대한 다른 수학적 속성을 정의합니다.
평균 절대 편차와 달리 표준 편차 (std)는 평균에서 멀리 떨어져있는 값에 더 가중합니다. 이는 차이 값을 제곱하여 수행됩니다.
예를 들어, 다음 네 가지 데이터 요소의 경우 :
평균 절대 편차 (AAD) , 및
표준 편차 (std) =
데이터에는 평균에서 6 거리 떨어진 두 개의 점과 평균에서 2 거리 떨어진 두 개의 점이 있습니다. 따라서 4.47의 편차는 4보다 의미가 있습니다.
총 관측치는 항상 이므로 std 계산을 위해 다이빙하지 않고 대신 총 분산을 나누고 제곱근을 취하여 원래 데이터와 동일한 단위로 가져옵니다.