표준 편차 공식에서 표본 개수 "N"에 대해 제곱근을 취하는 이유는 무엇입니까?


9

표준 편차의 매우 기본적인 개념을 이해하려고합니다.

공식σ=i=1n(xiμ)2N

왜 우리가 인구 "N"을 반으로 줄여야 하는지를 이해할 수 없습니다. 즉, 하지 않았을 때 왜 을 취하고 싶 습니까? 그것은 우리가 고려하고있는 인구를 왜곡시키지 않습니까?NN2

수식이 σ=i=1n(xiμ)2N

답변:


10

평균에서 "일반적인"편차를 찾으려고합니다.

분산은 "평균에서 평균 제곱 거리"입니다.

표준 편차는 그것의 제곱근입니다.

그것은 평균과 근의 평균 제곱 편차입니다.

  1. 왜 평균 제곱 편차를 사용합니까? 분산이 흥미로운 이유는 무엇입니까? 무엇보다도 분산 에 대한 기본 사실 때문에 상관되지 않은 변수의 합의 분산이 개별 분산의 합이라는 것입니다. ( 여기 에는 CrossValidated 와 같은 여러 질문이 포함되어 있습니다 .이 편리한 기능은 예를 들어 평균 절대 편차로 공유되지 않습니다.
  2. 왜 그것의 제곱근을 취합니까? 그런 다음 원래 관측치와 동일한 단위로되어 있습니다. RMS 거리와 같이 평균에서 특정 종류의 '일반 거리'를 측정하지만 위의 분산 특성으로 인해 몇 가지 멋진 기능이 있습니다.

7

표준 편차 의 제곱근이다 차이 .

분산은 평균으로부터 데이터의 평균 제곱 거리입니다. 평균은 합계를 합한 항목 수로 나눈 값이므로 분산 공식은 다음과 같습니다. 다시, 표준 편차는 단순히 이것의 제곱근이므로 표준 편차의 공식은 다음과 같습니다. 추가되거나 변경된 내용이 없습니다. 여기에서 가정 또는 분산을 사용하면 분산의 제곱근을 취했습니다 . 표준 편차 바로 그 때문입니다 .

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

이 분산 공식은 불연속 유니폼에만 해당된다는 것을 언급해야 할 수도 있습니다. 그렇지 않으면 표본과 모집단 분산의 차이를 혼동 할 수 있습니다.
Taylor

@ 테일러, 무슨 말인지 모르겠어요. 분산 공식은 분포와 관련이 없습니다.
gung-Monica Monica 복원

(샘플) 분산 공식은 분포와 관련이 없습니다 ( en.wikipedia.org/wiki/Expected_value#Definition )
Taylor

@ 테일러, 난 아직도 당신이 무슨 뜻인지 모르겠어요. 분산 공식 은 분포와 관련이 없습니다. Wikipedia 페이지에서 인용하자면, "임의의 변수 X의 분산은 X의 평균과의 제곱 편차의 예상 값입니다 ... .이 정의는 별개의 연속도 또는 혼합 과정에서 생성되는 임의의 변수를 포함한다. " 공식은 불연속 제복만을위한 것이 아닙니다. Var(X)=E[(Xμ)2]
gung-Monica Monica 복원

네, 맞습니다. 이지만 임의의 변수 대해 가 반드시 같을 필요는 없습니다 . . 첫 번째는 상수이고 두 번째는 임의입니다. 실제로 합계가 지원 또는 샘플 수를 초과하는지 여부는 명확하지 않습니다 . 후자의 경우 를 아는 것이 이상합니다 . 실제로는 드 rare니다. 전자의 경우에는, 예를 들어, 불연속 (합계이므로) 유니폼 (무게가 모두 균일하기 때문에)에만 적용됩니다. μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
Taylor

1

가장 먼저 이해해야 할 것은 표준 편차 (std)가 평균 절대 편차 와 다르다는 것 입니다. 이 두 가지는 데이터에 대한 다른 수학적 속성을 정의합니다.

평균 절대 편차와 달리 표준 편차 (std)는 평균에서 멀리 떨어져있는 값에 더 가중합니다. 이는 차이 값을 제곱하여 수행됩니다.

예를 들어, 다음 네 가지 데이터 요소의 경우 :

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

평균 절대 편차 (AAD) , 및=16/4=4.0

표준 편차 (std) =80/4=20=4.47

데이터에는 평균에서 6 거리 떨어진 두 개의 점과 평균에서 2 거리 떨어진 두 개의 점이 있습니다. 따라서 4.47의 편차는 4보다 의미가 있습니다.

총 관측치는 항상 이므로 std 계산을 위해 다이빙하지 않고 대신 총 분산을 나누고 제곱근을 취하여 원래 데이터와 동일한 단위로 가져옵니다.NNN


0

@Mahesh Subramaniya-이것은 단지 수학적인 비틀기 입니다. 우리는 같은 원래의 값이 있으면 . 이 두 방정식 및 사용하여 동일한 값을 얻을 수 있습니다 .a/b=()da2b=ccb=d

예를 들어 = . 그러나 우리는 마이너스가 아닌 가치만을 원합니다.522.5

이제 입니다. 그리고522=12.512.52=2.5

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.