왜 표준 편차를 만들기 위해 분산의 제곱근을 취합니까?


26

다른 곳에서 답변을 받았다면 죄송합니다.

왜 표준 편차를 만들기 위해 분산의 제곱근 을 취하는 지 궁금합니다 . 유용한 가치를 창출하는 제곱근을 취하는 것은 무엇입니까?



2
표준 편차를 유클리드 벡터 표준으로 생각한 다음 분산을 제곱으로 생각하십시오. 분산과 표준 편차에 대한 이러한 정의는 유용한 분석 속성을 갖는 것으로 판명되었습니다.
theideasmith

답변:


44

어떤면에서 이것은 사소한 질문이지만 다른면에서는 실제로 매우 깊습니다!

  • 다른 사람들이 언급했듯이, 제곱근을 취한다는 것은 의 단위가 와 같다는 것을 의미 합니다.Stdev(X)X

  • 제곱근을 취하면 절대적 균질성,절대적 확장 성이 제공 됩니다. 스칼라 및 임의 변수 에 대해 다음을 갖습니다. 절대 동질성표준필수 특성 입니다 . 표준 편차는 가 3 차원의 표준 유클리드 표준 인 것과 유사한 방식으로 표준 (임의의 제로 랜덤 변수의 벡터 공간에서)으로 해석 될 수 있습니다. 공간. 표준 편차는 랜덤 변수와 그 평균 사이의 거리를 측정 한 것입니다.αX

    Stdev[αX]=|α|Stdev[X]
    x2+y2+z2

표준 편차 및 규범L2

유한 치수 케이스 :

에서는 차원 벡터 공간은 일명 표준 유클리드 놈 표준이 정의되어있다 :nL2

x2=ixi2

보다 광범위하게, -norm 는 루트를 사용하여 절대 값을 얻습니다. 동질성 : .p xp=(i|xi|p)1ppαxp=(i|αxi|p)1p=|α|(i|xi|p)1p=|α|xp

가중치가 경우 가중치 합 도 유효한 표준입니다. 또한 가 확률을 나타내고 경우 표준 편차입니다.qiixi2qiqiE[x]ixiqi=0

무한 치수 케이스 :

무한 차원의 힐버트 공간에서 마찬가지로 규범을 정의 할 수 있습니다 .L2

X2=ωX(ω)2dP(ω)

경우 평균 제로 확률 변수이고 확률 측정, 표준 편차는 무엇인가? 그것은 동일합니다 : .XPωX(ω)2dP(ω)

개요:

제곱근을 취한다는 것은 표준 편차가 표준 의 필수 특성 인 절대 균질성을 만족시키는 것을 의미합니다 .

확률 변수의 공간, 이다 내적 내부 제품에 의해 유도되는 표준 . 따라서 표준 편차는 의미없는 랜덤 변수의 표준입니다. 평균 에 .X,Y=E[XY]X2=E[X2]

Stdev[X]=XE[X]2
E[X]X

(기술적 요점 : 는 표준이지만 표준 편차 A에 대한 요구 사항이 있기 때문에 일반적으로 확률 변수를 통해 표준이 아닌 NORMED 벡터 공간 입니다 경우에만, . 0 아무튼의 표준 편차 ' t는 랜덤 변수가 0 요소임을 암시합니다.)E[X2]E[(XE[X])2]x=0x=0


1
이 답변은 실제로 문제의 핵심에 도달하여 현재 받아 들여지는 것보다 유익합니다.
00prometheus

26

차이의 로 정의되는 , X는과 예상 값 사이의 제곱 차의 기대하므로.XV(X)=E(XE(X))2

경우 시간 (초)이며, 초이지만, 인 와 초 후에 다시이다.XXE(X)V(X)seconds2V(X)


아, 알다시피, 분산 계산에서 차이를 제곱 한 결과 스케일 변화를 취소하는 것입니까?
Dave

11
맞습니다 – 그러나 규모가 아닌 치수의 변화 .
Jean-François Corbett

그러나 여기에는 단일 용어가있는 것과 다릅니다. 제 2 제곱 법에 따라 다른 용어보다 더 많거나 적은 단어가 있습니다. 그러나 우리가 제곱근을 취할 때, 우리는 그 차이를 무시하는 것입니다. 우리는 초기 분자를 얻지 못할 것입니다. 각 개별 항의 제곱근을 취하는 것이 낫지 않습니까?
parsecer

샘플을 기반으로 추정치 에 대해 생각하고있는 것 같습니다 . 이 경우, 그렇게하면 차이가 사라집니다. 입니다. V^i=1n(xix¯)=i=1nxii=1nxi=0
HStamper

것을 제외하고 @EricMittman 하지 ,이 경우 당신이 얻을 것 평균 절대 오차를 . a2=|a|a
Dougal

6

간단한 대답은 단위가 평균과 동일한 척도에 있다는 것입니다. 예 : 중고등 학생의 평균은 표준 편차 (SD)가 20cm 인 160cm 인 것으로 추정됩니다. 400cm ^ 2의 편차보다 SD의 변화를 직관적 으로 얻는 것이 직관적으로 쉽습니다.


0

더 간단한 용어로 표준 편차는 평균에 대한 데이터의 확산에 대해 무언가를 나타내는 양수를 제공하도록 설계되었습니다.

평균에서 모든 점의 거리를 합산하면 양의 방향과 음의 방향의 점이 평균으로 다시 돌아가는 경향이있는 방식으로 결합하여 스프레드에 대한 정보를 잃게됩니다. 이것이 우리가 분산을 먼저 측정하여 모든 거리가 제곱을 통해 양수로 유지되고 서로 상쇄되지 않도록하는 이유입니다. 결국 우리는 우리가 시작한 단위를 나타내는 양의 값을 원합니다-이것은 이미 위에서 언급되었습니다-그래서 우리는 양의 제곱근을 취합니다.


-3

지적 게으름으로 인해 계속되는 것은 역사적인 어리 석음입니다. 빼기 부호를 제거하기 위해 평균과의 차이를 제곱하기로했습니다. 그런 다음 제곱근을 취해 평균과 비슷한 규모로 만듭니다.

누군가는 평균으로부터 편차 또는 절대 편차 값을 사용하여 새로운 통계, 컴퓨팅 분산 및 SD를 생성해야합니다. 이것은이 모든 제곱을 없애고 제곱근 사업을 취하게 될 것입니다.


1
우리는 이미 평균 (또는 중앙값) 절대 편차, L1 규범 등의 형태로 그것을 가지고 있습니다. 그러나 기존 방식 주요 장점은 절대 값과 달리 차별화 할 수있어 분석적으로 최소화하고 최대화 할 수 있다는 것입니다.
Matt Krause

1
입장에 대한 실질적인 타당성을 제시하지 않으면, 명확하게 정리 된 수학적 주장을 제공하십시오. 절대 값의 합은 제곱합의 제곱근과 매우 다르게 스케일됩니다. 후자는 극단적 인 가치의 기여를 강조하며 이는 유용한 특성이다. 또한 SSQ는 중심에서 최소 제곱 분석 방법입니다. 시간을내어 SD의 문제점과 대안이 어떻게 비교되는지 독자가 귀하의 관점을 이해할 수 있도록 확장하십시오. .
3

(-1) "역사적 어리 석음"및 "지적 게으름"과 같은 문구를 자기 참조적인 것으로 읽기가 너무 쉽습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.