분산과 표준 편차의 차이는 무엇입니까?


127

분산과 표준 편차의 차이가 무엇인지 궁금합니다.

두 값을 계산하면 분산에서 표준 편차를 얻는 것이 분명하지만 관찰중인 분포 측면에서 무엇을 의미합니까?

또한 왜 표준 편차가 필요한가요?



12
아마 지금까지 답을 얻었을 것입니다. 여전히이 링크는 가장 간단하고 최상의 설명입니다. mathsisfun.com/data/standard-deviation.html

2
표준 편차는 값이 계산 된 데이터와 동일한 척도에 있으므로 유용합니다. 미터를 측정하는 경우 표준 편차는 미터입니다. 반대로 분산은 제곱미터가됩니다.
Vladislavs Dovgalecs

표준 변형은 편향 될 수 없지만 제곱근 함수가 비선형이기 때문에 표준 편차는 불가능합니다.
Daksh Gargas

답변:


84

표준 편차는 분산의 제곱근입니다.

표준 편차는 평균과 동일한 단위로 표시되는 반면 분산은 제곱 단위로 표시되지만 분포를 확인하려면 사용중인 항목에 대해 분명한 한 사용할 수 있습니다. 예를 들어, 평균이 10이고 sd가 3 인 정규 분포는 평균이 10이고 분산이 9 인 정규 분포와 정확히 같습니다.


58
네,이 두 매개 변수를 설명하는 수학적 방법입니다. 그러나 논리적 설명은 무엇입니까? 왜 두 개의 매개 변수를 똑같이 보이게합니까 (산술 평균 주위의 편차).
Le Max

5
당신은 정말로 둘 다 필요하지 않습니다. 하나를보고하면 다른 것을보고 할 필요가 없습니다
Peter Flom

8
표준 편차는 해석,보고에 좋습니다. 이론을 발전시키기 위해서는 분산이 더 좋습니다.
kjetil b halvorsen

4
표준 편차보고의 이점은 데이터 규모에 남아 있다는 것입니다. 성인 키 샘플이 미터 단위이고 표준 편차도 미터 단위라고 가정합니다.
Vladislavs Dovgalecs

5
V에이아르 자형(엑스나는)=V에이아르 자형(엑스나는)

49

둘 다 필요하지 않습니다. 그들은 각각 다른 목적을 가지고 있습니다. SD는 일반적으로 데이터의 변동성을 설명하는 데 더 유용하지만 분산은 수학적으로 훨씬 더 유용합니다. 예를 들어, 상관 관계가없는 분포 (임의 변수)의 합계에는 해당 분포의 분산의 합계 인 분산이 있습니다. 이것은 SD에 해당되지 않습니다. 한편, SD는 원래 변수의 단위로 표현되는 편리함을 갖는다.


24

John이 "관련되지 않은 분포"라고 할 때 독립 랜덤 변수를 언급하면 그의 반응은 정확합니다. 그러나 귀하의 질문에 대답하기 위해 추가 할 수있는 몇 가지 사항이 있습니다.

  1. 평균과 분산은 정규 분포를 결정하는 두 가지 매개 변수입니다.

  2. 케이

  3. 0

  4. 68%195.4%299%

  5. 오차 한계는 추정치의 표준 편차의 배수로 표현됩니다.

  6. 분산과 편향은 임의의 수량에서 불확실성의 척도입니다. 추정치의 평균 제곱 오차는 분산 + 제곱 바이어스와 같습니다.


4
"자연 매개 변수"는 분산으로 나눈 값을 분산으로 나눈 값을 말하면 안됩니다. en.wikipedia.org/wiki/Natural_parameter
Neil G

σ

포인트 3에서 정규화 대신 "표준 편차를 사용하여 통계를 표준화"해서는 안됩니까?
해리

15

데이터 집합의 분산은 평균에 대한 데이터의 수학적 분산을 측정합니다. 그러나이 값은 이론적으로는 정확하지만 계산에 사용 된 값이 제곱이기 때문에 실제 의미로는 적용하기가 어렵습니다. 분산의 제곱근이 원래 값과 동일한 단위 인 값을 제공하므로 표준 편차는 정규 곡선의 개념과 관련하여 작업하기가 쉽고 해석하기가 더 쉽습니다.


이것은 간단한 용어로 이유 를 설명하는 훌륭한 일을 합니다.
GWG

3
또 다른 좋은 점은 각 메트릭 sd 및 var가 평균에 대한 변수의 확산을 측정한다는 것입니다. 표준 편차를 얻기 위해 분산의 제곱근을 취하면 메트릭을 변수 단위로 다시 가져 오는 데 적용되는 스케일링 계수로 볼 수 있습니다.
Matt L.

6

분포와 관련하여 그것들은 동등하지만 (명확히 상호 교환 가능하지는 않지만) 추정기의 관점에서는 그렇지 않습니다. 분산 추정의 제곱근은 표준 편차의 (편견없는) 추정기가 아닙니다. 적당히 많은 수의 샘플에 대해서만 (그리고 추정값에 따라) 두 가지가 서로 접근합니다. 작은 표본 크기의 경우 두 원형 사이에서 변환 할 분포의 모수 적 분포를 알아야합니다.


4

분산을 계산하는 동안 편차를 제곱했습니다. 주어진 데이터 (관측)가 미터 단위 인 경우 미터 제곱이됩니다. 편차에 대한 정확한 표현이 아니길 바랍니다. 따라서 우리는 SD에 지나지 않는 제곱근 (SD)을 다시 사용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.