분산이 표준 편차보다 더 근본적인 개념입니까?


18

이 심리 측정 웹 사이트 나는 읽었

깊은 수준의 분산은 표준 편차보다 더 근본적인 개념입니다.

이 사이트는 왜 분산이 표준 편차보다 더 근본적인지를 더 자세히 설명하지는 않지만이 사이트에서 비슷한 내용을 읽은 것을 상기시켜주었습니다.

예를 들어, 이 의견에서 @ kjetil-b-halvorsen은 "표준 편차는 해석,보고에 좋습니다. 이론을 발전시키기 위해서는 분산이 더 좋습니다"라고 말합니다.

나는 이러한 주장들이 연결되어 있다는 것을 알고 있지만 실제로 이해하지 못한다. 표본 분산의 제곱근은 모집단 표준 편차의 편견 추정치가 아니지만 그보다 더 많은 것이 있어야 함을 이해합니다.

어쩌면 "기초"라는 용어가이 사이트에 대해 너무 모호 할 수 있습니다. 이 경우 통계 이론 개발의 관점에서 표준 편차보다 분산이 더 중요한지 묻는 질문을 조작 할 수 있습니다. 왜 왜 안돼?


그들은 같은 것이 아닌가? 1 + 1이 2 * 1과 같습니까?
SmallChess

2
분산은 두 번째 누적량 입니다. cumulants에 대한 위키 백과의 문서 가 확률 변수의 연구뿐만 아니라 물리학 및 조합론에서뿐만 아니라, 얼마나 자연스럽고 중요한을 가진 사람을 감동한다. 다변량 분포에 대한 누적의 확장뿐만 아니라 다선 형성 속성 (계산 수행의 기본)은 표준 편차로 즐기지 않습니다. κ2
whuber

답변:


16

Robert와 Bey의 답변은 스토리의 일부를 제공합니다 (즉, 모멘트는 분포의 기본 속성으로 간주되는 경향이 있으며 일반적으로 표준 편차는 다른 방식이 아닌 두 번째 중심 모멘트로 정의됩니다). 정말 근본적인 것은 부분적으로 우리가 그 용어가 의미하는 바에 달려 있습니다.

우리의 규칙은 다른 길을 가면 더 극복 할 수없는 문제가 없을 것, 예를 들어, - 우리가 통상적으로 보통 순간 대신에 수량의 다른 순서를 정의 중지 아무것도 말할 P = 1 , 2 , 3 , . . . ( μE[(Xμ)p]1/pp=1,2,3,...μ모멘트 순서와이 항을 첫 번째 용어로 맞추고 모멘트와 모멘트와 관련된 모든 계산 방식을 정의합니다. 이러한 양은 모두 원래 단위로 측정되므로 모멘트 ( 원래 단위의 제곱에 있으므로 해석하기가 더 어렵다)에 비해 한 가지 이점이 있습니다. 이렇게하면 모집단 표준 편차가 정의 된 수량 및 분산으로 정의됩니다.p

그러나 모멘트 생성 기능과 같은 수량 (또는 위에서 정의한 새로운 수량과 관련된 일부 등)을 "자연적인"수준으로 만들면 상황이 조금 더 어색해집니다 (그러나 일부 규칙은 약간 비슷합니다). 다른 방법으로는 캐스트하기 쉽지 않은 MGF의 편리한 속성이 있습니다.

내 생각에 더 기본적이지만 (그러나 관련이 있음) 표준 편차의 속성으로 쓰여질 때보 다 분산의 속성으로 쓸 때 더 편리한 분산 의 여러 기본 속성이 있습니다 (예 : 독립의 합의 분산) 랜덤 변수는 분산의 합입니다).

이 부가 성은 다른 분산 측정치와 공유되지 않는 특성이며 많은 중요한 결과를 초래합니다.

[다른 큐 뮬런 트들 사이에는 비슷한 관계가 있으므로 이것은 모멘트와 관련하여 사물을보다 일반적으로 정의하고자 하는 의미입니다.]

이러한 모든 이유는 컨벤션이나 편의성 일 수 있지만 어느 정도는 관점의 문제입니다 (예를 들어, 어떤 관점에서 보면 순간은 매우 중요합니다. 다른 것에서는 그다지 중요하지 않습니다). "심층적 인 수준"비트는 kjetil의 "이론을 개발할 때"를 의미하는 것일 수 있습니다.

나는 당신이 당신의 질문에서 제기 한 kjetil의 견해에 동의합니다. 어느 정도까지는이 답변은 그에 대한 손으로 이야기하는 것입니다.


나는 두 사람이 각자의 편의를 가지고 있다고 말하고 싶습니다.
JM은 통계학자가 아닙니다.

2

분산은 분포 의 첫 번째 순간 과 두 번째 순간 에 의해 정의됩니다 . 대조적으로, 표준 편차는 순간보다 "표준"과 비슷합니다. 모멘트는 분포의 기본 특성 인 반면, 규범은 구별을위한 방법 일뿐입니다.


2

표준 편차는 '분산의 제곱근'으로 정의되기 때문에 분산은 표준 편차보다 더 근본적입니다.

반면에 분산은 '완전히 독립적으로' '표본과 평균 사이의 제곱 차이의 기대'로 정의됩니다.


3
나는 이것을 근본적인 것에 대한 반영이 아닌 교수법과 같은 용어를 사용하는 방법에 대한 보고서로 더 많이보고있다. 분산 (아직)을 언급하지 않고 표준 편차를 도입하는 것이 완벽하게 가능하며 제곱 수량에 특별한 이름을 사용할 필요없이 피타고라스의 정리에 대해 이야기 할 수있는 것처럼 많은 텍스트와 코스가 정확하게 수행합니다. 역사적으로 통계적 의미의 차이라는 용어는 표준 편차의 용어를 사용하므로이 형태의 단어조차도 수십 년 동안 불가능했습니다.
Nick Cox

글렌의 삭제 된 의견에 대한 응답을 공식화하는 동안 분산 이전의 레이블로 표준 편차가 발생했음을 알게되었습니다. 더 새로운 용어의 주장은 그것들을 약화시키기보다는 더 근본적인 것으로 주장한다.
Robert de Graaf

1
모든 종류의 설명을 찾을 수 있습니다. SD에 대한 입문 (지리학자, 수학적으로 강인한 사람은 아님)에게 나는 분산 이라는 용어를 전혀 사용하지 않습니다 . SD는 평균 (가우스) 분포에 대한 자연적인 척도 측정치이며 밀도 함수의 평균과 변곡점 사이의 거리이므로 신속하게 지적합니다. 나는 그것이 학생들보다 내 자신의 즐거움과 즐거움을위한 것이라고 생각합니다.
Nick Cox

0

nXVar[X]=σ2S2σ2Sσ

E[S2]=σ2, E[S]σ,

2
1

V아르 자형[]V아르 자형[나는엑스나는]=나는V아르 자형[엑스나는]엑스나는
StijnDeVuyst

1
실제로, 독립 분산의 가산 성은 기본 속성이지만, 이것이 당신의 주장이 아닙니다.
Nick Cox

아마 어떤 흥미로운 것은 평균과 마찬가지로, 특정 분포를 지정하지 않고 분산의 불편 추정을 구성 할 수 있습니다, 그입니다 (표준 편차의 불편 추정 분포를 특정됩니다.)
Scortchi - 분석 재개 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.