인간의 이해에는 분산의 개념을 직관적으로 파악하는 데 어려움이있는 것으로 보입니다. 좁은 의미에서 그 대답은 즉각적입니다. 제곱은 우리를 재귀적인 이해에서 멀어지게합니다. 그러나 문제를 나타내는 것은 단지 차이 일까요, 아니면 데이터에 퍼지는 전체 아이디어일까요? 우리는 범위 에서 피난처를 찾습니다또는 최소값과 최대 값을 표시하지만 실제 어려움을 피하고 있습니까? 평균 (모드 또는 중앙값)에서 중심, 요약 ... 단순화를 찾습니다. 분산은 사물을 퍼 뜨리고 불편하게 만듭니다. 원시인은기도를 삼각 측량하여 동물 사냥에서 평균을 사용했을 것입니다. 그러나 나는 우리가 사물의 확산을 정량화해야 할 필요성을 느낀다고 생각합니다. 실제로, 분산이라는 용어는 최근 1918 년 "Mandelian 상속 가정에 대한 친척 간의 상관 관계"라는 논문에서 Ronald Fisher에 의해 처음 소개되었습니다 .
뉴스를 따르는 대부분의 사람들은 성별에 따른 수학 적성에 관한 Larry Summers의 불행한 연설에 대한 이야기를 들었을 것 입니다. 간단히 말해서, 그는 두 성별이 같은 평균을 가졌음에도 불구하고, 여성에 비해 남성들 사이의 수학 역량 분포에있어서 더 넓은 차이를 제안했습니다. 적절성이나 정치적 의미에 관계없이, 이것은 과학 문헌에서 입증 된 것으로 보인다 .
더 중요한 것은 아마도 기후 변화 와 같은 문제에 대한 이해 -토론으로 불완전하게 이끄는 주제를 제기 해 주신 것을 용서해주십시오. 일반 대중의 경우 분산 아이디어에 대한 친숙성이 향상 될 수 있다는 것입니다.
이 게시물 에서 볼 수 있듯이 @whuber의 훌륭하고 다채로운 답변을 제공하는 공분산 을 파악하려고하면 문제가 더욱 복잡해 집니다 .
너무 일반적으로이 질문을 기각 유혹 수 있지만, 우리가 같이 간접적으로 논의되는 것이 분명하다 이 게시물 수학은 사소한, 아직 개념이 애매되는 더 편안하게 수용 belying에 유지 범위 등을 더 미묘한 아이디어 차이와 반대 .
Fisher에서 EBFord 로 보낸 서한에서 멘델의 실험에 대한 그의 의혹에 대한 논쟁을 언급하면서, 우리는 다음과 같이 읽습니다. "이제 데이터가 위조되었을 때 사람들이 일반적으로 광범위한 확률 편차의 빈도를 과소 평가 하여 "멘델의 데이터에서] 편차는 놀라 울 정도로 작습니다." 위대한 RA 피셔는 소 표본에서 소량의 편차를 의심하고 싶어서 다음 과 같이 썼다 .
그리고 과소 평가 나 오해 확산에 대한 이러한 편견이 오늘날에도 지속될 수 있습니다. 그렇다면 분산보다 중심 개념에 더 편한 이유에 대한 설명이 있습니까? 아이디어를 내면화하기 위해 할 수있는 일이 있습니까?
우리는 어떤 개념을 순식간에 "본다"고 생각하지 않지만 아직 받아들이지 않고 계속합니다. 예를 들어, 또는 E = m c 2 이지만 일상 생활에서 결정을 내릴 때 이러한 정체성에 대해 알 필요조차 없습니다. 분산도 마찬가지입니다. 더 직관적이지 않아야합니까?
Nassim Taleb은 위기에 처한시기에 분산에 대한 결함에 대한 이해에 대한 자신의 (실제로 Benoit Mandelbrot의 ) 인식을 적용하여 운을 내었고 , "변동의 분산은 인식 론적으로 , 평균에 대한 지식의 부족에 대한 지식의 부족의 척도 "- 예,이 입에 더 상황이 ... 그리고 자신의 신용에, 그는 또한으로는 간단했다 추수 감사절 터키 아이디어. 투자의 핵심은 분산 (및 공분산)을 이해하는 것입니다.
그렇다면 왜 그렇게 미끄러 우며 어떻게 고칠 수 있습니까? 공식이 없으면 ... 불확실성을 다루는 수년간의 직관 ... 나는 대답을 모르겠지만 수학 (필수적으로는)이 아닙니다. 예를 들어, 첨도의 아이디어가 분산을 방해하는지 궁금합니다. 다음 그림에는 거의 동일한 분산으로 겹치는 두 개의 히스토그램이 있습니다. 그러나 내 무릎 저크 반응은 꼬리가 가장 길고 가장 높은 피크 (높은 첨도)가 더 많이 퍼져 있다는 것입니다.