분포가 중요한 이유는 무엇입니까?


10

이 포럼에서 요청한 가장 끔찍한 질문으로 이어질 수도 있지만 이전 질문에 대한 건전하고 의미있는 답변을 받았기 때문에 다시 운이 좋을 것이라고 생각했습니다.

나는 특히 자산 배분, 특히 자산 배분과 관련하여 통계적 분포의 중요성에 대해 한동안 혼란스러워했습니다.

구체적으로 말하자면, 20 년 동안의 S & P 500 월별 반품 데이터가 있다고 가정 할 때, 자산 배분 결정을 위해 특정 종류의 분포 (즉, 보통 / 존슨 / 레비 비행 등)를 가정해야하는 이유는 무엇입니까? 내가 보유한 과거 데이터를 기반으로 자산 할당 결정을 내릴 수 있습니까?


3
이전 질문에 대한 답변이 도움이 되었다면 답변 옆에있는 확인란을 클릭하여 '허용됨'으로 표시 할 수 있습니다. 이를 통해 다른 사람들이 귀하의 질문이 해결되었음을 알 수 있습니다.
Jeff

2
실제로 그 주제에 대한 JDCook 의 최근 게시물이 있습니다 . 질문과의 관련성을 설명하기 위해 첫 번째 단락 "통계학자가 데이터를 분석 할 때 데이터를 가져 오는 것만 보는 것이 아니라 가져올 수있는 가상의 데이터도 고려합니다. "일어 났을 수있는 일과 실제로 일어난 일을 고려합니다."
user603

나는 Taleb 이 전적으로 역사적 데이터로부터 결정을 내릴 때 발생하는 문제에 대해 굳건한 의견이 있다고 생각 합니다. :-). (역사 데이터는 일반적으로 너무 늦을 때까지 희귀하지만 치명적인 "검은 백조"사건을 직접 밝히지 않습니다.)
whuber

2
... 대부분의 칠면조가 몇 주 안에 실현 될 것입니다.
Ryogi

@ user603의 요점을 확장하려면 샘플 외부에서 추론하고 싶습니다. 특히 자산 배분 지점은 과거 행동이 아니라 미래 행동과 관련이 있습니다 . 여기에는 예를 들어 관찰이 거의없는 꼬리에서 사물이 어떻게 동작하는지가 포함됩니다. 분포 가정을 통해 프로세스에 대한 추가 지식 / 이해 / 편견을 가져올 수 있습니다. 이러한 가정이 오른쪽 어딘가에 있으면 많은 정보를 추가 할 수 있습니다.
Glen_b-복지 주 모니카

답변:


5

추정 분포 (예 : 모수 분석)를 사용하면 분석법의 계산 비용이 줄어 듭니다. 회귀 또는 분류 작업을 수행하고 싶다고 가정합니다. 이것은 어떤 시점에서 일부 데이터의 분포를 추정한다는 것을 의미합니다. 비모수 적 방법은 데이터가 잘 연구 된 분포에 맞지 않을 때 유용하지만 일반적으로 계산에 더 많은 시간이 걸리거나 저장하는 데 더 많은 메모리가 필요합니다.

또한 데이터가 균일하게 임의의 일부 프로세스의 평균과 같은 분포를 따르는 프로세스에 의해 생성되는 경우 해당 분포를 사용하는 것이 더 합리적입니다. 균일 한 변수 집합을 평균하는 경우 올바른 분포는 아마도 가우스 분포 일 것입니다.


0

James의 답변 보완 : 파라 메트릭 모델은 또한 적합도를 높이기 위해 적은 샘플을 필요로합니다. 이는 일반화 능력을 높일 수 있습니다. 물론 상황, 모델 및 샘플 크기에 따라 다릅니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.