그래서 로그 정규 분포 확률 변수 생성하는 무작위 프로세스가 있습니다. 해당 확률 밀도 함수는 다음과 같습니다.
나는 원래 분포의 몇 순간의 분포 를 추정하고 싶었습니다 . 첫 번째 순간, 산술 평균이라고합시다. 그렇게하기 위해 10000 번의 랜덤 변수를 10000 번 그려서 산술 평균의 10000 추정치를 계산할 수있었습니다.
그 평균을 추정하는 두 가지 방법이 있습니다 (적어도 내가 이해 한 것입니다 : 내가 틀릴 수 있습니다).
- 일반적으로 산술 평균을 계산하면
- 또는 기본 정규 분포에서 및 를 먼저 추정 하여 : 그리고 그 평균은μ μ = N ∑ i = 1 log ( X i )ˉ X =exp(μ+1
문제는 이러한 각 추정치에 해당하는 분포가 체계적으로 다르다는 것입니다.
"일반"평균 (빨간색 점선으로 표시)은 지수 형태 (녹색 일반 선)에서 파생 된 것보다 일반적으로 낮은 값을 제공합니다. 두 방법 모두 정확히 동일한 데이터 세트에서 계산됩니다. 이 차이는 체계적입니다.
이 분포가 왜 다른가요?
및 σ에 대한 실제 매개 변수는 무엇 입니까?
—
Christoph Hanck
이것은 결과를 복제하기위한 것입니다.
—
Christoph Hanck 2016 년
. 따라서, 점선 곡선은 적색 용 고체 녹색 곡선의 왼쪽에 있어야만 모든 (포지티브 난수를 설명하는) 상위 분포.
—
whuber
많은 수의 평균이 작은 수의 큰 확률에서 나온 경우, 유한 샘플 산술 평균은 높은 확률로 모집단 평균을 과소 평가할 수 있습니다. (기대 그것은 불편하지만 작은 과소 평가하고 큰 이상 추정의 작은 확률의 큰 가능성이있다.)이 질문은이 일에 관련 될 수 : stats.stackexchange.com/questions/214733/...
—
매튜 건