2 백분위 수를 사용하여 로그 정규 분포에 대한 평균 및 표준 편차를 계산하는 방법


11

로그 정규 분포에 대한 2 백분위 수의 평균 및 표준 편차를 계산하려고합니다.

X = mean + sd * Z평균 및 sd를 사용 하고 풀고 정규 분포를 계산하는 데 성공했습니다 .

대수 정규 분포에 대해 같은 일을하려고 할 때 방정식이 빠진 것 같습니다. 위키 백과를 보고 사용하려고 ln(X) = mean + sd * Z했지만이 경우 평균과 sd가 정규 분포인지 로그 정규인지 아닌지 혼란 스럽습니다.

어떤 방정식을 사용해야합니까? 계산을 풀기 위해 2 백분위 수 이상이 필요합니까?


@ Jean-Francois 사이트에 오신 것을 환영합니다. 참고이 경우 것으로 CV에 대한 R 프로그래밍의 도움을 원했다,이 질문이 될 것이다 오프 주제 (우리의 참조 도움말 페이지를 ). 여기에는 주제에 대한 충분한 통계적 내용이 있지만 경계에 가깝다고 생각합니다. 소프트웨어 중립적 인 방식으로 공식화 할 수 있으면 통계적 문제를 해결하지만 R 특정 적이 지 않은 답변을 준비해야 할 수도 있습니다.
gung-Monica Monica 복원

나는 개혁 할 것이다. R로 해결하려고했지만 여기에 기본 개념이 누락되어 생각한 결과를 얻지 못하는 것 같습니다.
JF

답변:


12

당신이 두 개의 Quantile을 가지고 있다고 "알거나"가정하는 것처럼 보인다; 42와 666이 로그 정규의 10 %와 90 % 포인트라고 가정하십시오.

핵심은 거의 모든 것이 기록 된 (일반적인) 규모로 수행하고 이해하기 쉽다는 것입니다. 가능한 한 적게 그리고 늦게 지수화하십시오.

누적 확률 척도에 대칭 적으로 배치 된 Quantile을 예로 들어 보겠습니다. 그런 다음 로그 스케일의 평균이 이들 사이의 중간이고 로그 스케일의 표준 편차 (sd)는 정규 분위수 함수를 사용하여 추정 할 수 있습니다.

이 샘플 계산에는 Stata의 Mata를 사용했습니다. 백 슬래시 \는 요소를 열 단위로 결합합니다.

mean = mean(ln((42 \ 666)))

(ln(666) - mean) / invnormal(0.9)
1.078232092

SD = (ln(666) - mean) / invnormal(0.9)

지수화 된 척도의 평균은

exp(mean + SD^2/2)
299.0981759

분산은 운동으로 남습니다.

(제외 : 그것은 다른 괜찮은 소프트웨어 쉽게 또는 쉽게로해야한다. invnormal()그냥 qnorm()내가 올바르게 기억 R에.)


고마워 Nick. 기본으로 돌아 가면 훨씬 간단합니다. 내가 한 유일한 변화는 마지막 줄에 있었다 exp(mean + SD^2); 나는 그것을 다음과 같이 변경했다exp(mean + (SD^2)/2)
JF
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.