성장 차트를 만드는 가장 좋은 방법


10

음수가 아닌 연속적이고 50-150 범위 (이 범위를 벗어나는 값은 몇 개만 있음) 90 번째, 95 번째 및 99 번째 백분위 수 곡선을 만들고이 백분위 수에 대한 테이블을 만들어야합니다. 샘플 크기는 약 8000입니다.

가능한 방법을 확인하고 찾았습니다.

  1. Quantile을 찾은 다음 loess 방법을 사용하여이 Quantile에서 부드러운 곡선을 얻습니다. 평활도는 'span'매개 변수로 조정할 수 있습니다.

  2. LMS (Lambda-Mu-Sigma) 방법을 사용하십시오 (예 : R에서 gamlss 또는 VGAM 패키지 사용).

  3. Quantile 회귀 분석을 사용하십시오.

  4. 각 연령 그룹의 평균과 SD를 사용하여 해당 연령의 백분위 수를 추정하고 백분위 수 곡선을 만듭니다.

가장 좋은 방법은 무엇입니까? '최고'는 그러한 성장 곡선을 생성하기위한 표준 방법이며 모두에게 허용되는 이상적인 방법 중 하나를 의미합니다. 또는 더 쉽고 간단한 방법으로 구현할 수 있습니다.이 방법은 약간의 제한이있을 수 있지만 수용 가능한 빠른 방법입니다. 예를 들어 백분위 수 값에서 loess를 사용하는 것이 gamlss 패키지의 LMS를 사용하는 것보다 훨씬 빠릅니다.

또한 해당 방법의 기본 R 코드는 무엇입니까?

당신의 도움을 주셔서 감사합니다.


2
당신은 결정적으로 논의하기가 어렵고 불가능한 것 사이에있는 "최고"를 요구하고 있습니다. (“최상의”수준의 측정은 충분하지 않습니다.) 귀하는 아동의 건강 변화와 관련하여 질문을 명확하게 연관 시켰지만,“최고”에 대한 기준은 명확하지 않습니다.
Nick Cox

나는 그 시도를 환영하지만 a) 분명히 존재하지 않는 이유는 무엇입니까? 다른 경쟁 솔루션이 있거나 왜 읽고있는 문헌에서 이것이 분명하지 않습니까? 이 문제에 대한 관심은 수백 년이 아니라면 수십 년이 지났습니다. 더 쉬운 방법 : 이해하기 쉽고, 의료진이나 비 통계적 전문가에게 일반적으로 이해하기 쉽고, 구현하기가 더 쉽다 ...? 나는 까다로운 것처럼 보이지만 왜 속도를 걱정해야합니까? 이러한 방법 중 어느 것도 계산 상 요구되지 않습니다.
Nick Cox

@ NickCox : 귀하의 의견에 따라 질문을 편집했습니다. 나는 진정한 대답을 부탁드립니다.
rnso

1
죄송하지만이 분야에서는 효과가 없으며 귀하의 질문에 답변하기가 너무 어렵다고 생각합니다. 사람들이 대답을 할 수 없거나 대답 할 수는 없지만 말할 내용이 있기 때문에 의견이 존재합니다. 주문에 대한 답변을 쓰지 않습니다.
Nick Cox

답변:


6

성장 곡선에 대한 많은 문헌이 있습니다. 제 생각에는 세 가지 "상위"접근 방식이 있습니다. 세 가지 모두에서, 시간은 충분한 수의 매듭 (예를 들어, 6)을 갖는 제한된 입방 스플라인으로 모델링됩니다. 이것은 우수한 성능과 쉬운 해석으로보다 매끄럽게 매개 변수화됩니다.

  1. 연속 시간 AR1과 같은 합리적인 상관 패턴을 가진 세로 데이터에 대한 클래식 성장 곡선 모델 (일반화 된 최소 제곱). 잔차가 가우시안임을 나타낼 수 있다면 추정 된 평균과 공통 표준 편차를 사용하여 Quantile의 MLE을 얻을 수 있습니다.
  2. 와이와이

비례 배당률을 사용한 경우 결과가 너무 많은 PO 가정 (실패했다고 가정)을 어떻게 수용 했습니까? 감사.
julieth

2
실패하더라도 전체 가정이 적기 때문에 모델이 다른 모델보다 성능이 우수 할 수 있습니다. 또는 비례 위험 (log-log cumulative prob. link)과 같은 다른 순서 모델 누적 확률 패밀리 중 하나로 전환하십시오.
Frank Harrell

1

가우스 프로세스 회귀 . 제곱 지수 커널로 시작하여 눈으로 매개 변수를 조정하십시오. 나중에 올바르게 작업하려면 다른 커널을 실험하고 한계 우도를 사용하여 매개 변수를 최적화하십시오.

위에 링크 된 튜토리얼보다 자세한 내용을 원한다면 이 책이 훌륭 합니다.


답변 주셔서 감사합니다. 언급 된 다른 방법과 비교하여 가우스 프로세스 회귀를 어떻게 평가합니까? 의 두 번째 가우시안 음모 scikit-learn.org/0.11/auto_examples/gaussian_process/...는 : 황토 (현지 회귀)의이 페이지의 마지막에서 두 번째 플롯과 매우 유사하게 나타납니다 princeofslides.blogspot.in/2011/05/... . LOESS는 수행하기가 훨씬 쉽습니다.
rnso

개인적으로, 나는 당신이 그것을 맞출 수있을만큼 작은 데이터 세트에 대해 GPR을 강력하게 선호합니다. 이론적 인 관점에서 볼 때 훨씬 "더욱"더 유연하고 강력하며 보정 된 확률 적 출력을 제공합니다. 데이터가 조밀하고 올바르게 작동하면 통계가가 아니라면 잠재 고객이 LOESS와 GPR의 차이를 알 수 없을 것입니다.
Andy Jones

3
와이엑스

1
@Nick : 의도 한 조언은 데이터 모델을 구성한 다음이 모델을 사용하여 (부드러운) 백분위 수 곡선을 구성하는 것입니다. 이제 당신은 그것을 언급했습니다. 네, 두 번째 구성 요소 (예 : 실제 질문)를 완전히 놓쳤습니다.
Andy Jones

1
1.96
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.