내 데이터로 모델을 만드는 데 사용할 올바른 분포에 대한 질문이 있습니다. 나는 50 개의 플롯으로 삼림 인벤토리를 수행했으며 각 플롯은 20m × 50m입니다. 각 음모에 대해 땅을 가리는 나무 캐노피의 비율을 추정했습니다. 각 플롯에는 캐노피 덮개에 대한 하나의 값 (백분율)이 있습니다. 백분율은 0에서 0.95 사이입니다. 위성 이미지 및 환경 데이터를 기반으로 독립 X 변수 행렬을 사용하여 백분율 트리 캐노피 커버 ( Y 변수) 모델을 만들고 있습니다.
이항 랜덤 변수는 n 개의 독립적 인 시행 (즉, Bernoulli 랜덤 변수) 의 합이므로 이항 분포를 사용해야하는지 잘 모르겠습니다 . 백분율 값은 시행의 합이 아닙니다. 실제 비율입니다. 상한이 없더라도 감마를 사용해야합니까? 백분율을 정수로 변환하고 포아송을 카운트로 사용해야합니까? 가우스 만 고집해야합니까? 이 방법으로 백분율을 모델링하려고하는 문헌이나 교과서에서 많은 예제를 찾지 못했습니다. 힌트 나 통찰력이 있으면 감사하겠습니다.
답변 주셔서 감사합니다. 실제로 베타 배포는 내가 필요한 것이므로이 기사에서 자세히 설명합니다.
Eskelson, BN, Madsen, L., Hagar, JC, & Temesgen, H. (2011). 베타 회귀 및 copula 모델을 사용하여 Riparian Understory 초목 덮개를 추정합니다. 산림 과학, 57 (3), 212-221.
이 저자들은 Cribari-Neto와 Zeileis의 R 베타 베타 패키지를 사용합니다.
다음 기사는 베타 범위의 반응 변수가 백분율 범위에 참 0 및 / 또는 1을 포함 할 때 베타 분산 반응 변수를 변환하는 좋은 방법을 설명합니다.
- Smithson, M. 및 J. Verkuilen, 2006 년 . 더 나은 레몬 압착기? 베타 분포 종속 변수를 사용한 최대 우도 회귀 , 심리학 적 방법, 11 (1) : 54–71.