«overdispersion» 태그된 질문

과대 산포는 데이터에 '필요한'것보다 더 큰 변동성이있는 경우입니다. 예를 들어, 개수의 분산은 종종 평균보다 크지 만 포아송의 분산은 평균과 같아야합니다.

1
glmnet은 과대 산포를 어떻게 처리합니까?
카운트 데이터를 통해 텍스트를 모델링하는 방법, 특히 lasso기법을 사용하여 기능을 줄이는 방법에 대한 질문이 있습니다. 온라인 기사가 N 개 있고 각 기사에 대한 페이지 뷰 수가 있다고 가정합니다. 각 기사마다 1 그램과 2 그램을 추출했으며 1,2 그램에 대해 회귀 분석을 원했습니다. 피처 (1,2 그램)는 관측치보다 훨씬 많으므로 올가미는 피처 수를 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.