Poisson, Gamma 또는 Tweedie 분포를 오류 분포의 패밀리로 사용하여 Python / scikit-learn에서 GLM을 평가할 수 있습니까?


13

Python과 Sklearn을 배우려고하지만 Poisson, Gamma 및 특히 Tweedie 제품군의 오류 분포를 사용하는 회귀를 실행해야합니다.

나는 그것들에 관한 문서에서 아무것도 보지 못했지만 R 배포판의 여러 부분에 있기 때문에 누군가 파이썬의 구현을 보았는지 궁금합니다. Tweedie 배포판의 SGD 구현으로 나를 가리킬 수 있다면 매우 시원 할 것입니다!


파이썬에서 가장 강력한 GLM 구현은 [statsmodels] statsmodels.sourceforge.net에 있지만 SGD 구현이 있는지 확실하지 않습니다.
Trey

고마워 트레이 Tweedie를 지원하지 않는 것처럼 보이지만 Poisson 및 Gamma 배포판에 대한 토론이 있습니다.
joe

답변:


13

scikit-learn에서 Poisson, gamma 및 Tweedie 오류 분포를 사용하여 일반화 된 선형 모델을 구현 하려는 움직임 이 있습니다 .

Statsmodels 는 Poisson, Tweedie 및 gamma error distribution을 사용하여 일반화 된 선형 모델을 구현했습니다.

이 답변을 업데이트하는 동안 Spark ML 은 (실험적으로) Poisson, Tweedie 및 감마 분포를 지원합니다.


5
내가 일하고 있어요 : github.com/madrury/py-glm
매튜 드 루리

@MatthewDrury 최고!
Neal

트윗 담아 가기 방금 GLM을 사용하기 시작했으며 statsmodels 에는 몇 가지 제한이 있습니다. 수학을 완전히 이해하지 못했지만 내부 해결 이 임의의 최소 제곱 유형 솔버로 대체 될 수 있습니까? 유연성이 추가 될 것이라고 생각했습니다 (예 : sklearn.ElasticNet 을 전달하여 확장 성 / 규정 화 등을 "무료로"제공 하시겠습니까?).
GeoMatt22

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.