생존 분석을 수행 할 수있는 파이썬 패키지가 있는지 궁금합니다. R에서 생존 패키지를 사용하고 있지만 내 작업을 파이썬으로 이식하고 싶습니다.
survival
패키지는 대규모 커뮤니티에서 철저한 조사를 받고 있습니다.
생존 분석을 수행 할 수있는 파이썬 패키지가 있는지 궁금합니다. R에서 생존 패키지를 사용하고 있지만 내 작업을 파이썬으로 이식하고 싶습니다.
survival
패키지는 대규모 커뮤니티에서 철저한 조사를 받고 있습니다.
답변:
AFAIK, 파이썬에는 생존 분석 패키지가 없습니다. mbq가 위에서 언급했듯이 사용 가능한 유일한 경로는 Rpy 입니다.
사용 가능한 순수 파이썬 패키지가 있더라도 사용에 특히주의해야합니다. 특히 다음을 살펴보십시오.
R의 장점 중 하나는 이러한 표준 패키지가 방대한 양의 테스트와 사용자 피드백을 받는다는 것입니다. 실제 데이터를 처리 할 때 예기치 않은 에지 사례가 발생할 수 있습니다.
생명선 ¹ 프로젝트를 확인하여 다음을 포함하여 Python에서 생존 모델을 간단하고 깔끔하게 구현하십시오.
혜택:
설명서는 여기에서 볼 수 있습니다 : 설명서 및 예제
사용법 예 :
from lifelines import KaplanMeierFitter
survival_times = np.array([0., 3., 4.5, 10., 1.])
events = np.array([False, True, True, False, True])
kmf = KaplanMeierFitter()
kmf.fit(survival_times, event_observed=events)
print(kmf.survival_function_)
print(kmf.median_)
kmf.plot()
내장 플로팅 라이브러리의 플롯 예 :
PyIMSL 에는 생존 분석을위한 소수의 루틴이 포함되어 있습니다. 비상업적 용도로는 비어 있음으로 무료로 제공되며, 그렇지 않으면 완전히 지원됩니다. 통계 사용자 안내서의 문서에서 ...
생존 확률의 Kaplan-Meier 추정값을 계산합니다 : kaplanMeierEstimates ()
Cox의 비례 위험 모델을 사용하여 생존 및 신뢰성 데이터를 분석합니다. propHazardsGenLin ()
일반화 된 선형 모형을 사용하여 생존 데이터를 분석합니다 : survivalGlm ()
다양한 파라 메트릭 모드를 사용한 추정값 : survivalEstimates ()
비모수 적 접근 방식을 사용하여 신뢰성 위험 함수를 추정합니다. nonparamHazardRate ()
모집단 및 코호트 수명 테이블을 생성합니다. lifeTables ()
이제 IPython 내에서 R을 사용할 수 있으므로 Ry 확장과 함께 IPython을 사용하는 것이 좋습니다.
rpy2
) 를 참조한다고 생각합니다 . 나도 빠른 예를보고 싶습니다. ( statsmodels 에서는 생존 모델을 아직 완전히 사용할 수 없다는 것을 이해하고 있습니다 .)
또한 scikit-survival (Scikit-survival) 에 대해 언급하고 싶습니다 . 이것은 scikit-learn (예 : KFold cross-validation)의 도구와 쉽게 결합 할 수있는 생존 분석 모델을 제공합니다.
이 글을 쓰는 시점에서 scikit-survival 은 다음의 구현을 포함합니다.
R
스루 RPy
또는 이와 동등한 것을 사용 하는 것 외에도 statsmodels (이전의 sicpy.statsmodel
) python 라이브러리 에는 많은 생존 분석 루틴이 있습니다. 그러나 "샌드 박스"패키지에 들어 있으므로 현재 프로덕션 준비가되어 있지 않습니다.