정규화 기술에서는 올가미, 능선 회귀, 탄성 그물 등을 말합니다.
입원 환자 체류 기간이 예측되는 인구 통계 학적 및 진단 데이터를 포함하는 건강 관리 데이터에 대한 예측 모델을 고려하십시오. 일부 개인의 경우, 기준 기간 동안 상관 된 다수의 LOS 관찰 (즉, 하나 이상의 IP 에피소드)이 존재한다.
예를 들어 각 개인에 대한 랜덤 효과 절편 항을 포함하는 탄력적 순 예측 모델을 구축하는 것이 합리적입니까?
정규화 기술에서는 올가미, 능선 회귀, 탄성 그물 등을 말합니다.
입원 환자 체류 기간이 예측되는 인구 통계 학적 및 진단 데이터를 포함하는 건강 관리 데이터에 대한 예측 모델을 고려하십시오. 일부 개인의 경우, 기준 기간 동안 상관 된 다수의 LOS 관찰 (즉, 하나 이상의 IP 에피소드)이 존재한다.
예를 들어 각 개인에 대한 랜덤 효과 절편 항을 포함하는 탄력적 순 예측 모델을 구축하는 것이 합리적입니까?
답변:
이 질문에 관한 몇 가지 논문이 있습니다. 나는 특별한 순서로 찾지 않을 것입니다 :
펜 LME : Howard D Bondell, Arun Krishna 및 Sujit K Ghosh. 선형 혼합 방정식 모델에서 고정 및 랜덤 효과에 대한 결합 변수 선택. 생체 인식, 66 (4) : 1069-1077, 2010.
GLMMLASSO : Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. L1- 벌칙을 사용한 고차원 선형 혼합 효과 모델에 대한 추정. 스칸디나비아 통계 저널, 38 (2) : 197-214, 2011.
온라인에서 찾을 수 있습니다.
나는 이제 혼합 모델 (LMMEN)에 탄력적 순 벌금을 적용하는 것에 관한 논문을 마무리하고 다음 달에 저널 검토를 위해 보낼 계획입니다.
전반적으로, 정상이 아니거나 자격 증명 링크가없는 데이터를 모델링하는 경우 GLMMLASSO를 사용합니다 (하지만 많은 RE를 처리 할 수는 없음). 그렇지 않으면 고정 또는 임의 효과에 상관없이 상관 관계가 높은 데이터가없는 경우 Pen.LME를 사용하는 것이 좋습니다. 후자의 경우 우편으로 보내 주시면 코드 / 종이를 기꺼이 보내 드리겠습니다 (곧 가까운 곳에 크랜에 넣겠습니다).
오늘 CRAN에 올렸습니다 . 고정 효과와 무작위 효과에 대한 탄성 그물 유형 페널티와 함께 선형 혼합 모델 문제를 해결합니다.
나는 능선 회귀를 단일 범주 형 변수에 한정되지 않고 (상관적인 상관 행렬이없는) 경험적 랜덤 효과 모델로 항상 보았습니다. 능선 페널티를 교차 검증하고 간단한 임의 효과를 피팅 / 추정하는 경우 거의 항상 동일한 예측을 얻을 수 있습니다. 예를 들어, 데모 / 다이어그램 기능과 환자 표시기의 다른 릿지 페널티를 가질 수 있습니다 (팬티 스케일링 계수의 라인을 사용 glmnet
). 또는 사람별로 시간 상관 효과가있는 멋진 임의 효과를 포함 할 수 있습니다. 이러한 가능성 중 어느 것도 옳고 그른 것이 아니며 단지 유용합니다.