관심있는 결과가 이분법 인 LASSO Regressionglmnet
과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다.
age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7)
gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0)
bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88)
m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1)
p_edu <- c(0, 2, 2, 2, 2, 3, 2, 0, 0)
f_color <- c("blue", "blue", "yellow", "red", "red", "yellow", "yellow",
"red", "yellow")
asthma <- c(1, 1, 0, 1, 0, 0, 0, 1, 1)
# df is a data frame for further use!
df <- data.frame(age, gender, bmi_p, m_edu, p_edu, f_color, asthma)
위 데이터 세트의 열 (변수)은 다음과 같습니다.
age
(연령 어린이 연령)-연속gender
-이진 (1 = 남성; 0 = 여성)bmi_p
(BMI 백분위 수)-연속m_edu
(어머니 최고 교육 수준)-서수 (0 = 고등학교 미만; 1 = 고등학교 졸업장; 2 = 학사 학위; 3 = 학사 학위 후)p_edu
(아버지 최고 교육 수준)-서수 (m_edu와 동일)f_color
(기본 색상 선호)-공칭 ( "파란색", "빨간색"또는 "노란색")asthma
(자식 천식 상태)-이진 (1 = 천식; 0 = 천식 없음)
이 예제의 목적은 6 개 잠재적 인 예측 변수 (목록에서 모델 예측 아이의 천식 상태를 만들 수 LASSO 사용하는 것이다 age
, gender
, bmi_p
, m_edu
, p_edu
, 및 f_color
). 분명히 샘플 크기는 여기서 문제이지만 glmnet
결과가 이진 (1 = 천식 일 때 프레임 워크 내에서 다양한 유형의 변수 (예 : 연속, 서수, 공칭 및 이진)를 처리하는 방법에 대한 통찰력을 얻고 싶습니다. ; 0 = 천식 없음).
따라서 R
천식 상태를 예측하기 위해 위의 데이터와 함께 LASSO를 사용하는이 모의 예제에 대한 설명과 함께 샘플 스크립트를 기꺼이 제공 합니까? 매우 기본적이지만, 저와 CV의 다른 많은 사람들도 이것을 매우 감사하게 생각합니다!
glmnet
이진 결과로 작동 하는 예제를보고 싶었습니다 .
dput
의 실제 R 객체를; 독자들에게 설탕을 입히지 말고 케이크를 굽지 마십시오!. 예를 들어 R에서 적절한 데이터 프레임을 생성하면foo
의 출력을 질문으로 편집하십시오dput(foo)
.