분류 맥락에서 흥미로운 예측 변수를 분리하는 것이 목표 인 경우 소규모 표본 임상 연구에서 랜덤 포레스트 또는 벌점 형 회귀 (L1 또는 L2 페널티 또는 이들의 조합으로)와 같은 기계 학습 기술을 적용하는 것에 대해 어떻게 생각하십니까? 모델 선택에 대한 질문이 아니며 가변 효과 / 중요도에 대한 최적의 추정치를 찾는 방법에 대해서도 묻지 않습니다. 나는 강력한 추론을 할 계획은 아니지만 다변량 모델링을 사용하기 때문에 각 예측 변수를 한 번에 하나씩 관심 결과에 대해 테스트하지 않고 상호 관계를 고려하지 않습니다.
10-15 범주 또는 연속 변수에 대한 데이터를 가진 20-30 명의 피험자에게 이러한 극단적 인 경우에 그러한 접근 방식이 이미 적용되었는지 궁금합니다. 그것은 정확히 사례 가 아니며 여기서 문제는 우리가 설명하려고 시도하는 클래스의 수 (잘 균형이 맞지 않는)와 (매우) 작은 n과 관련이 있다고 생각합니다. 나는 생물 정보학의 맥락에서이 주제에 관한 거대한 문헌을 알고 있지만, 심리학 적으로 측정 된 표현형 (예 : 신경 심리학 적 설문지 전체)을 이용한 생의학 연구와 관련된 언급을 찾지 못했습니다.
관련 논문에 대한 힌트 나 조언이 있습니까?
최신 정보
C4.5 알고리즘 또는 그 파생어, 연관 규칙 방법 및 감독 또는 준 감독 분류를위한 데이터 마이닝 기술과 같은 이러한 종류의 데이터를 분석하는 다른 솔루션을 사용할 수 있습니다.