나는 그 질문이 많은 의미를 지니고 있다고 확신하지는 않지만, 무작위 효과를 가진 임의의 숲을 제안한 논문 제목을 보았습니다. 이것이 R에서 가능합니까?
나는 그 질문이 많은 의미를 지니고 있다고 확신하지는 않지만, 무작위 효과를 가진 임의의 숲을 제안한 논문 제목을 보았습니다. 이것이 R에서 가능합니까?
답변:
일반적으로 함께 사용되지 않으므로 조합하기 전에주의를 기울여야합니다.
임의 포리스트는 일반적으로 분류 자로 사용됩니다. 다른 방법 (예 : K- 평균 군집) 대신 무작위 포리스트를 사용하는 이유는 분류하려는 차원의 수가 많기 때문입니다. 차원 수가 많은 문제는 모든 차원 순서의 조합을 테스트하려는 경우 선택의 폭이 다양하다는 것입니다 (차원의 계승 수보다 빠르게 증가 함).
무작위 효과는 일반적으로 같은 것을 반복 측정하여 회귀에 사용됩니다. 그것들은 일반적으로 혼합이라는 용어가 고정 효과와 임의 효과를 모두 나타내는 혼합 효과 모델에서 사용됩니다. 고정 효과는 다시 볼 수있는 매개 변수 (예 : 약물 또는 사람의 나이)를 나타내는 것으로 생각됩니다. 랜덤 효과는 다시는 볼 수없는 매개 변수 (예 : 특정 인물) 주변의 변동 사례를 나타내는 것으로 생각됩니다.
클러스터 데이터 http://dx.doi.org/10.1080/00949655.2012.741599 및 http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf 가있을 때이를 함께 사용하는 예가 있습니다 . .
이 분석을 수행 할 수있는 R 패키지를 모릅니다.
네 가능합니다. " RE-EM 트리 : 세로 및 클러스터 된 데이터에 대한 데이터 마이닝 방법 "및 관련 R 패키지 REEMtree를 확인해야 합니다.
내가 논문을보고 난 지 오래되었습니다. 저자들은 아직이 나무들의 앙상블 형성을 시도하지는 않았지만 그것이 효과가 없을 것이라고 제안한 것은 없다고 생각합니다.
혼합 효과 랜덤 포레스트 (MERF)는 문제입니다. 위의 답변에서 알 수 있듯이 HEC Montreal의 Larocque 박사 그룹은 이에 대한 훌륭한 연구가 있습니다. 논문은 여기에 있습니다 : http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
본질적으로 랜덤 포레스트의 비선형 모델링과 선형 랜덤 효과를 결합하는 이론적으로 건전한 방법입니다.
우리는 방금 논문에서 위의 알고리즘을 사용하여 MERF를 구현 하는 Python 의 오픈 소스 패키지를 출시했습니다 .
패키지 및 클러스터 된 데이터 세트에 사용하는 방법에 대한 자세한 블로그 게시물을 작성했습니다 .