나는 일부 연구에서 예측 모델의 성능이 분석법의 선택보다는 선택된 분석법에 대한 데이터 분석가의 전문 지식에 더 의존한다는 소문을 발견했습니다.
다시 말해, 주장은 데이터 분석가가보다 이론적 인 관점에서 본 방법이 문제에 대해 "적절한"것으로 보이는 것보다 선택된 방법에 익숙한 것이 더 중요하다는 주장이다.
이것은 일반적으로 많은 변이체 (100-1000), 다중 공선 성 및 물론 너무 적은 샘플의 문제를 포함하는 화학량 학의 맥락에서 언급되었습니다. 예측은 분류 또는 회귀 일 수 있습니다.
내 개인적인 경험은 이것이 그럴듯 하다는 것을 암시 하지만 연구가 언급되었습니다 (저는 이메일을 통해 신속하지만 실패한 검색을 한 후 답변을받지 못했습니다). 그러나 좀 더 정교하게 검색해도 논문을 추적 할 수 없었습니다.
누구든지 그러한 결과를 알고 있습니까? 그렇지 않다면 여기서 빅 가이의 개인적인 경험은 무엇을 말합니까?
1
나는 주변에서 더 작은 사람의 해요,하지만 내가 신경 회로망에서 본 것은이 가설을 지원까지 "기계 배운다는"뭔가, 성공적인 분류 또는 예측이 의존하는 것 같은 "상자 밖으로"도구 인에서 을 많은 가장 중요한 전처리 데이터의 측면에서뿐만 아니라, 네트워크 아키텍처 등의 측면에서 - 사람을 스마트 방법은 어떻게 데이터에서 배울 수있는 네트워크를 알려줍니다
—
스테판 Kolassa
통계 학습의 요소 (The Elements of Statistical Learning) 의 그림 2.4는 가장 가까운 이웃을 리지 션 유형 방법과 비교합니다 (물론이 책 전체에서 여러 비교 지점을 제공합니다).
—
StasK
@ StasK : 알림 주셔서 감사합니다 (기억하지 않아서 수치 스럽습니다). 또한 실제로 PCR, PLS 및 능선 회귀는 매우 유사하며 LDA 및 로지스틱 회귀도보고합니다. 그러나 후자의 방법은 이론적 인 관점에서도 매우 유사합니다.
—
cbeleites는 Monica를 지원합니다 Monica