나는 기계 학습 (일부 통계)의 새로운 이민자이며, 학습 지식 (감독 / 감독되지 않은 학습 알고리즘, 관련 최적화 방법, 정규화, 일부 철학 (예 : 편향 분산 절충)?)입니다. 나는 실제 연습이 없으면 기계 학습에 대한 깊은 이해를 얻지 못할 것이라는 것을 알고 있습니다.
따라서 실제 데이터에 대한 분류 문제부터 시작합니다 (예 : MNIST). 놀랍게도, 기능 학습 / 엔지니어링 없이 원시 픽셀 값을 입력으로 사용하는 랜덤 포레스트 분류기를 사용하면 정확도가 0.97에 도달합니다. 또한 매개 변수가 조정 된 SVM, LR과 같은 다른 학습 알고리즘을 시도했습니다.
그렇다면 길을 잃었습니다. 너무 쉬울까요, 아니면 여기에 빠진 것이 있습니까? 툴킷에서 학습 알고리즘을 선택하고 일부 매개 변수를 조정하십시오.
그것이 실제로 머신 러닝에 관한 것이면, 나는이 분야에 대한 관심을 잃을 것입니다. 며칠 동안 블로그를 생각하고 읽었으며 결론을 얻었습니다.
실제로 머신 러닝의 가장 중요한 부분은 기능 엔지니어링입니다 . 즉, 데이터가 주어지면 기능을 더 잘 표현할 수 있습니다.
어떤 학습 알고리즘을 사용해야하는지, 매개 변수 튜닝도 중요하지만 최종 선택은 실험에 관한 것입니다.
누군가가 나를 교정하고 실제로 기계 학습에 대한 제안을 할 수 있기를 바랍니다.