일반적으로 기계 학습에 익숙하지 않기 때문에 나는 주변에서 놀기 시작하고 가능성이 무엇인지보고 싶습니다.
설치에서 의미있는 결과를 생성하는 데 가장 빠른 시간을 제공 할 것을 권장하는 응용 프로그램이 궁금합니다.
또한, 일반적으로 머신 러닝 주제에 관한 좋은 시작 자료에 대한 모든 권장 사항을 알고 있습니다.
일반적으로 기계 학습에 익숙하지 않기 때문에 나는 주변에서 놀기 시작하고 가능성이 무엇인지보고 싶습니다.
설치에서 의미있는 결과를 생성하는 데 가장 빠른 시간을 제공 할 것을 권장하는 응용 프로그램이 궁금합니다.
또한, 일반적으로 머신 러닝 주제에 관한 좋은 시작 자료에 대한 모든 권장 사항을 알고 있습니다.
답변:
기계 학습에 대한 MOOC부터 시작하는 것이 좋습니다. 예를 들어 코스 라 의 앤드류 응 (Andrew Ng) 과정 .
Orange 응용 프로그램도 살펴 봐야 합니다. 그래픽 인터페이스가 있으며이를 사용하여 일부 ML 기술을 이해하는 것이 더 쉽습니다.
솔직히 말하면, 일부 프로젝트를 수행하면 전체 과정을 수행하는 것보다 훨씬 많은 것을 가르쳐 줄 것이라고 생각합니다. 한 가지 이유는 과제를 수행하는 것보다 프로젝트를하는 것이 동기를 부여하고 개방적인 것입니다.
시간과 동기 부여 (실제 동기 부여)가있는 경우 코스는 프로젝트를 수행하는 것보다 낫습니다. 다른 논평자들은 기술에 대한 좋은 플랫폼 추천을했다.
나는 재미있는 프로젝트 관점에서 질문을하고 컴퓨터가 그 질문에 대답하는 법을 배우도록해야한다고 생각합니다.
좋은 예가있는 몇 가지 좋은 고전적인 질문은 다음과 같습니다.
이 프로젝트는 수학과 코드가 완성되었으며 Google에서 쉽게 찾을 수 있습니다.
다른 멋진 주제는 당신이 할 수 있습니다!
마지막으로, 나는 로봇 공학을 연구하므로 가장 재미있는 응용 프로그램은 행동입니다. 예를 들면 다음과 같습니다 (arduino로 게임을 할 수있는 경우)
로지스틱 회귀 분석을 사용하는 애플리케이션을 작성하여 내부 온도가 지정된 상태에서 팬을 켜고 끄는시기와 실내의 조명 상태를 학습합니다.
Gaussian Mixture Models (시연을 통한 학습)를 사용하여 센서 입력 (아마도 버튼 누름)을 기반으로 액츄에이터, 아마도 휠을 움직 이도록 로봇을 가르치는 응용 프로그램을 만듭니다.
어쨌든, 그들은 꽤 고급입니다. 내가하고 싶은 요점은 (실제로) 좋아하는 프로젝트를 선택하고 몇 주 동안 프로젝트를 진행하면 많은 양을 배우고 과제를 수행하는 것보다 훨씬 많은 것을 이해한다는 것입니다.
프로그래밍에 익숙 하다고 가정하면 scikit-learn을 보는 것이 좋습니다 . 특히 미니 튜토리얼 및 기계 학습을 통한 빠른 둘러보기로 사용할 수있는 유용한 도움말 페이지가 있습니다. 흥미로운 부분을 고르고 예제를 통해 작업하십시오.
R Studio를 이미 알고 있다면 캐럿 패키지를 시작하는 것이 좋습니다. 다음은 몇 가지 자습서입니다.
R 및 caret를 사용하면 데이터 세트를 쉽게로드 및 스플 라이스하고, 기능 축소, 주요 컴포넌트 분석, 다양한 알고리즘을 사용하여 학습 및 예측할 수 있습니다.
http://scikit-learn.org/ 페이지 의 배너에서 6x3 그래프 그리드를 재현 할 수 있다면 ML과 일부 Python을 배웠을 것입니다. 당신은 언어를 언급하지 않았습니다. 파이썬은 매우 빠르게 배울 수 있으며 scikit-learn은 광범위한 알고리즘을 구현했습니다.
그런 다음 자신의 데이터를 사용해보십시오!
위에서 언급했듯이 Andrew Ng 교수의 MOOCs와 Yaser Abu-Mostafa 교수의 'Learning From Data'를 통해 ML의 기본 사항을 파악하십시오 .
R은 Kaggle 대회에서 가장 많이 사용되는 도구로 확실한 승자 입니다. (Kaggle 위키 및 포럼에서 리소스를 확인하는 것을 잊지 마십시오)
기본 R과 Python을 배우십시오. Coursera 'Data Science'트랙에는 소개 R 과정이 있습니다. 거의 모든 알고리즘은 Python 및 R 라이브러리에서 찾을 수 있습니다. 몇 가지 카글 경쟁에서 배운 알고리즘을 자유롭게 사용하십시오. 시작점으로 kaggle의 Titanic 데이터 셋 및 Digit 인식기 데이터 셋에 대한 여러 알고리즘의 성능을 비교하십시오 .
그리고 다양한 데이터 세트에서 계속 연습하십시오!