기계 학습 응용 프로그램을 쉽게 배울 수있는 것은 무엇입니까? [닫은]


12

일반적으로 기계 학습에 익숙하지 않기 때문에 나는 주변에서 놀기 시작하고 가능성이 무엇인지보고 싶습니다.

설치에서 의미있는 결과를 생성하는 데 가장 빠른 시간을 제공 할 것을 권장하는 응용 프로그램이 궁금합니다.

또한, 일반적으로 머신 러닝 주제에 관한 좋은 시작 자료에 대한 모든 권장 사항을 알고 있습니다.


Andrew Ng의 머신 러닝 학습 외에도 kaggle의 데이터 과학 시그니처 트랙에서 몇 가지 과정을 시도해 볼 수 있습니다. 또한 실제 머신 러닝을 배우는 빠른 방법은 kaggle에서 머신 러닝 경쟁에 참여하는 것입니다. R과 Python에서 기능 선택, 데이터 뭉치 및 최종 모델 작성 방법에 대해 설명합니다. kaggle.com/c/titanic/details/getting-started-with-python
0xF

답변:


13

기계 학습에 대한 MOOC부터 시작하는 것이 좋습니다. 예를 들어 코스 라 의 앤드류 응 (Andrew Ng) 과정 .

Orange 응용 프로그램도 살펴 봐야 합니다. 그래픽 인터페이스가 있으며이를 사용하여 일부 ML 기술을 이해하는 것이 더 쉽습니다.


5
앤드류 응 코스 +1 매우 잘되었습니다.
TylerAndFriends

1
John Hopkins는 지난주 Coursera에서 시작된 데이터 과학 인증서 트랙 (9 개 클래스)을 보유하고 있습니다. coursera.org/specialization/jhudatascience/…- 모든 머신 러닝은 아니지만 공유 가치가 있습니다. Coursera는 굉장함으로 가득합니다 (Andre Ng는 훌륭한 강사입니다).
Steve Kallestad

11

솔직히 말하면, 일부 프로젝트를 수행하면 전체 과정을 수행하는 것보다 훨씬 많은 것을 가르쳐 줄 것이라고 생각합니다. 한 가지 이유는 과제를 수행하는 것보다 프로젝트를하는 것이 동기를 부여하고 개방적인 것입니다.

시간과 동기 부여 (실제 동기 부여)가있는 경우 코스는 프로젝트를 수행하는 것보다 낫습니다. 다른 논평자들은 기술에 대한 좋은 플랫폼 추천을했다.

나는 재미있는 프로젝트 관점에서 질문을하고 컴퓨터가 그 질문에 대답하는 법을 배우도록해야한다고 생각합니다.

좋은 예가있는 몇 가지 좋은 고전적인 질문은 다음과 같습니다.

  • 손으로 쓴 숫자를 인식하기위한 신경망
  • 로지스틱 회귀를 사용한 스팸 이메일 분류
  • 가우스 혼합 모델을 사용한 객체 분류
  • 선형 회귀의 일부 사용, 아마도 인근의 식료품 가격 예측

이 프로젝트는 수학과 코드가 완성되었으며 Google에서 쉽게 찾을 수 있습니다.

다른 멋진 주제는 당신이 할 수 있습니다!

마지막으로, 나는 로봇 공학을 연구하므로 가장 재미있는 응용 프로그램은 행동입니다. 예를 들면 다음과 같습니다 (arduino로 게임을 할 수있는 경우)

로지스틱 회귀 분석을 사용하는 애플리케이션을 작성하여 내부 온도가 지정된 상태에서 팬을 켜고 끄는시기와 실내의 조명 상태를 학습합니다.

Gaussian Mixture Models (시연을 통한 학습)를 사용하여 센서 입력 (아마도 버튼 누름)을 기반으로 액츄에이터, 아마도 휠을 움직 이도록 로봇을 가르치는 응용 프로그램을 만듭니다.

어쨌든, 그들은 꽤 고급입니다. 내가하고 싶은 요점은 (실제로) 좋아하는 프로젝트를 선택하고 몇 주 동안 프로젝트를 진행하면 많은 양을 배우고 과제를 수행하는 것보다 훨씬 많은 것을 이해한다는 것입니다.


5

Weka 가 좋은 출발점 이라고 생각 합니다. 지도 학습 또는 클러스터링과 같은 많은 작업을 수행 할 수 있으며 방법론에서 대규모 알고리즘 세트를 쉽게 비교할 수 있습니다.

Weka의 매뉴얼은 실제로 소개 자료로 사용할 수있는 머신 러닝 및 데이터 마이닝에 관한 책입니다.


2

프로그래밍에 익숙 하다고 가정하면 scikit-learn을 보는 것이 좋습니다 . 특히 미니 튜토리얼 및 기계 학습을 통한 빠른 둘러보기로 사용할 수있는 유용한 도움말 페이지가 있습니다. 흥미로운 부분을 고르고 예제를 통해 작업하십시오.




2

http://scikit-learn.org/ 페이지 의 배너에서 6x3 그래프 그리드를 재현 할 수 있다면 ML과 일부 Python을 배웠을 것입니다. 당신은 언어를 언급하지 않았습니다. 파이썬은 매우 빠르게 배울 수 있으며 scikit-learn은 광범위한 알고리즘을 구현했습니다.

그런 다음 자신의 데이터를 사용해보십시오!


1

게시 된 과정과 튜토리얼 외에도 조금 더 '손에 쥐는 '것을 제안합니다. Kaggle 은 여러분의 관심을 끌 수있는 입문 경쟁을합니다 (대부분의 사람들은 타이타닉 경쟁에서 시작). 그리고 더 많은 경험을 원할 때 탐구하고 경쟁해야 할 다양한 주제가 있습니다.


1

위에서 언급했듯이 Andrew Ng 교수의 MOOCs와 Yaser Abu-Mostafa 교수의 'Learning From Data'를 통해 ML의 기본 사항을 파악하십시오 .

R은 Kaggle 대회에서 가장 많이 사용되는 도구로 확실한 승자 입니다. (Kaggle 위키 및 포럼에서 리소스를 확인하는 것을 잊지 마십시오)

기본 R과 Python을 배우십시오. Coursera 'Data Science'트랙에는 소개 R 과정이 있습니다. 거의 모든 알고리즘은 Python 및 R 라이브러리에서 찾을 수 있습니다. 몇 가지 카글 경쟁에서 배운 알고리즘을 자유롭게 사용하십시오. 시작점으로 kaggle의 Titanic 데이터 셋 및 Digit 인식기 데이터 셋에 대한 여러 알고리즘의 성능을 비교하십시오 .

그리고 다양한 데이터 세트에서 계속 연습하십시오!

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.