머신 러닝을 위해 무엇을 공부해야합니까?


9

작년부터 저는 기계 학습의 가장 중요한 논문을 이해하기 위해 다양한 과목을 공부했습니다.

S. Hochreiter & J. Schmidhuber. (1997).장기 단기 기억 . 신경 계산, 9 (8), 1735-1780.

그러나 수학적 배경이 없기 때문에 다음과 같은 주제를 배우기 시작했습니다.

  • 계산법
  • 다변량 미적분
  • 수학적 분석
  • 선형 대수
  • 미분 방정식
  • 실제 분석 (측정 이론)
  • 초등 확률과 통계
  • 수학적 통계

지금, 나는 그 과목들을 엄격히 연구했다고 말할 수는 없지만, 위의 과목들이 무엇을 다루고 싶어하는지 알고 있습니다. 문제는 내가 지금해야 할 일을 모른다는 것입니다. 머신 러닝은 많은 문제를 해결하기 위해 사용하는 많은 주제가 있으며,이를 올바르게 활용하는 방법을 모르겠습니다.

예를 들어, 강화 학습은 이제 수십만 명의 연구원들이 차원의 저주를 돌파하기 위해 연구를 수행하는 가장 인기있는 주제 중 하나입니다. 그러나 IT 회사에서 일할 미래의 직원으로서, 책상 위에서하는 일은 제가 기대하지 않은 일이었습니다.

현장에서 일하기 위해서는 내 전문 지식이 있어야합니까? 그렇다면 지금 어떤 종류의 과목을 공부해야합니까?

귀하의 편의를 위해 Markov 프로세스 및 Markov 의사 결정 프로세스에 대해 자세히 알고 싶습니다.


1
LSTM 논문의 모든 내용 을 이해했다면 ML에서 경력을 쌓을 수있는 "전제 조건"이 이미 어느 정도 있다고 할 수 있습니다. 물론, 당신은 당신의 방식으로 새로운 개념 (모두가하는)을 찾을 수 있지만, 당신은 (자신의 연구를 통해) 그것들을 다룰 수 있습니다. LSTM 논문을 이해한다면 Markov 프로세스와 MDP는 큰 문제가되지 않습니다.
nbro

답변:


4

인공 지능 석사 학위 학생으로서 기계 학습의 기본 사항을 공부하는 것이 좋습니다.

그러기 위해서는 Kaggle 경쟁을 시도하여 이론과 실습에 대한 좋은 책 ( Machine Learning , Tom Mitchell, McGraw Hill, 1997)을 얻을 수 있습니다 .

나는 현장에서 전문가이기 때문에 Mitchell의 책을 제안했으며 많은 기계 학습 과정이 그의 책을 사용합니다. 온라인으로 그의 비디오 강의를 따를 수도 있습니다

Kaggle에서 사용 가능한 데이터 세트 작업을 시작하는 유용한 자습서 (노트북)를 찾을 수 있습니다. 타이타닉 챌린지 관련 튜토리얼


5

실제로 머신 러닝 알고리즘을 구현하기 위해 이러한 주제에 대한 엄격한 연구가 필요하지 않습니다. 머신 러닝에서는 확률 이론 만 엄격하게 다루어야합니다. 여기에 매우 좋은 확률 이론 강의가 있습니다 :

확률 소개-불확실성의 과학

또한 미적분학의 기본 과정으로 충분할 것입니다. 기본 구현의 경우 새로운 무언가로 맞춤형 체중 증량 계획이나 신경망을 만들고 싶지 않으면 실제로 고수준 미적분학에 대한 이해가 필요하지 않습니다. 그러나 미적분학에 대한 직관을 얻으려면 칸 아카데미를 확인하십시오 : 미적분학

Linear Algebra의 몇 가지 기본 아이디어만으로도 사물을 시각화하고 직감을 얻을 수 있습니다. 칸 아카데미는 내가 그것을 체크 아웃을 제안,이에 큰 과정이있다 : 선형 대수학

마찬가지로 프로그래밍 언어의 경우 머신 러닝 또는 신경망은 데이터 시각화 및 프로그래밍이 매우 쉬우므로 Python 또는 R에서 구현하는 것이 가장 좋습니다.

신경망과 기계 학습을 구현하는 데있어 가장 중요한 것은 실용적 일수록 연습을 많이할수록 좋습니다. 당신은 또한 당신이 연습으로 무엇을하고 있는지 직감을 얻습니다. 이론을 이해하고 개념을 이해하는 것만으로는 도움이되지 않습니다. 실생활에서 구현해야합니다. 책에 관한 한 여기에서 내 대답을 볼 수 있습니다.

숙련 된 프로그래머를위한 AI 이론 / 도구 / 응용 프로그램의 Vetted 소스?


3

I found statistical models very helpful. However, statistics on its own isn't enough, you also need a very solid background in probability theory.


1

learn basics of python first. Start with baye's theorem then go to 1) probability density functions 2) cumulative density functions 3) continuous functions 4) central limit theorem.


게다가 기계 학습의 고급 수준의 논문을 보려면 대학원 수준 확률 이론을 배우는 것이 중요하다고 생각하십니까? 또한 위의 모든 것을 알고 있다고 가정합니다 (무례하다는 의미는 아니지만 정직하게 말하면 연속성과 균일 연속성, pdf, cdf, mgf 등의 차이점이 무엇인지 알고 있습니다). 생산 수준 프로그램을 만들기 위해 markov 프로세스를 배우는 것이 중요하다고 생각하십니까?
Windforces

1

먼저 저에 대한 간단한 배경 지식입니다. 나는 생물 물리학을 전공 한 대학원생이었습니다. 열심히 노력하고 현명한 의사 결정을 한 후, 저는 현재 컴퓨터 과학 석사 (기계 학습 전문)를 보유한 AI / ML 소프트웨어 엔지니어입니다.

현장에서 일하기 위해서는 내 전문 지식이 있어야합니까?

물론, 반드시 전문적인 상황 일 필요는 없습니다. 머신 러닝 소프트웨어 엔지니어로 고용되어있을 필요는 없지만 현장에 능숙해야합니다. 귀하의 질문의 두 번째 부분에 대한 훌륭한 견해입니다 ...

그렇다면 지금 어떤 종류의 과목을 공부해야합니까?

그들은 당신이 집중해야 할 하나의 주제가 아닙니다. 머신 러닝은 여러 분야의 조합으로,보다 철저한 연습을하기 전에 한 분야에만 집중하는 것은 그리 효율적이지 않습니다. 대신 튜토리얼과 연습은 게임의 이름입니다.

  • YouBlue의 3Blue1Brown 은 특히 ​​신경망에 대한 훌륭한 자습서를 제공합니다.
  • 칸 아카데미 는 수학 튜토리얼에있어 신의 선물입니다. 선형 대수와 확률 / 통계가 가장 좋습니다. 그러나 다변량 미적분 및 미분 방정식도 결국 사용됩니다.
  • Udacity 는 인공 지능 및 머신 러닝에 대한 경험을 제공하기 위해 "nanodegree"프로그램을 제공하는 훌륭한 자습서 사이트입니다. 비디오를보고 싶다면 무료입니다.
  • OpenAIGym 은 강화 학습을 연습하기에 좋은 장소입니다
  • Kaggle 은 머신 러닝에 대한 훌륭한 튜토리얼을 보유하고 있으며 컨테스트는 감독 / 비지 도 학습을 통해 훌륭한 실습을 제공합니다.

실제 개발 및 연습을 통해 이론 및 수학적 배경에서 개발을 보완하여 최상의 결과를 얻으십시오. Udacity 자습서와 OpenAIGym이 모두 훌륭한 연습을 제공하는 MDP에 중점을 둡니다.

석사 학위에 관심이 있다면 Georgia Tech의 온라인 석사 온라인 컴퓨터 과학 ( OMSCS )을 충분히 추천 할 수 없습니다 . 그것은 훌륭한 교육이며, (2015 년에 등록했을 때) GRE가 필요 없으며 비용은 약 $ 8000.00입니다.


-1

3 개월 만에 머신 러닝 배우기

이것은 "3 달에 기계 학습을 알아보기"를위한 교육 과정이다 video by Siraj Raval on Youtube

1 개월

1 주차 선형 대수

https://www.youtube.com/watch?v=kjBOesZCoqc&index=1&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/

둘째 주 미적분

https://www.youtube.com/playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr

3 주차 확률

https://www.edx.org/course/introduction-probability-science-mitx-6-041x-2

4 주 알고리즘

https://www.edx.org/course/algorithm-design-analysis-pennx-sd3x

2 개월

1 주차

데이터 과학을위한 파이썬 배우기

https://www.youtube.com/watch?v=T5pRlIbr6gg&list=PL2-dafEMk2A6QKz1mrk1uIGfHkC1zZ6UU

지능의 수학

https://www.youtube.com/watch?v=xRJCOz3AfYY&list=PL2-dafEMk2A7mu0bSksCGMJEmeddU_H4D

Tensorflow 소개

https://www.youtube.com/watch?v=2FmcHiLCwTU&list=PL2-dafEMk2A7EEME489DsI468AB0wQsMV

둘째 주

ML 소개 (Udacity) https://eu.udacity.com/course/intro-to-machine-learning--ud120

3-4 주차

ML 프로젝트 아이디어 https://github.com/NirantK/awesome-project-ideas

3 개월차 (딥 러닝)

1 주차

딥 러닝 소개 https://www.youtube.com/watch?v=vOppzHpvTiQ&list=PL2-dafEMk2A7YdKv4XfKpfbTH5z6rEEj3

둘째 주

Fast.AI에 의한 딥 러닝 http://course.fast.ai/

3-4 주차

내 github에서 DL 프로젝트를 다시 구현 https://github.com/llSourcell?tab=repositories


추가 자료 :
-ML의 사람들이 Twitter에서 팔로우


1
예, 왜이 답변을 하향 조정했는지 알려 드릴 수 있습니다. 1) 전제 조건을 연구하여 3 개월 안에 기계 학습을 잘 배울 수 있다고 생각하지 않습니다. 2) 학습 할 때마다 속도가 다르므로 학습을 3 개월로 제한하는 것은 좋은 생각이 아닙니다. 3) 이유를 설명하지 않고 사람들을 다른 출처와 연결하고 있습니다.
nbro

우리는 프로가 될 수 없지만 최소한 뉘앙스가되어 일부를하고 ML 경쟁을 이끌 수 있습니다. 링크를 넣으면 해당 링크에서 얻을 수있는 것을 언급했습니다. 또한 모든 사람들은 각자의 학습 속도를 가지고 있으며 그 시점에도 동의하지만이 3 개월 안에 손을 더럽힐 수 있습니다. 이것은 아무것도 모르는 것을 고려할 때 매우 일반적인 대답입니다. 그들은 더 깊이 파고 들기 시작한 후에 자신감을 얻고 싶어합니다.
Maheshwar Ligade 19 :

@nbro 만일 내가 당신의 요점에 동의한다면 모든 사람들이 자신의 학습 속도를 가지고 있다면 최소한이 사람들이이 답변을 활용할 수 있습니다
Maheshwar Ligade

이 답변은하지 연구원 및 과학자의 엔지니어들에게 더 적용
Maheshwar Ligade
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.