확률 이론에 대해 배우고 이론을 측정하고 마침내 기계 학습을 배우고 싶습니다. 나의 궁극적 인 목표는 소프트웨어에서 머신 러닝을 사용하는 것입니다.
나는 대학에서 미적분학과 매우 기본적인 확률을 연구했지만 그 정도입니다. 이 주제에 대해 배울 수있는 온라인 코스 나 서적을 알고 있습니까? 웹에서 많은 리소스를 찾았지만 모두 전문가를 대상으로합니다. 시간이 좀 걸리 겠지만 처음부터 배우고 싶다면 어디에서 시작해야합니까?
확률 이론에 대해 배우고 이론을 측정하고 마침내 기계 학습을 배우고 싶습니다. 나의 궁극적 인 목표는 소프트웨어에서 머신 러닝을 사용하는 것입니다.
나는 대학에서 미적분학과 매우 기본적인 확률을 연구했지만 그 정도입니다. 이 주제에 대해 배울 수있는 온라인 코스 나 서적을 알고 있습니까? 웹에서 많은 리소스를 찾았지만 모두 전문가를 대상으로합니다. 시간이 좀 걸리 겠지만 처음부터 배우고 싶다면 어디에서 시작해야합니까?
답변:
나는 당신을 위해 매우 좋고 인기있는 두 가지 참고 문헌이 있다고 생각합니다 (계리 과학에서 석사 배경을 가지고 이것들부터 시작했습니다).
Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani의 통계 학습 소개 (R에 응용 프로그램 포함). 그것은이다 자유롭게 사이트에서 사용할 수 꽤 포괄적이고 pratical 예제를 이해하기 쉽습니다. 매우 강력한 통계적 배경이 없어도 많은 것을 배울 수 있습니다.이 참조는 다양한 프로파일에 적합하며 수학 세부 사항에 깊숙이 들어 가지 않고 R에서의 구현과 함께 적절한 수의 인기있는 알고리즘을 포함합니다.
Trevor Hastie, Robert Tibshirani, Jerome Friedman의 통계 학습 요소 . 첫 번째 책과 비교해 볼 때,이 책은 당신이 유용하다고 생각하는 특정 알고리즘에 대해 더 탐구하고 싶다면 수학적 측면에 대해 더 자세히 다룹니다. ( 무료입니다 )
물론 Cross Validated 는 최고의 실용, 통계적 오해 및 오용 등 많은 것을 배울 수있는 최고의 소스 중 하나입니다. 학교 / 대학에서 교습과 수년간의 학습을 한 후, 처음 Cross Validated에 갔을 때 지식이 너무 제한적이라는 것을 알았습니다. 나는 처음 방문한 이후 매일 여기에 가서 많은 것을 배우고 있습니다.
다음은 제가 추천하는 무료 온라인 코스입니다.
측정 이론이 필요하지 않습니다. 측정 이론은 수학적 근사치 등의 다른 수학적 절차를 정당화하기 위해 수학자에 의해 사용됩니다. 대부분의 엔지니어는 측정 이론을 연구하지 않았으며 결과 만 사용했을 것입니다. ML에 필요한 수학 지식은 다변량 가우시안을 통합 할 수 있다는 것이 특징입니다.
프로그래머에게 확률 / 통계를 가르치는 것을 목표로하는 Allen Downey의 Think Stats를 추천합니다. 아이디어는 프로그래밍 전문 지식을 활용하여 시뮬레이션을 수행하고 따라서 확률 이론 / 통계 방법을 이해하는 것입니다. 앨런 다우니 블로그 (그는 다른 사람을 작성했습니다) Think stats (무료) pdf )
머신 러닝에 관심이 있으니 확률과 기억을 건너 뛰고 ML로 바로 넘어가겠습니다. 앤드류 응스 e는 시작하기 좋은 곳입니다. 말 그대로 2 주 안에 끝낼 수 있습니다.
몇 주 동안 배운 것을 가지고 놀다가 뿌리로 돌아가서 몇 가지 확률을 연구하십시오. 당신이 엔지니어라면, 당신이 대학에서 건너 뛰는 방법에 당황합니다. 예전에는 공학에서 필수 과정이었습니다. 어쨌든, MIT OCW 코스를 이수하면 이곳 을 따라갈 수 있습니다 .
나는 당신이 측정 이론이 필요하다고 생각하지 않습니다. 아무도 이론을 측정 할 필요가 없습니다. 그렇게하는 사람들은 이곳에 와서 묻지 않을 것입니다. 왜냐하면 그들의 조언자가 어떤 과정을 수강할지 알려줄 것입니다. 조언자가 없으면 반드시 필요하지 않습니다. 문 신학이지만 사실입니다.
측정 이론이있는 것은 "쉬운 독서"로는 배울 수 없다는 것입니다. 기본적으로 연습과 문제를 해결해야합니다. 내 생각에 그것은 교실 밖에서는 사실상 불가능합니다. 여기에서 가장 좋은 방법은 지역 대학에서 수업을 듣는 것입니다. 때로는 박사 수준의 확률 과정이 한 클래스에서 측정과 확률을 수행 할 것입니다. 아마도 최선의 방법 일 것입니다. 고문을 정말로하고 싶지 않다면 수학 부서에서 순수한 측정 이론 수업을받는 것은 좋지 않습니다. 결국 당신은 크게 만족할 것입니다.
기계 학습의 경우 Peter Flach 가 데이터 를 감지 하는 기계 학습 : 알고리즘의 예술과 과학이 좋은 출발점이 될 수 있습니다. 직관적 인 예제를 통해 기계 학습에 대한 일반적인 소개를 제공하며 초보자에게 적합합니다. 나는이 책이 특히 머신 러닝 실험을 다루는 마지막 장 때문에 좋아합니다. 기계 학습에 대해 배우는 동안 다른 모델을 아는 것만으로는 충분하지 않으며 다른 기계 학습 알고리즘을 비교할 수 있어야합니다. 나는이 책이 그 알고리즘들을 비교하는 방법을 이해하기 쉽게 만들었다 고 생각한다. 강의 슬라이드는 여기 에서 찾을 수 있습니다 .
위의 훌륭한 제안에 덧붙여, 확률과 통계에 관한보다 기본적인 개념을 확고히 이해하고자한다면, "알고리즘에서 Z- 점수까지 : 통계 확률 론적 컴퓨팅"은 컴퓨터를 사용하는 훌륭한 입문서입니다. 확률 이론과 확률 론적 과정에서 가장 중요한 초급 / 중급 개념을 이해합니다. 또한 기계 학습 (ML)에 대한 소개로 "통계 학습 소개"또는 "통계 학습 요소"(ESL)를 두 번째로 살펴 보겠습니다. ESL은 특히 훌륭하다고 생각하지만 ML 개념을 훨씬 더 수학적으로 많이 살펴볼 필요가 있습니다. 따라서 통계에서 자신을 "괜찮아"고만 생각한다면 더 많은 정보를 얻은 후에 읽을 수 있습니다. ML에 대한 경험.
취업 또는 문제 해결을 위해 기계 학습에 관심이 있다면 실무 경험을 얻는 것이 중요합니다. 데이터 과학 / 기계 학습 과정을 소개합니다. Andrew Ng는 Coursera의 코스에서 머신 러닝에 대한 놀라운 소개를하고 있습니다 . 또한 일부 데이터 세트를 다운로드하여 데이터를 재생하는 것이 좋습니다. 당신이하지 않았다면, 다운로드 R과 RStudio (내 생각에, 더 파이썬 또는 matlab에 비해 초보자 친화적 인), 그리고에 가입 kaggle 과 초보자 문제의 일부를 않습니다. 기본적으로 실제로 무슨 일이 일어나고 있는지 전혀 몰라도 ML을 사용할 수있는 훌륭한 연습이 있지만 실제로 ML 솔루션을 구현하기 위해 취해야 할 단계에 대한 아이디어를 제공합니다.
나는 자신이 무엇을하는지 모르고 ML 도구를 사용하여 시작하는 방법을 개인적으로 권장합니다. 교차 유효성 검사, 과적 합, 혼동 행렬 사용, 모델의 우수성에 대한 다양한 측정법 등과 같은 기본 개념을 학습합니다. 알고리즘 사용 방법을 알고 작업이 작동하는시기를 식별하는 방법을 아는 것이 훨씬 더 중요합니다 알고리즘이 작동하는 방식을 이해하는 것보다 작동하지 않습니다.