기계 학습 요리 책 / 참조 카드 / 치트 시트?


57

확률 및 통계 요리 책데이터 마이닝을위한 R 참조 카드 와 같은 리소스는 매우 유용합니다. 그것들은 분명히 참고 자료로 잘 사용되지만 주제에 대한 내 생각을 정리하고 땅을 구하는 데 도움이됩니다.

Q : 머신 러닝 방법에 이러한 리소스가 있습니까?

각 ML 방법에 대해 다음을 포함하는 참조 카드를 상상하고 있습니다.

  • 일반 속성
  • 방법이 잘 작동하는 경우
  • 방법이 제대로 수행되지 않을 때
  • 이 방법이 일반화하는 방법 또는 기타 방법 대부분 대체되었습니다?
  • 방법에 관한 논문
  • 방법과 관련된 공개 문제
  • 계산 강도

이 모든 것은 교과서를 통해 최소한의 파기를 통해 찾을 수 있습니다. 몇 페이지에 넣는 것이 정말 편리합니다.


5
좋은 목표이지만 "일부 교과서를 통해 최소 파기"? 통계 학습 및 데이터 마이닝 + mloss.org/software/rating에 대한20 권의 책을 어떻게 압축하기 시작할 수 있습니까?
데니스


2
chuzpa의 경우 (+1), 그러한 개요가 존재한다면 지불해야합니다. 중요한 문제는 알고리즘 자체에서 파생 될 수있는 일부 속성 외에도 경험 또는 애플리케이션의 경험에 의해 대부분의 속성 또는 규칙이 얻어집니다. 나는 전투 강화 응용 연구원이나 ML 프레임 워크 프로그래머 / 컨설턴트가 그런 것을 쓸 수 있다고 확신합니다 ... 그러나 여기 그리고 지금?
steffen

@Denis : "20 권 .."링크가 작동하지 않습니다. 확인할 수 있습니까?
lmsasu

6
나는 기계 학습 전문가가 아니므로 다른 사람들에게 답변을 게시하도록 연기 할 것입니다 . 그러나 통계 학습의 요소는 해당 주제에 대한 좋은 텍스트로 간주되며 해당 분야에서 가장 큰 이름으로 작성되었습니다. 나는이 책이 높은 수준으로 쓰여졌 고 내가 들었던 사람들은 통계학 박사 학위를 받았다고 덧붙였다.
매크로

답변:


25

최고의 무료 리소스 중 일부는 다음과 같습니다.

저자의 질문에 관해서는 "한 페이지에 모두"솔루션을 충족시키지 못했습니다


세르게이, 이발사의 책은 Matlab에 묶여 있습니까?
데니스

2
예, 책의 링크를 살펴보십시오 . BRMLtool 상자는 독자가 수학적 모델이 실제 MAT-LAB 코드로 어떻게 변환되는지 확인할 수 있도록 제공됩니다.
Sergey

31

기계 학습을 배우려면 Andrew Ng 교수가 가르치는 겨울에 무료 온라인 ML 코스 에 등록하는 것이 좋습니다.

나는 가을에 이전 학습을했으며 모든 학습 자료는 뛰어난 품질을 갖추고 있으며 실제 응용 분야에 적합하며 책으로 혼자서 고생하는 것을 훨씬 쉽게 잡을 수 있습니다.

또한 직관적 인 설명과 최소한의 수학으로 아주 낮은 교수형 과일을 만들었습니다.


방금이 과정을 마쳤습니다. 또한 기계 학습에 관한 책을 이해하기 시작했습니다.
B 세븐

1
나는 지금이 링크가 coursera.org/course/ml
n611x007

14

예, 당신은 괜찮습니다; Christopher Bishop의 "Pattern Recognition and Machine Learning"은 일반적으로 참고할 수있는 훌륭한 책입니다.

상당히 최근의 책이지만 매우 잘 쓰여지고 넓게 쓰여진 David Barber의 " Bayesian Reasoning and Machine Learning "; 내가 느끼는 책은이 분야의 새로운 이민자에게 약간 더 적합하다.

Hastie et al.의 "Statistical Learning의 요소"를 사용했습니다. (매크로가 언급 한) 매우 강력한 책이지만 첫 번째 참고 자료로는 권하지 않습니다. 더 전문적인 주제에 대한 두 번째 참고 자료로 더 나은 서비스를 제공 할 수 있습니다. 이러한 측면에서 David MacKay의 책인 Information Theory, Inference 및 Learning Algorithms 도 훌륭한 작업을 수행 할 수 있습니다.


2
비숍 +1 균등 한 수준으로 명확한 개발. 여전히 좋은 동안 나는 항상 Hastie et al. 약간 고르지 못한.
공역 사전

1
+1-Hastie, Tibshirani 및 Friedman은 제가 개인적으로 좋아하는 것입니다.
StasK

1
개인적으로도 좋아하는 Hastie, Tibshirani 및 Friedman을 추천 해 주신 +1 다른 권장 사항에 감사드립니다. 나는 비 통계 학자 (또는 방금 현장에 들어온 사람들)에게 추천 할 좋은 책이 정말로 필요하기 때문에 그들에게 읽을 것이다.
Néstor

1
비숍 +1 실제로 고전 통계의 훌륭한 소스이지만 업데이트되고 위장되어 있습니다.
추측

10

이 질문은 중복되지 않는다는 의견이 일치하므로 머신 러닝 초보자를 위해 제가 가장 좋아하는 부분을 공유하고 싶습니다.

내가 발견 집단 지성 프로그래밍 저자 있기 때문에, 초보자를위한 쉬운 책 토비 세가 란이 데이터를 가능한 한 빨리 해킹에 그 / 그녀의 손이 더러워 얻을 수있는 중간 소프트웨어 개발자를 허용에 초점을 맞추고있다.

일반적인 장 : 데이터 문제에 대한 명확한 설명과 함께 알고리즘의 작동 방식에 대한 대략적인 설명과 몇 줄의 코드로 통찰력을 얻는 방법을 보여줍니다.

파이썬을 사용하면 모든 것을 빨리 이해할 수 있습니다 (파이썬을 알 필요는 없습니다. 진지하게도 전에는 몰랐습니다). DONT는이 책이 추천 시스템 작성에만 초점을 맞추고 있다고 생각합니다. 또한 텍스트 마이닝 / 스팸 필터링 / 최적화 / 클러스터링 / 검증 등을 다루므로 모든 데이터 마이너의 기본 도구에 대한 깔끔한 개요를 제공합니다.


6

Wis와 Frank, "Data Mining", Elsevier 2005는이 책과 함께 제공되는 Java 코드 라이브러리 (Weka)가 있으며 실제로 지향적이므로 자체 학습에 유용한 책입니다. 내가 가진 것보다 최신판이 있다고 생각합니다.


1
예,이 책은 "Machine Learning"이라고했지만 그 당시 출판사가 데이터 마이닝 광고를 타기 위해 이름을 "Data Mining"으로 변경했지만이 책은 DM이 아닌 ML에 관한 것입니다. 그러나 다른 분야입니다!).
clyfe

1
Tom Mitchell의 저서 "Machine Learning"도 매우 좋습니다. 스타일은 약간 오래되었지만 내용은 훌륭합니다.
Dikran Marsupial

그렇습니다. Tom Mitchell의 ML은 ML 성경과 같습니다.
clyfe


5

"통계 학습의 요소"는 귀하의 목적에 맞는 훌륭한 책이 될 것입니다. 2011 년 초에 출판 된이 책의 제 5 판은 http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf 에서 무료로 구할 수 있습니다 .


2
수학은 무겁기 때문에 자기 학습자가 따르기가 어려울 수 있습니다.
Atilla Ozgur

Springer가 70 달러를 청구 할 때 Trevor Hastie의 개인 페이지에서 어떻게 무료로 다운로드 할 수 있는지 알고 있습니까?
Alfred M.

확실하지는 않지만 Springer가 돈을 원하고 작가가 주로 자신의 책을 널리 알리고 싶다고 생각합니다. 이것은 Springer가 출판 된 기사를 판매하는 방법과 매우 유사하지만 저자의 웹 사이트에서 많은 "작업 용지 버전"을 자유롭게 사용할 수 있습니다.
DanB

참고로, 다운로드는 두 번째 버전 의 다섯 번째 인쇄용 입니다. 나는 Deming에 귀속되는 "하나님은 우리가 믿는 모든 사람들이 데이터를 가져옵니다"라는 주석의 각주를 좋아합니다. 이 주석은 데밍이 실제로 이것을 말하는 것을 확인하는 "데이터"를 찾을 수 없다는 아이러니를 지적합니다.
HeatfanJohn

당신은 언급해야한다 R과 통계 학습에 소개 종류의 자신처럼 --it 의 ESL (에서 수학하는 경우 - 라이트 ESL은 너무 어려운 것입니다).
Steve S

5

여기에 이미지 설명을 입력하십시오

기계 학습 문제를 해결하는 데있어 가장 어려운 부분은 직무에 적합한 견적서를 찾는 것입니다. 다른 추정기는 다른 유형의 데이터와 다른 문제에 더 적합합니다. 아래의 순서도는 사용자에게 데이터를 평가할 추정기와 관련하여 문제에 접근하는 방법에 대한 대략적인 지침을 제공하기 위해 마련된 것입니다. 아래 차트에서 견적을 클릭하면 설명서를 볼 수 있습니다.



3

다른 답변에 언급 된 대부분의 책은 매우 훌륭하며 실제로 어떤 책에도 잘못 갈 수는 없습니다. 또한 파이썬에 대한 다음 치트 시트scikit-learn매우 유용하다는 것을 알았습니다 .


2

나는 Duda, Hart 및 Stork "Pattern Classification"을 좋아합니다. 이것은 모든 것을 잘 설명하는 고전적인 텍스트의 최근 개정판입니다. 신경망과 SVM을 많이 다루도록 업데이트되었는지 확실하지 않습니다. Hastie, Tibshirani 및 Friedman의 저서는 최고에 관한 것이지만, 당신이 찾고있는 것보다 약간 더 기술적 일 수 있으며 주제에 대한 개요보다는 상세한 것입니다.


2

Microsoft Azure는 Anton Tarasenko가 게시 한 scikit-learn과 유사한 치트 시트를 제공합니다.

Microsoft Azure 기계 학습 알고리즘 치트 시트

(출처 : https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

그들은 통지와 함께 :

이 알고리즘 치트 시트에 제공된 제안은 대략적인 규칙입니다. 일부는 구부러 질 수 있으며 일부는 크게 위반 될 수 있습니다. 이것은 출발점을 제안하기위한 것입니다. (...)

Microsoft는 추가 세부 정보를 제공하는 소개 기사도 제공합니다.

이러한 자료는 Microsoft Azure에서 구현 된 방법에 중점을 둡니다.


1

통계 학습의 요소로 시작하지 마십시오. 그것은 훌륭하지만 참조 책이며, 당신이 찾고있는 것과 같지 않습니다. 나는 쉽게 읽을 수있는 프로그래밍 집단 지능으로 시작할 것이다.


ESL을 참조 텍스트로 특성화할지 확실하지 않습니다. 그것은 나에게 더 많은 개요 인 것처럼 보입니다. 광범위한 기술과 중요한 테마를 볼 수 있습니다.
추기경

1

원리를 잘 설명하는 기계 학습에 관한 첫 번째 책을 강력히 추천합니다.

기계 학습의 첫 번째 과정 인 Rogers and Girolami (Chapman & Hall / CRC 기계 학습 및 패턴 인식), 2011.

Chris Bishop의 책 또는 David Barber의 책은 원칙을 잘 이해하고 나면 더 넓은 책을 선택합니다.




0

Max Kuhn의 Applied Predictive Modeling에 있는 치트 시트가 좋습니다 . 이 책에는 여러 ML 학습 모델에 대한 좋은 요약표가 있습니다. 이 표는 부록 A 페이지 549에 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.