답변:
응용 프로그램 중심의 책을 원한다면 Christopher Bishop의 Model-Based Machine Learning을 고려하십시오 . 그는 더 많은 기술 서적을 가지고 있습니다.
많은 코드를 찾고 있다면 해커를위한 확률 적 프로그래밍 및 베이지안 방법 이 옵션입니다.
더 통계적으로 구부러진 또 다른 입문서 는 R의 응용 프로그램을 사용한 통계 학습 소개 입니다. 다시, 저자들은이 책의 잘 알려진 기술 버전을 가지고 있습니다.
몇 주 전에 같은 질문이있었습니다.
개인적으로 O'Reilly의 Python for Data Analysis 는 기본 학습에 매우 유용하다는 것을 알았습니다 . 이 책은 파이썬 프로그래밍 경험이 있다고 가정하지만 기본 사항을 다루는 부록도 있습니다.
저자는 처음 몇 장에서 만들 수있는 다양한 실제 세계 (몬티 파이썬이 아닌) 예제를 제공하고, 책이 진행되면서 지식에 대한 각 내용에 대해 자세히 설명합니다.
지침이 매우 쉽고 단계별로 발견되었습니다. 이 모든 것에 대한 나의 안내자인 나의 교수는 내가 얼마나 빨리 배웠는지에 깊은 인상을 받았습니다.
또한 Kaggle에 대한 좋은 소식을 들었습니다.
Microsoft Azure Machine Learning 및 R을 사용한 클라우드의 데이터 과학 은 예제를 통해 자세히 설명하는 무료 교재입니다. 책에서 이익을 얻기 위해 필요하지 않은 특정 도구를 사용하지 마십시오.
내가 좋아했던 또 하나는 Programming Collective Intelligence 이며, 대부분의 책이 빛나는 웹 스크랩 핑 부분을 포함하여 많은 프로젝트를 자세히 진행합니다.
데이터 과학, 통계 및 기계 학습 주석이 달린 노트북이 포함 된이 Ipython 노트북 모음을 추천 할 수 있습니다.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
흥미로운 단계별 설명을 볼 수있는 곳 중 하나는 Kaggle 튜토리얼과 수상자 인터뷰 입니다. 종종 사람들은 그들의 접근법에 대한 자세한 요약을 게시 할 것입니다.
살펴보십시오 :
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
여기에는 단계별 자습서가 포함되어 있으며 데이터 탐색, 데이터 분석 및 예측 모델 작성의 전체 프로세스에 대한 아이디어를 제공합니다.
데이터 탐색 및 기능 엔지니어링에 대한 설명 (관련 기능을 선택하는 방법)은 다음과 같습니다.
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
실제 경험을 얻기 위해 튜토리얼이있는 첫 5 개의 데이터 세트를 참조하십시오.
또한 살펴보십시오 :
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
여기서 그는 단일 데이터 세트에서 여러 모델을 사용하여 다양한 모델에 대한 기본적인 수준의 이해를 제공합니다.
모델 선택에 대한 자세한 내용을 보려면 다음을 살펴보십시오.
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
위 링크에는 현장에서 일하는 사람들이 제공 한 답변이 있습니다.
다른 데이터 세트에 대한 통찰력을 얻으려면 항상 kaggle에 로그인하여 경쟁을 통해 다양한 데이터 세트를 살펴보고 커널에서 사람들의 코드에 액세스 할 수 있습니다. Kaggle의 포럼은 사람들이 다른 모델을 사용하여 문제와 접근 방식에 대해 토론 할 때 도움이됩니다.