데이터 과학을 스스로 배우는 방법? [닫은]


16

나는 독학으로 웹 개발자이며 데이터 과학을 가르치는 데 관심이 있지만 시작 방법을 잘 모르겠습니다. 특히 궁금합니다.

  1. 데이터 과학에는 어떤 분야가 있습니까? (예 : 인공 지능, 기계 학습, 데이터 분석 등)
  2. 사람들이 추천 할 수있는 온라인 수업이 있습니까?
  3. 내가 연습 할 수있는 프로젝트가 있습니까 (예 : 열린 데이터 세트).
  4. 신청하거나 완료 할 수있는 인증이 있습니까?

답변:


15

사이트에 오신 것을 환영합니다, 마틴! 그것은 꽤 광범위한 질문이므로 아마도 다양한 답변을 얻을 것입니다. 여기 내가 가져 가라

  1. 데이터 과학 은 일반적으로 고전적인 통계, 기계 학습 및 컴퓨터 과학을 결합한 것으로 여겨지는 학제 간 분야입니다 (다시 말하면 요청하는 사람에 따라 다르지만 여기에는 비즈니스 인텔리전스 및 가능한 정보 시각화 또는 지식 발견 등이 포함될 수 있음). 데이터 과학에 관한 wikipedia 기사 ). 우수한 데이터 과학자는 또한 그들이 일하는 도메인의 도메인 별 특성을 파악하는 데 능숙합니다. 예를 들어, 병원 기록에 대한 분석 작업을 수행하는 데이터 과학자는 Biomedical Informatics에 대한 배경 지식이있는 경우 훨씬 효과적입니다.
  2. 관심있는 분석 유형에 따라 여기에 많은 옵션이 있습니다. Andrew Ng의 코스 과정은 가장 많이 언급 된 첫 번째 리소스 입니다. 머신 러닝에 관심이 있다면 시작하기 좋은 곳입니다. 관련 수학에 대한 심층 탐구를 원한다면 Tibshirani의 통계 학습 요소 는 훌륭하지만 상당히 고급 스러운 텍스트입니다. Ng 외에도 많은 온라인 과정을 이용할 수 있지만 집중하고자하는 분석 유형 및 / 또는 작업하려는 도메인을 염두에두고 선택해야합니다.
  3. Kaggle . 실제 분석 문제에 대해 자세히 알아 보려면 kaggle로 시작하십시오. 그러나 전문 지식 수준에 따라 더 간단하게 시작하는 것이 좋습니다. 프로젝트 오일러 는 여전히 워밍업 작업으로 사용하는 일회성 연습 문제에 대한 훌륭한 리소스입니다.
  4. 다시 말하지만, 이것은 아마도 당신이 일하고자하는 도메인에 달려있을 것입니다. 그러나 Coursera가 일련의 데이터 과학 관련 과정을 완료하면 데이터 과학 인증서를 제공한다는 것을 알고 있습니다. 이곳은 시작하기에 좋은 곳일 것입니다.

행운을 빕니다! 다른 구체적인 질문이 있으시면 언제든지 의견을 남겨 주시면 최선을 다해 도와 드리겠습니다.


1
이것으로 되돌아 가면 Andrew Ng의 과정어렵습니다 . 나는 수학에 강하지 않다고 언급 했어야했다. 이 다른 데이터 과학 코스 는 로프 학습에 조금 더 쉽다고 들었습니다 . 어떻게 생각해?
Martin

5

나는 독학 데이터 과학자이며, 어떻게해야하는지 설명하기 위해 최선을 다할 것입니다.


데이터 과학에는 어떤 분야가 있습니까? (예 : 인공 지능, 기계 학습, 데이터 분석 등)

데이터 과학은 매우 넓은 영역입니다. 데이터 과학에 관한 것입니다. 따라서 데이터를 사용하여 의사 결정을 내리는 모든 분야가이 영역에 속합니다. 일부 필드에는 다음이 포함됩니다.

  • 일체 포함
  • 패턴 인식 및 분석
  • 생물 통계
  • 통계 학습
  • 기계 학습
  • 데이터 미학 (또는 데이터 시각화)
  • 데이터 저널리즘

사람들이 추천 할 수있는 온라인 수업이 있습니까?

나는 비슷한 질문 에 대답 했다 . 그래서 여기에 인용하겠습니다.

Coursera의 기계 학습 과정으로 시작하십시오 . 학생을 기계 학습 영역에 소개하는 데 정말 효과적이며 개념의 견고한 토대를 마련하는 데 도움이됩니다.

이 과정에서 수학이 약간 바보처럼 느껴 지면 동일한 교수가 가르치고 이전보다 수학 집약적 인 이 과정을 수강 할 수 있습니다 .

이제 머신 러닝의 기본 개념에 대해 명확하게 이해할 수 있습니다. 이제 걸릴 이 과정 후속 또는 앤드류 응의 과정에 대한 보충으로 말할 수있다.

IAPR의이 리소스는 교차 유효성 검사, 정규화 등과 같은 많은 ML 개념에 대한 심층적 인 메모를 제공합니다.

Quora의 블로그로 컴파일 된 이 놀라운 리소스 목록을 살펴볼 수도 있습니다 .

이제 신경망과 딥 러닝의 고급 개념을 익히기 위해이 무료 도서 를 이용할 수 있습니다 .

마지막으로, 무료 전자 책 : Statistical Learning의 요소는 ML 또는 Statistical Learning 초보자를위한 훌륭한 책입니다.

그 외에도 Quora의 데이터 과학 참조 저장소를 확인하십시오 .


내가 연습 할 수있는 프로젝트가 있습니까 (예 : 열린 데이터 세트).

인도의 공개 데이터 세트로 프로젝트를 시작했습니다. 그러나 여기서 놀라운 토론 을 확인 하고 해당 프로젝트를 수행 한 후 Kaggle로 시작할 수 있습니다.


신청하거나 완료 할 수있는 인증이 있습니까?

제 생각에는 데이터 과학 인증 이 없습니다 . 예, 많은 빅 데이터 인증이 있지만 신진 데이터 과학자에게 실제로 유용한 것으로 보지 못했기 때문에 ML 및 데이터 기술에 충분히 확신이있을 때까지는 추격하지 않는 것이 좋습니다.


1

데이터 과학 분야의 Coursera 전문 분야부터 시작하는 것이 좋습니다. Johns Hopkins의 데이터 과학 전문 분야는 가장 오래된 전문 분야입니다. 나는 책과 kaggle을 권장하지 않습니다. 그들은 처음에 당신을 혼동합니다. 코딩은 데이터 과학에서 가장 쉬운 부분이므로 많은 것을 배워야합니다. 현장에 대한 아이디어를 얻으려면 이 벤 다이어그램을 시작하는 것이 좋습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.