데이터 마이닝 및 머신 러닝을 준비하기 위해 어떤 수학 과목을 제안 하시겠습니까?


30

데이터 마이닝 및 기계 학습을 준비하기 위해 자체 지시 수학 커리큘럼을 구성하려고합니다. 이것은 코스타에서 Andrew Ng의 머신 러닝 수업 을 시작 하고 진행하기 전에 수학 능력을 향상시켜야한다고 느꼈습니다. 얼마 전 대학을 졸업 했으므로 대수와 통계 (특히 정치 과학 / 심리학 수업)는 녹슬 었습니다.

스레드의 답 수학의 강력한 배경이 ML의 전제 조건입니까? 기계 학습과 직접 관련된 서적이나 수업 만 제안합니다. 나는 이미 그 클래스들과 서적들 중 일부를 살펴 보았고 어떤 수학 과목을 공부해야하는지 정확히 알지 못했습니다 (예 : 수학 함수의 어떤 필드 (들)가 "비용 함수를 최소화하기 위해 방정식을 도출 하는가?"). 제안 된 다른 스레드 ( 데이터 분석가가 필요한 기술 및 과정 ) 는 데이터 분석에 필요한 광범위한 기술 범주 만 언급합니다. 수학자 통계 개요 스레드 는 아직 수학 학위가 없기 때문에 적용되지 않습니다. 유사한 스레드 수학자가 품질 통계 학위와 동등한 지식을 원합니다. 통계 책 목록에는 놀라운 목록이 있지만 다시 한 번, 녹슨 대수를 기억하여 수학을 시작하고 거기에서 위로 올라갑니다.

머신 러닝과 데이터 마이닝 분야 에서 일하는 사람들은 어떤 수학 분야에서 일을해야한다고 생각하십니까? 데이터 마이닝 및 머신 러닝을 준비하기 위해 어떤 수학 과목을 제안 하시겠습니까? 여기까지 내가 가진 목록과 순서는 다음과 같습니다.

  • 대수학
  • 미적분학
  • 계산법
  • 선형 대수
  • 개연성
  • 통계 (여기서는 여러 하위 필드가 있지만이를 분리하는 방법을 모름)

데이터 마이닝 및 머신 러닝에 관해서는 현재 직장을 통해 웹 사이트 / 앱 활동, 고객 / 가입 트랜잭션 및 부동산 데이터 (정적 및 시계열)에 대한 레코드에 액세스 할 수 있습니다. 데이터 마이닝 및 머신 러닝을 이러한 데이터 세트에 적용하고 싶습니다.

고맙습니다!

편집하다:

후세를 위해, 나는 CMU 의 Geoffrey Gordon 's / Alex Smola의 기계 학습 입문 강의를 위한 유용한 수학 자체 평가 를 공유하고 싶었습니다 .


3
Coursera 수업을위한 전제 조건으로, 해당 정보는 자료의 어딘가에 있어야합니다. 수업 외 / 더 일반적으로 stat / ML / DM에 필요한 수학에 대한 질문은 저를 복제본으로 여깁니다. 를 포함하여,이 물질을 포함 CV에 여러 스레드가 있습니다 것은 : a는-강한-배경 --수학-A-필요한-에 대한-ML에 , 기술-과정은 필요에 - 될-A-데이터 분석 ( 아마도 다른 사람들 중에서도).
gung-모니 티 복원

1
해당 스레드, 밀접하게 연결된 스레드를 검토하고 사이트를 검색하십시오. 주변을 둘러 본 후에도 여전히 궁금한 점이 있으면 여기로 돌아와서이 Q를 편집하여 다른 곳에서는 다루지 않았 음을 여전히 알아야 할 사항을보다 구체적으로 지정하십시오.
gung-모니 티 복원

답변:


15

@gung이 제안한 제안은 확실히 가치가 있습니다. 코스 과정을 마친 후에는 귀하의 목록이 좋은 출발이라고 생각합니다. 일부 의견 :

  1. 선형 대수와 행렬 대수는 같은 것이므로 후자를 버리십시오.
  2. 미적분학에서는 부분 미분을 포함해야합니다. 이것은 말하자면, 만약 치석 상징적으로 하나 개 이상의 변수 (의 함수에 적용 의 함수이고 과 다음 원하는 대신 ). 다행히도 이것은 어렵지 않습니다.엑스와이엑스엑스
  3. 미적분학에서는 기본 통합을 넘어서는 아무것도 필요하지 않습니다 (아마도 그렇지 않음). 통합이 어렵 기 때문에 운이 좋다.
  4. 기본 최적화를 추가합니다. 즉 함수의 최대 또는 최소, 일반적으로 둘 이상의 변수의 함수를 찾습니다. 적어도 경사 하강에 대한 이해는 필수적입니다.
  5. 어려움의 관점에서 당신은 아마 1 학년 학기 시작과 끝 사이에있을 수 있습니다.
  6. 온라인이나 다른 방법으로 기본 확률 및 통계 텍스트를 읽으려고하지만 너무 걱정하지 마십시오 (기본 수학은 확률과 통계를 이해하기위한 전제 조건입니다). 당신이 제안하는 것과 같은 일부 과정을 수행한다면, 당신은 무엇을 배우고 관심이 어디에 있는지 알아낼 것입니다. 적어도 처음에는 원하지 않는 한 가지 가설 검정에 대해 배우는 데 많은 시간을 할애하는 것입니다. 오히려 기본 통계 (임의 변수, 확률 분포 (PFD, CDF), 설명 통계)를 이해하고 나서 회귀를 이해하려고합니다.

5

이 포럼에는 데이터 과학 작업의 중요한 기술에 대한 개념적인 개요를 개발하는 데있어 특히 도움 된이 포럼을 포함하여 몇 가지 훌륭한 주제가 있습니다.

위에서 언급했듯이 많은 온라인 코스가 있습니다. 예를 들어 Coursera에는 이제 작업에 필요한 일부 도구를 다루는 여러 코스 가 포함 된 데이터 과학 전문화 가 있습니다.


3

머신 러닝 / 데이터 마이닝을 대량으로 사용하려는 경우 최적화 / 선형 대수 / 통계 및 확률을 강력히 권장합니다. 다음 은 확률에 대한 책 목록입니다. 희망이 도움이됩니다.


3

매우 기본적인 수학 기술을 칫솔질하는 한, 나는이 책들을 사용하고 있습니다 :

경제 및 금융을위한 수학 요소. Mavron, Vassilis C., Phillips, Timothy N이 책은 필수 수학 기술 (더하기 빼기), 부분 미분, 적분, 행렬 및 결정자, 최적화 및 미분 방정식에 대한 작은 장을 다룹니다. 그것은 경제와 금융을 목표로하지만, 작은 책이고, 일련의 장들이 나의 필요에 맞고, 쉽게 읽을 수 있습니다.

통계 분석 : Microsoft Excel 2010. Conrad Carlberg 기본 통계 분석, 다중 회귀 분석 및 공분산 분석을 다루며 Excel을 사용합니다.

R. Andy Field, Jeremy Miles, Zoë Field를 사용하여 통계 발견 아직 읽지 않았습니다. R을 사용합니다.

초등 선형 대수. Ron Larson, David C. Falvo.

매트릭스 방법 : 응용 선형 대수 작성자 : Richard Bronson, Gabriel B. Costa. 초등 선형 대수와 행렬 미적분학을 다룹니다

그것들은 데이터 마이닝 / 기계 학습과 관련하여 사용하는 기본 수학 책입니다.

이것이 도움이되기를 바랍니다.


3

소위 "오픈 소스 데이터 과학 마스터"에 여기에 나열되고 분류 된 관련 리소스가 많이 있습니다.

특히 수학의 경우 다음과 같이 나열됩니다.

  1. 선형 대수 및 프로그래밍
  2. 통계
  3. 미분 방정식 및 미적분

유용한 권장 사항이 몇 가지 있지만 일반적인 권장 사항입니다.


2
  • 확률과 통계는 필수적입니다. 일부 키워드는 가설 검정, 다변량 정규 분포, 베이지안 추론 (공동 확률, 조건부 확률), 평균, 분산, 공분산, Kullback-Leibler 분기, ...
  • 기계 학습에는 기본 선형 대수가 필수적입니다. 배울 수있는 주제는 고유 분해와 특이 값 분해입니다. (물론 매트릭스 곱을 계산하는 방법을 알아야합니다.)
  • TooTone이 이미 언급했듯이 최적화가 중요합니다. 그래디언트 디센트가 무엇인지 알고 뉴턴의 방법 인 Levenberg-Marquardt, Broyden-Fletcher-Goldfarb-Shanno를 살펴보십시오.
  • 미적분학은 그다지 중요하지 않지만 함수의 부분 미분 (자코비 행렬, 헤세 행렬 등)을 계산하는 방법을 아는 것이 유용 할 수 있으며, 적분이 무엇인지 알아야합니다.

0

선형 대수, 통계, 미적분. ML과 함께 또는 기본 후에도 배울 수 있다고 생각합니다 . 초보자 과정 / 서적은 수학 입문서 장에서 훌륭하게 작동하며 ML을 배우는 동안 수학 필수 사항을 배웁니다. 머신 러닝에 필요한 수학과이를 배우기위한 리소스에 대한 팟 캐스트 에피소드를 만들었습니다. 머신 러닝 안내서 # 8


0

기계 학습 과정을 시작하기 전에 수학 과정을 따르십시오. 또한 단일 시도에서 발굴하려고 시도하지 마십시오. 기본 개념을 배우고 다시 수학 기술을 연마하고 반복하십시오.

수학 주제는 다음과 같습니다 :-

  • 선형 대수
  • 개연성
  • 기본 미적분
  • 기능의 극대와 최소
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.