수학의 강력한 배경이 ML의 필수 요건입니까?


37

나는 내 자신의 스킬 셋을 발전시키기 시작했고 항상 머신 러닝에 매료되었습니다. 그러나 6 년 전에는 이것을 추구하는 대신 컴퓨터 과학과 전혀 관련없는 학위를 받기로 결정했습니다.

나는 약 8-10 년 동안 소프트웨어와 응용 프로그램을 개발 해 왔으므로 잘 다루었지만 기계 학습 / 확률 / 통계의 수학 측면에 침투하는 것처럼 보이지 않습니다.

학습 자료를 살펴보기 시작하고 첫 페이지에 혼란스러워서 학습에 장애가되는 내용이 포함될 수 있습니다.

  • 수학의 강력한 배경이 ML의 필수 요건입니까? ML을 계속하기 전에 수학 공란을 채워야합니까? 자체 컴퓨터 학습이 어려운 컴퓨터 과학 배경이없는 개발자에게만 효과가 있습니까?

관련 질문 :


4
나는 선형 대수학을 최소한 잘 이해하고 베이지안 응용 프로그램에 대한 가능성을 알아야한다고 말하고 싶습니다. 또한 수학을 코드로 변환하는 데 편안해야하며 표기법 (일관되지는 않음)과 관련하여 적응할 수 있어야합니다. ML은 대부분의 컴퓨터 과학자들에게는 쉽지 않습니다.
John Moeller

3
나는 그 질문들이 전혀 관련이 없다고 생각하지 않습니다. 이 사이트를 매우 매력적인 스택 교환 사이트로 만들고 질문을 마무리 해 주셔서 감사합니다. 나에게 책을 추천 해 줄 사람도 언급하지 않았다. 이것은 "가능한 복제물"에 기초한 복제물이 아니다
Layke

2
메타를 스레드 (8 시간 전)에 다시 열도록 요청했습니다. meta.stats.stackexchange.com/questions/1442/…
Douglas Zare

1
감사합니다. 여전히 "너무 주관적"이거나 "실제 질문이 아님"으로 닫을 수는 있지만 분명히 복제본은 아닙니다.
Layke

1
@Douglas Zare가 시작한 메타 스레드에 설명 된대로 Layke는이 질문을 닫는 것이 잠재적 인 호의 를 고려할 것을 희망합니다.이 질문은 이미 질문에 대한 답변을 제공 할 수있는 관련 스레드에 즉시 액세스 할 수 있기 때문입니다. 그러나 복제본이 아니라고 언급 했으므로이 사이트에서 유사한 질문을 복제 하지 않는 의미를 명확히하기 위해 질문을 편집 하시겠습니까? 그런 다음 다시 열면 기쁠 것입니다.
whuber

답변:


23

Stanford (Ng)Caltech (Abu-Mostafa) 는 YouTube에서 기계 학습 수업을 진행했습니다. 과제를 볼 수는 없지만 강의에 의존하지는 않습니다. 어떤 수학을 배워야하는지 알아내는 데 도움이 될 것이므로 먼저 시청하는 것이 좋습니다. 나는 Ng가 도와 준 Coursera의 Andrew Ng가 과제와 비슷한 수업을한다고 생각합니다.

한 가지 예외 : 스탠포드 강의 초반에 정확하게 기억한다면, Ng는 미량의 행렬 곱의 미분을 포함하는 계산을합니다. 그것들은 다소 격리되어 있으므로 계산을 따르지 않아도 걱정하지 마십시오. 나는 어떤 코스가 그것들을 다룰 것인지조차 모른다.

확률, 선형 대수, 선형 프로그래밍 및 다변량 미적분에 익숙해지기를 원합니다. 그러나, 당신은 그 과목에 대한 많은 완전한 대학 수업에 포함 된 것보다 훨씬 적게 필요합니다.



15

응용 프로그램의 종류에 따라 ML 실무자로서 많은 수학이 필요하지는 않습니다.

수학 (Calculus III)이나 통계에 대한 배경 지식이없는 자율적 인 프로그래머 (~ 15 년) 및 빈번한 대학 중퇴자로서 몇 가지 자료를 통해 머신 러닝 / 데이터 마이닝을 시작했습니다.

  • Berry and Linoff의 "마스터 링 데이터 마이닝 : 고객 관계 관리 기술 및 과학"책

  • 같은 저자의 "데이터 마이닝 기술"책

  • R, 특히 패키지 파티 및 nnet

나는 비영리 지원 마케팅 및 운영에서 일합니다. 특히 처음에는 메일 마이닝에 주로 데이터 마이닝을 사용했습니다.

나중에 나는 선형 대수, Andrew Ng의 기계 학습, 통계 분석법 소개 (STAT 301) 등을 CSU에서 수강했습니다.

앤드류 응 코스 (Andrew Ng 's course)와 어플리케이션에 따라 의사 결정 트리 (R의 당사자 패키지)에 따라 두 권의 책을 시작하는 것이 좋습니다.


9

나는 이것이 실제로 좋은 질문이며 매우 화제라고 생각합니다. 그러나 대답이 있는지 확실하지 않습니다. 최근의 기사 는 데이터 과학이 온라인에서 쉽게 배울 수 있다고 제안함으로써 많은 논란을 일으켰습니다 ( 여기 참조 ). 그러나이 기사에서 언급 한 대부분의 사례 연구에서 주목할만한 것은 보험 적 또는 수학적 배경에서 비롯된 것입니다.

Coursera, Stanford 및 edX와 같은 온라인 과정이 필요한 특정 컴퓨터 과학 기술을 가르치는 데 도움이되지만 적용하는 모델이 무엇을 수행하는지 이해하는 데 수학적 배경이 필요할 수 있음을 나타냅니다. . 다른 한편으로,이 사람들은 모두 분석적으로 시작해야한다는 주장도 마찬가지로 똑같이 강력하게 주장 할 수 있는데, 이것이 양적 분야에서 일하는 이유와 기계 학습을 쉽게 선택하고 경쟁에서이기는 이유입니다.

나는 근본적으로 여기에서 진행되는 분석 수준의 문제가 있다고 생각합니다. 수학적 기술이 적용하는 알고리즘의 확률 적 근본을 이해하는 데 도움이되는 경우도 있지만, 높은 수준의 분석을 수행하고 알고리즘의 일부를 조합하여 우수한 소프트웨어 엔지니어링 기술을 추가 할 수 있다는 주장도 동일합니다. 그들이 왜 그렇게하고 있는지 완전히 이해하지 못하더라도 목표를 달성하기 위해 . 일반적으로 데이터 과학 (및 협회의 기계 학습)은 이러한 폭 때문에 정확하게 흥미로운 분야입니다. 데이터베이스 전문가가되어 문제를 해결하기 위해 무차별적인 힘을 사용하거나 시뮬레이션을 사용하는 수학자 또는 공학을 잘 활용하는 컴퓨터 과학자가 될 수 있습니다 다른 알고리즘과 접근 방식을 최적의 방식으로 조합하는 코드

예측에 추가되는 모든 접근 방식이 좋으므로 일부 수학을 배우는 것이 현장에서 성공할 수있는 가장 좋은 기회를 제공하는 것이 좋습니다. 좋은 출발점을 원한다면 MIT에는 멋진 계산 응용 프로그램과 함께 훌륭한 선형 대수 과정이 있으며 이해하기 쉽습니다. 또한 확률 과정과 다변량 미적분학에 대한 다른 과정을 통해 지식을 쌓는 데 관심이있을 수 있습니다.


분석적으로 생각하지 않는 사람들 (또는 비 추상적이거나 추상적 인 사람들)은 수학을 단순화함으로써 실제로 도움이되지 않는다는 것이 항상 나를 걱정했습니다 (+1). 또한 Strang 선형 대수 과정을 좋아했지만 선형 대수학이 무차별 대입 계산으로 처음으로 계산되는 수학은 아닌가? 데이터 과학은 쉬운 연결을 위해 누군가가 이미 제기했지만 아마도 가짜 주식 시장 경쟁에서 수천 명 중 1 명 또는 2 명 이상의 전문가가 전문가를 이길 것입니다.
phaneron

4

수학의 강력한 배경이 ML의 필수 요건입니까? – 통계로서 개념화 된 ML에 대한 답과 일부 추측 ;-)

1990 년 무렵 나는 컴퓨터 대수학이 도움이되기를 희망했지만 그것이 상당히 제한적이라고 생각합니다. 그러나 수학 학습 속도를 높이는 데 확실히 도움이됩니다 (실제로 조작 기술을 개발하거나 간단한 연습만으로 극복하려고 노력할 필요가 없음). 나는 Mathematica와 함께 Fred Szabo의 Linear Algebra가 이것의 훌륭한 예라는 것을 알았습니다 (그러나 나는 이미 고급 이론 수준의 선형 대수 과정을 밟았습니다.)

나는 1988 년 이후 (컴퓨터 집중 방법을 사용하여 통계에서 이론과 원리를 "구체적으로" "정답으로) 대답하지 않거나 최소한 통계를 위해 필요 하지 않게 작업하고있다 . 추가적인 수학적 기술과 이해로 항상 더 빠르고 더 일반적으로 이해할 수있을 것입니다. 나는 점점 가까워지고 있다고 생각하지만, 단지 장난감 문제 이상으로 유효 하고 유용한 확률 생성 모델과 추론을 조작 할 수있는 표현이 필요 하다.

ML을 계속하기 전에 수학 공란을 채워야합니까?

MHO에서 통계 를 이해하는 거의 모든 사람들 은 표준을 조작하는 것이 매우 편안 하고, 특히 확률 생성 모델과 수학 추론의 수학적 특성 (수학적 통계 박사의 x %)에 대한 표준 수학적 표현을 매우 편안하게 다루어 왔습니다. 따라서 기본을 얻는 것뿐만 아니라 수학에 익숙해집니다. (제쳐두고, 푸리에 이론은 필수적이었습니다.)

왜 이런 표현이 어려운가 (많은 수학으로도)?

Gerd Gigerenzer는 _ 자연 주파수를 사용하여 테스트 양성 / 음성 문제가 주어지면 단순한 질병 양성 / 음성에 대한 도전이 없다는 것을 거의 확립했습니다.” 링크 된 질문에 대한 언급은 http://www.autonlab.org/tutorials/prob18.pdf를 잘 활용하는 것으로 보입니다 .

이것이 일반화하기 어려운 이유는 무엇입니까?

k 테스트 (반복 및 다른) – 2 ^ k

v 값을받는 테스트 – v ^ k

따라서 이진 알 수 없음 – 2 * v ^ k 샘플 경로 확률

p 다중 이진 미지수 2 ^ p * v ^ k

p 다중 합리적인 미지수의 경우 Q ^ p * v ^ k

이를 극복하기 위해 셀 수없이 많은 수의 무한으로 수학으로 빠르게 이동합니다. 수학적 전문 지식이 있어도 많은 오해와 역설처럼 보입니다 (예 : Borel의 역설?)

또한 비선형 위험한 오해 (예 : 비 정보 적 우선 순위를 지정하는 숨겨진 위험 Winbug 및 기타 MCMC, 사전 배포에 대한 정보가 없음 ) 및 상호 작용 및 임의의 영향 등이 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.