머신 러닝 알고리즘에 필요한 확률의 기초를 배우는 가장 좋은 방법은 무엇입니까?


13

몇 년 전에 대학에서 확률 과정을 밟았지만 지금은 일부 기계 학습 알고리즘을 겪고 있으며 일부 수학은 단지 혼란 스럽습니다.

특히 현재 EM 알고리즘 (예상 최대화)을 배우고 있으며 필요한 것과 내가 가지고있는 것 사이에 큰 분리가있는 것 같습니다.

나는 책이나 웹 사이트를 요구하지 않지만, 그것들을 사용하는 알고리즘을 철저히 이해하기 위해 이러한 주제들을 충분히 배울 수있는 방법은 무엇인가? 책을 읽고 수백 가지 운동을해야합니까? 아니면 이런 의미에서 과잉인가?

편집 :이 질문에 대한 잘못된 위치 인 경우, 이주하여 투표하십시오 :)


CV를 몰랐다! 질문을 저기로 마이그레이션하는 방법이 있습니까?

2
나는 이주하기로 투표했다. :)
JM은 통계학자가 아닙니다.

무언가를 배우는 가장 좋은 방법은 작은 조각으로 나누는 것입니다. 이 사이트에서 귀찮게하는 하나 또는 두 개의 특정 질문 또는 개념에 대해 물어보십시오.
charles.y.zheng

답변:


6

많은 책과 기계 학습에 대한 온라인 소개는 내용 내에서 필요한 확률에 대한 약간의 소개를 제공하므로 이러한 종류의 책을 하나 또는 몇 권부터 시작하겠습니다. 머리 위로 나는 통계 패턴 인식 (EM을 배웠기 때문일 수 있음)과 통계 학습의 요소를 생각할 수 있습니다 .

내 실제 조언은 Andrew Moore 의 통계 데이터 마이닝 자습서 입니다. 그것은 박사 학위를 시작하기 전의 공학적 배경에서 나온 격차를 해소 한 사이트였습니다. 나는 당신이 웹 사이트에 대해 묻지 않는다고 말했지만, 결정하기 전에 거기에있는 데이터 마이너의 확률과 다른 확률 슬라이드를 살펴보십시오. EM의 가우스 혼합 모델을 살펴보십시오.

책을 읽고 수백 가지 운동을해야합니까?

나는 그렇게 생각하지 않습니다. 머신 러닝의 확률 계산은 잘 알려진 몇 가지 경로를 중심으로하는 경향이 있습니다. 가우스 단일 및 다차원 분포를 잘 이해하고 EM에 대한 몇 가지 설명을 공부하면 꽤 멀어 질 것입니다. 그리고 선형 대수학. 많은 선형 대수가 필요합니다.


-3

인공 지능은 지난 10 년 동안 일상 생활에서 AI의 개발 및 통합에 따라 많은 중요성을 얻었습니다. AI가 이미 진행 한 진전은 자율 주행 자동차, 의료 진단, 심지어 Go 및 Chess와 같은 전략 게임에서 인간에게 베팅하는 것에 놀랍습니다.

AI의 미래는 매우 유망하며 우리 자신의 로봇 동반자가있을 때와 멀지 않습니다. 이로 인해 많은 개발자들이 코드 작성을 시작하고 AI 및 ML 프로그램 개발을 시작하게되었습니다. 그러나 AI 및 ML에 대한 알고리즘 작성을 배우는 것은 쉽지 않으며 광범위한 프로그래밍 및 수학 지식이 필요합니다.

수학은이 두 스트림을위한 프로그래밍 기반을 구축함에 따라 중요한 역할을합니다.

기계 학습에 수학이 중요한 이유는 여러 가지가 있습니다. 그들 중 일부는 다음과 같습니다.

정확도, 교육 시간, 모델 복잡성, 매개 변수 수 및 기능 수를 고려하여 올바른 알고리즘을 선택합니다. 매개 변수 설정 및 검증 전략 선택 Bias-Variance 트레이드 오프를 이해하여 언더 피팅 및 오버 피팅 식별 올바른 신뢰 구간 및 불확실성 추정

머신 러닝에는 어떤 유형의 수학이 필요합니까?

기계 학습 또는 인공 지능 연구에는 수학이 절대적으로 필요합니다. ML의 개념과 알고리즘을 더 깊이 이해하려면 몇 가지 기본 수학 지식이 필요합니다.

세 가지 주요 수학 이론 : 선형 대수, 다변량 미적분 및 확률 이론.

선형 대수 –

선형 대수 표기법은 기계 학습에서 다양한 기계 학습 알고리즘의 매개 변수 및 구조를 설명하는 데 사용됩니다. 이것은 신경 네트워크가 어떻게 구성되고 어떻게 동작 하는지를 이해하기 위해 선형 대수를 필요로합니다.

다음과 같은 주제를 다룹니다.

스칼라, 벡터, 행렬, 텐서 행렬 규범 특수 행렬 및 벡터 고유 값 및 고유 벡터 다변량 미적분 –

이것은 기계 학습의 학습 부분을 보충하는 데 사용됩니다. 예제에서 배우고 다른 모델의 매개 변수를 업데이트하고 성능을 향상시키는 데 사용됩니다.

다음과 같은 주제를 다룹니다.

미분은 그라디언트 미분 연산자를 볼록 최적화 확률 이론을 통합합니다 –

이론은 이러한 딥 러닝 또는 AI 알고리즘을 설계 할 때 기본 데이터에 대한 가정을 만드는 데 사용됩니다. 주요 확률 분포를 이해하는 것이 중요합니다.

다음과 같은 주제를 다룹니다.

확률의 요소 랜덤 변수 분포 분산 및 기대 특수 랜덤 변수 기계 학습을위한 수학을 빨리 배우는 방법?

데이터 과학을위한 수학을 배우는 셀프 스타터 방식은 "똥을 쳐서"배우는 것입니다. 그렇더라도 기본 이론을 배우거나 검토하고 싶을 것입니다. 전체 교과서를 읽을 필요는 없지만 핵심 개념을 먼저 배우고 싶을 것입니다.

소프트 전제 조건으로 선형 대수 / 행렬 미적분학 (기호에 얽매이지 않음)과 입문 확률에 대한 기본적인 편안함을 가정합니다.

머신 러닝을위한 수학을 깊이 배우고 싶다면 온라인에서 n 개의 코스를 이용할 수 있습니다.

Khan Academy의 선형 대수, 확률 및 통계, 다변량 미적분 및 최적화.

eduonix의 기계 학습 및 AI를위한 수학적 기초

udemy에 대한 머신 러닝 수학 배우기

매트릭스 코딩 : Brown University, Philip Klein의 컴퓨터 과학 응용 프로그램을 통한 선형 대수.

Larry Wasserman의 저서 — 모든 통계 : 통계적 추론의 간결한 과정.

당신은 최선을 다해 학습한다는 것을 기억하십시오. 슬프게도이 과정에는 과제와 숙제가 충분하지 않습니다.

제가 추천하는 것은 기계 학습 및 AI를위한 수학 기초 -이 과정은 전체 수학 교과 과정이 아닙니다. 학교 나 대학 수학 교육을 대체하도록 설계되지 않았습니다. 대신 기계 학습 연구에서 겪게 될 주요 수학 개념에 중점을 둡니다.

배울 내용 :

그리고 훨씬 더 ……

이 과정을 마치면 자신 만의 알고리즘을 구축하는 데 필요한 지식뿐만 아니라 다음 프로젝트에서 알고리즘을 실제로 사용할 수 있다는 확신을 갖게됩니다.

이 과정에는 수학 개념에 대한 지식을 강화하는 데 도움이되는 프로젝트와 퀴즈도 있습니다.

공식 교육의 일환으로 이러한 핵심 개념을 놓친 학생들이나 수학 공부를 마치고 오랜 시간 휴식을 취한 후 기억을 새로 고쳐야하는 학생들의 격차를 메우기 위해 고안되었습니다.

이 과정은 처음에 자료를 훑어 보는 데 2-3 개월을 투자 한 다음 경험할 때 배운 내용의 절반을 잊어 버리는 것보다 훨씬 낫습니다.

표시된 기본 개념을 이해하고 항상 즐거운 시간을 보내십시오!

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.