신경망을위한 수학적 배경


11

이것이이 사이트에 적합한 지 확실하지 않지만 컴퓨터 과학 (응용 수학 학사)에서 MSE를 시작하고 기계 학습에 대한 강력한 배경을 얻고 싶습니다 (박사 학위를 추구 할 것입니다). 내 관심사 중 하나는 신경망입니다.

ANN에게 좋은 수학적 배경은 무엇입니까? 기계 학습의 다른 영역과 마찬가지로 선형 대수학이 중요하다고 생각하지만 다른 수학 영역은 무엇입니까?

신경망 : 패턴 인식을위한 체계적인 소개 또는 신경망 을 읽을 계획 입니다. 누구든지 입력 또는 대체 권장 사항이 있습니까?

답변:


10

두 번째 참고 문헌은 제 생각에 NN에 대한 최고의 책이지만 여전히 구식이 될 수도 있지만 심층 아키텍처와 같은 최신 개발을 다루지 않습니다. 기본을 올바르게 익히고 기계 학습과 관련된 모든 기본 개념에 익숙해 지십시오.

이 책을 살펴보면 선형 대수, 다변량 미적분학 및 기본 통계 개념 (조건부 확률, 베이 정리, 이항 분포에 익숙 함)이 필요합니다. 어떤 시점에서 그것은 변화의 미적분을 다룹니다. 그러나 미적분학에 대한 부록은 충분해야합니다.


그것이 여러 가지 권장 사항을 마친 후에 내가 끝낸 것입니다. 기계 학습에 대한 주교의 책은 일부 사람들이 예고 했지만 아직 알지 못하면 배우기가 매우 어려운 책이기 때문에 매우 주저 했습니다 .
Steve P.

5

수학 구성 요소에는 고급 대수, 삼각법, 선형 대수 및 미적분이 포함됩니다.

또한 상자 밖에서 생각하십시오. 알고리즘의 탄탄한 기초 (Coursera에는 알고리즘에 대한 두 개의 코스가 있음)와 MatLab, Octave 또는 R의 숙련도 (Java, C / C ++ 또는 Python과 같은 유연한 프로그래밍 언어)를 포함하여 우수한 프로그래밍 기술도 필요합니다. 나는 이것이 당신의 질문에 대한 대답으로 언급합니다. 왜냐하면 그들은 제 생각에 더 많은 "적용된 수학"기술이며 이론과 응용 구현 사이의 번역에 기본적이기 때문입니다.

기계 학습과 관련된 많은 Coursera 과정을 수강했으며 (Ng의 기계 학습 교수가 환상적인 다른 포스터에 동의 함) NN. 몇 달 전에 Coursera는 토론토 대학과 Geoffrey Hinton을 통해 신경망 코스 (여전히 이용 가능한지 확실하지 않음)를 주최했습니다. 미적분학 지식, Octave (오픈 소스 MatLab 유사 클론), 우수한 알고리즘 설계 (확장 성을 위해) 및 선형 대수학에 대한 지식이 필요합니다.

또한 수학 자체가 아닌 자연 언어 처리 (특징 추출 등), 정보 검색, 통계 / 확률 이론 및 기계 학습의 다른 영역 (더 많은 이론을 얻기 위해)과 같은 주제에 대해 생각할 수 있습니다. 기계 학습 기초 (Mohri) 또는 기계 학습 소개 (Alpaydin)와 같은 최근의 텍스트는 이론과 구현의 복잡성을 해소하는 데 도움이 될 수 있습니다 (제 생각에는 어려운 도약 일 수 있음). 텍스트는 수학적으로 매우 무겁습니다. 특히 기초.

다시 말하지만, 나는 모두 수학과 NN과 관련이 있지만 더 넓은 의미로 생각합니다.


감사. 나는 응용 수학을 저학년으로 전공했으며 (다양한 프로그래밍 경험을 가지고 있음), 나는 스스로 가르치는 추상 대수학의 엄격한 과정을 제외하고는 모든 것을 가지고 있습니다 ... 나는 패턴을위한 신경망으로 끝났습니다. 주교의 인정. 관심있는 사람이라면 누구나 강력히 추천합니다.
Steve P.


2

아주 좋은 책 (실제 소개는 아니지만 신경망에 대한 사전 지식을 가정하지는 않음)은 브라이언 리플리 (Brian Ripley)입니다. 응용 수학 학사와 함께 준비해야합니다.


2

주요 주제는 통계입니다

다변량 미적분

수치 선형 대수 (희소 행렬 등) 수치 최적화 (구배 하강 등, 2 차 프로그래밍)

가우시안 프로세스를 읽고 싶을 수도 있고 거기에 필요한 수학은 이미지 처리 / 자연어 처리 클래스를 시도하고 수행합니다.


저는 가을에 실제로 NLP 과정을 밟고 있습니다.
Steve P.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.