AI 연구원의 수학적 전제 조건은 무엇입니까?

12

인공 지능 알고리즘의 핵심 부분을 이해하고 자체 알고리즘을 개발하기위한 수학적 전제 조건은 무엇입니까?

구체적인 책을 참조하십시오.

math getting-started academia

— sbhusal123
소스

9

좋은 수학 재단

중간 대수와 미적분학 및 이산 수학의 다른 기초 (이 주제 내의 용어 및 기본 개념 포함)와의 완전한 역량을 확보하는 것으로 시작하십시오.

무한 시리즈
논리적 증거
선형 대수와 행렬
분석 지오메트리, 특히 국소 및 전역 극단 (최소 및 최대), 안 장점 및 변곡점의 차이
이론 설정
개연성
통계

사이버네틱스의 기초

1948 년 사이버네틱스의 Norbert Wiener는 MIT Press에 시계열 및 피드백 개념을 포함하고 있으며 후속 작업에서는 볼 수없는 명확성과 명령을 제공합니다. 또한 정보 의 양을 비트 단위로 정의하기위한 Shannon의 log ₂ 공식으로 시작하는 정보 이론에 대한 소개도 포함합니다 . 정보 엔트로피 개념의 확장을 이해하는 것이 중요합니다.

계산법

좋은 미적분학 서적을 찾아서 이러한 범주의 주요 이론과 적용에 대해 명확하게하십시오.

시계열
무한 시리즈
수렴 — 인공 네트워크는 학습 중에 최적으로 최적으로 수렴합니다.
부분 미분
자코비 안과 헤 시안 행렬
다변량 수학
경계 지역
이산 수학

그것의 대부분은 미적분학 , Strang, MIT, Wellesley-Cambridge Press에 있습니다. PDF는 웹에서 사용할 수 있지만 기본적이고 특히 깊지는 않습니다. 우리 실험실의 도서관 중 하나는 Intermediate Calculus , Hurley, Holt Rinehart & Winston, 1980 입니다. 그것은 Princeton이 2 학년을 위해 사용하는 내 도서관에있는 것보다 포괄적이고 어떤면에서 더 잘 배치되어 있습니다.

ℝ ² 이상의 공간 (2D 이상) 에서 편안하게 작업하십시오 . 예를 들어, RNN은 가로, 세로, 픽셀 깊이 및 동영상 프레임 크기로 인해 ℝ ⁴ thorugh ℝ ⁷ 과 같은 공간에있는 경우가 많습니다 .

유한 수학

제가 생각할 수있는 3 권의 책이이 책들을 모두 가지고 있지 않다는 것은 불행한 일입니다.

직접 그래프 — 모든 구성의 수퍼 셋 지형이기 때문에 트리 또는 회로 (인공 그물) 전에이 점을 익히십시오.
추상 기호 트리 (AST)
고급 세트 이론
의사 결정 트리
마르코프 체인
혼돈 이론 (특히 랜덤과 의사 랜덤의 차이)
게임 이론 폰 노이만과 모겐 스턴의 시작으로 게임 이론 , 그 분야에서 독창적 인 작업
이산 시스템에서의 수렴, 특히 정수, 고정 소수점 또는 부동 소수점 산술의 신호 포화에 대한 이론 적용
통계적 의미, 편차, 상관 관계 및 엔트로피, 상대 엔트로피 및 교차 엔트로피의보다 진보적 인 개념
커브 피팅
회선
확률 특히 베이 즈 정리
알고리즘 이론 (고델의 불확실성 이론과 튜링 완전성)

화학 및 신경과

고등학교 화학에서 화학 평형을 기억하는 것이 좋습니다. Balance는보다 정교한 AI 디자인에서 중요한 역할을합니다. GAN의 생성 모델과 차별적 모델 간의 공생 관계를 이해하면 학생이 이러한 이해를 더욱 발전시키는 데 도움이됩니다.

생물 시스템 내 제어 기능은 인공 지능 연구에서 개념 증명의 주요 원천으로 남아 있습니다. 연구자들이 생물학의 일부 측면을 직접 모방하지 않는 적응 형태를 상상하는 데 더 창의적이됨에 따라 (이 글을 쓰는 시점에서 멀어짐에 따라) 창의성은 AI 연구 목표 공식화에서 더 큰 역할을 할 수있다.

그럼에도 불구하고 AI는 아마도 학제 간 분야로 남아있을 것입니다.

— 포 크리스티안
소스

2

일부 의견 : 1) 나는 John이 그의 답변에서 쓴 내용에 동의하는데, 그의 답변은보다 일반적인 "핵심"에 관한 것이지만, 당신의 답변에는 AI의 영역에 따라 유용하거나 그렇지 않을 수있는 것들이 포함되어 있습니다. 2) "고등학교 수학"에서 설명하는 많은 것들이 (필수적으로) 고등학교 수학은 아니지만 적어도 유럽에서는 그렇지 않습니다 (미국에 대해서는 모른다). 네덜란드에서는 대학에 첫 해가 될 때까지 선형 대수, 행렬, 무한 시리즈 또는 이론을 얻지 못했습니다. 그래도 고등학교에서 다른 코스를 선택했다면 그들 중 일부가 일찍 나타 났을 수도 있습니다.

— Dennis Soemers

2

3) 기능 분석 / 측정 이론은 일부 영역에 포함시키는 것이 유용 할 수 있습니다. 그러나 AI 연구자로서 얼마나 깊이 가고 싶은가에 달려 있습니다. 좀 더 이론적 인 측면에있는 일부 AI 연구자들은이 모든 것들이 유용하다는 것을 알게 될 것입니다. 경험적 / 소프트웨어 / 프로그래밍 측면에서 더 많은 다른 AI 연구원들은 훨씬 덜 필요합니다. 둘 다 여전히 가치있는 연구 결과를 산출 할 수 있습니다.

— Dennis Soemers

7

저는 교수로 일하고 있으며 최근 다른 기관의 많은 동료들과상의하여 새로운 AI 전공에 대한 수학 요구 사항을 설계했습니다.

다른 답변, 특히 @FauChrisian 은 AI의 어딘가에 유용 할 수있는 모든 특정 주제를 목록 화하는 데 훌륭한 역할을 하지만 핵심 주제를 이해하는 데 모두 똑같이 유용한 것은 아닙니다. 다른 경우에는 주제를 이해하는 것이 관련 AI 알고리즘을 이해하는 것과 본질적으로 동일하므로 일반적으로 사전 지식을 전제로하지 않고 함께 학습합니다. 예를 들어, Markov Decision 프로세스는 그래프 이론과 확률의 기초를 이미 알고있는 사람에게 가르치기 어렵지 않으므로 일반적으로 수학에서 별도의 주제가 아닌 AI 과정에서 강화 학습을 가르 칠 때 다루는 것입니다. 강좌.

우리가 해결 한 수학 요구 사항은 다음과 같습니다.

이산 수학의 한 학기 또는 한 학기 과정. 이것은 그 지역의 특정 주제와 마찬가지로 증거와 수학적 엄격함으로 편안함을 확립하는 것입니다. 그것은 주로 "기초"지식이지만, 그 중 일부는 매우 유용합니다. 무한 요약, 그래프의 기본, 조합론 및 점근선 분석에 대한 편의는 아마도 가장 직접적으로 적용 가능한 부분 일 것입니다. 나는 Susanna Epp의 책을 좋아한다 .
- 선형 대수학의 1 학기 또는 2 학기 과정으로 AI의 다양한 주제, 특히 기계 학습 및 데이터 마이닝에 유용합니다. Lay & Lay 는 괜찮은 책이지만 아마도 최고의 것은 아닙니다. Shilov 는 Ian Goodfellow와 다른 사람들의 추천이지만 직접 시도하지는 않았습니다.
- 확률에 따른 과정 및 통계에 관한 현대적 과정 (예 : 베이지안 초점) 통계학에 관한 오래된 과정이나 사회 과학자를 대상으로하는 과정은 그리 유용하지 않습니다. 통계 전문가가 현재 Lock5 를 사용 하고 있으며 이에 대한 경험이 풍부합니다.
- 적어도 미분 및 적분 미적분학, 바람직하게는 벡터 미적분학에서 적어도 부분적 미분, 그러나 아마도 전체 과정. 이는 AI에 대한 최적화, 기계 학습 및 경제 기반 접근 방식에 유용합니다. 스튜어트 는 가장 일반적인 교과서입니다. 포괄적이며 세 가지 과정 모두에 사용할 수 있지만 설명이 항상 최고는 아닙니다. 그래도 추천합니다.

이것이 핵심 주제입니다. 당신이하지 않으면 또한 프로그래밍 전통적인 배경을 가지고, 다음 그래프 이론 과정과 점근 적 복잡성 또는 알고리즘 설계 및 분석의 기초는 좋은 보충제 수 있습니다. 일반적으로 AI는 표준 컴퓨터 과학 배경에서 비롯되며 모든 것을 잘 다루고 있습니다.

— 존 두케
소스

1

@FauChristian 저는 미적분학과 유한 수학이라는 동일한 주제를 나열했다고 생각합니다. 우리는 둘 다 각각의 수업을 수강해야한다고 생각합니다. 통계와 확률을 나열했습니다. AI에서 현대적인 작업을하고 싶다면 그렇게하지 않으면 멀지 않을 것입니다. 화학과 신경 과학을 나열했습니다. 필자는 AI를 거의 필요로하지 않는 사람들이 거의 없다고 생각한다. 확실히, 당신은 그것없이 Russell & Norvig를 모두 통과 할 수 있습니다. 딥 러닝이 아닌 전산 신경 과학에서 일하고 싶다면 도움이 될 수 있습니다. 또한 당신이 기여하기 위해 16 년이 필요하다는 것을 의심합니다. 그래도 5-6.

— John Doucette

1

@FauChristian 그게 다야. 대부분의 현대 AI 실험실에서 연구를하고 싶다면 여전히 가능성이 필요하다고 생각하는 경향이 있습니다. . 일반적으로 대학원생이 연구 작업을하는 경우입니다. 대부분은 1-2 년 정도의 대학원 과정을 거쳐 연구 작업을 수행합니다. 그것의 일부는 아주 좋습니다. 이 사람들은 최대 4-6 년의 정규 교육을 받았습니다. 그것보다 더 빨리 또는 더 깊이 만들 수 있지만, 연구 잠재력은 그 주변에서 시작됩니다.

— John Doucette

3

Gradient Descent와 같은 간단한 알고리즘에 관한 한 부분 미분을 잘 파악해야합니다. 특히 신경망을 구현하려는 경우. 또한 대부분의 알고리즘은 계산 속도를 향상시키기 위해 벡터화되므로 행렬 수학에 익숙해야합니다. 여기에는 행렬의 크기, 곱의 크기, 행렬의 곱셈, 조옮김 등이 실제로 빠르고 편안해집니다. 매우 드물게 행렬 미적분학을 사용하여 최적의 솔루션에 직접 도달 할 수 있으므로이 영역의 일부 결과가 있어야합니다. 계속해서 함수 분석을 이해해야합니다. 이것은 sigmoid 및 tanh, log와 같은 활성화 기능이 수행하는 작업에 대한 이해를 얻는 데 필요합니다. 확률과 기대를 파악하는 것도 정말 유용합니다. 직교 벡터와 내부 제품도 명확해야합니다.

즉, 기본 미적분학과 행렬 연산을 파악하고 AI 개념을 배우는 것이 좋습니다. 무언가를 알아낼 수 없다면 수학을 탐구하십시오.

참고 : 다시 이것은 시작 전용입니다.

— 프라나 브
소스