박사 순수한 수학에 있으며 이론적 CS에 대해 많이 알지 못한다는 것을 인정합니다. 그러나 나는 나의 직업을위한 비 학술적 옵션을 탐구하고 기계 학습에 자신을 소개하기 시작했다.
본질적으로 제 질문은 연구원들이 어떤 종류의 답변을 원합니까? 주제에 대한 간단한 검색에서 찾은 내용은 다음과 같습니다.
- 간단한 신경망을 구현하는 알고리즘은 매우 간단합니다.
- 통계 이론과 마찬가지로 SGD 프로세스는 수학적으로 잘 이해됩니다.
- 보편적 근사 정리는 강력하고 입증되었습니다.
- 최근의 논문 https://arxiv.org/abs/1608.08225 가 있습니다.이 논문 은 기본적으로 우리가 모델링하려는 함수에 대해 강력한 단순화 가정을 할 수 있기 때문에 보편적 근사치가 실제로 실제로 필요한 것보다 훨씬 많다는 대답을 제공합니다. 신경망.
앞서 언급 한 논문에서 "GOFAI 알고리즘은 분석적으로 완전히 이해되지만 많은 ANN 알고리즘은 경험적으로 만 이해된다"고 언급하고있다. 구현 된 알고리즘에 대한 수렴 이론은 우리가 신경망에 대해 가지고 있다고 생각하는 분석적 이해의 예이므로,이 일반 수준의 진술은 알려진 것과 알려지지 않은 것 또는 "답변으로 간주되는 것"에 대해 많은 것을 말해주지 않습니다. "
저자는 주어진 다항식을 근사화하는 데 필요한 신경망의 크기에 대한 유효 범위와 같은 질문은 개방적이고 흥미 롭다는 결론을 내립니다. 우리가 신경망을 "이해했다"고 대답하기 위해 수학적으로 특정한 분석 질문의 다른 예는 무엇입니까? 더 순수한 수학 언어로 대답 할 수있는 질문이 있습니까?
(저는이 논문에서 물리학을 사용하기 때문에 표현 이론에서 방법을 구체적으로 생각하고 있습니다. --- 이기적으로는 그것이 내 연구 분야이기 때문에. 조합론 / 그래프 이론, 대수 기하학과 같은 영역도 상상할 수 있습니다. 및 실행 가능한 도구를 제공하는 토폴로지)