수학 방정식을 풀기 위해 신경망을 훈련시킬 수 있습니까?


24

신경망은 아마도 그렇게하도록 설계되지는 않았지만 가설 적으로 요구하면 수학 방정식을 풀기 위해 깊은 신경망 (또는 유사한)을 훈련시킬 수 있습니까?

따라서 세 번째 입력 : 첫 번째 숫자, 숫자 (1- +, 2- -, 3- /, 4-등으로 표시되는 연산자 기호 *)와 두 번째 숫자가 주어지면 훈련 후 네트워크가 나에게 유효한 결과를 제공해야합니다.

예 1 ( 2+2) :

  • 입력 1 : 2; 입력 2 : 1( +); 입력 3 : 2; 예상 출력 :4
  • 입력 1 : 10; 입력 2 : 2( -); 입력 3 : 10; 예상 출력 :0
  • 입력 1 : 5; 입력 2 : 4( *); 입력 3 : 5; 예상 출력 :25
  • 그래서

위의 내용은보다 정교한 예제로 확장 될 수 있습니다.

가능합니까? 그렇다면 어떤 종류의 네트워크가이를 배우고 달성 할 수 있습니까?



답변:


21

그렇습니다.

그러나 응용 프로그램은 계산기 등을 대체하지 않습니다. 내가 연구 한 실험실은 인간이 어떻게 이러한 문제를 해결할 수 있는지 더 잘 이해하기 위해 방정식 추론의 신경망 모델을 개발합니다. 이것은 수학적 인식으로 알려진 분야의 일부입니다 . 불행히도, 우리의 웹 사이트는 대단히 유익하지는 않지만 여기 에 그러한 작업의 예에 대한 링크 가 있습니다.

그 외에도 최근에 외부 메모리 저장소 (예 : 신경 튜링 머신)를 포함하도록 신경망을 확장하는 작업은 수학 문제 해결을 좋은 개념 증명으로 사용하는 경향이 있습니다. 많은 산술 문제가 저장된 중간 결과를 가진 긴 프로 시저와 관련되기 때문입니다. 긴 이진 덧셈과 곱셈에 대해서는 이 백서 의 섹션을 참조하십시오 .


나를 위해 신경망뿐만 아니라 외부 메모리가있는 신경 구조. NTM 및 DNC와 같은 아키텍처는 수행 된 작업을 추적하여 반복 프로세스를 실행할 수 있기 때문에 최단 경로와 같은 알고리즘을 해결하는 데 사용할 수 있습니다. 그러나 저에게 단지 학습 학습을 사용하는 것은 두 번째 답변에서 언급 한 것처럼 잘못되었습니다.
Shamane Siriwardhana

첫 번째 링크가 작동하지 않습니다. 대체품이 있습니까?
kenorb

두 링크 모두 저에게 효과적이었습니다.
Zakk Diaz

8

실제로는 아닙니다.

신경망은 숨겨진 변수가있을 때 입력 간의 비선형 관계를 결정하는 데 좋습니다. 위의 예에서 관계는 선형이며 숨겨진 변수가 없습니다. 그러나 이들이 비선형 일지라도 전통적인 ANN 설계는이를 달성하기에 적합하지 않을 것입니다.

신중하게 레이어를 구성하고 교육을 철저히 감독함으로써 입력에 대한 출력 4.01을 일관되게 생성 할 수있는 네트워크를 얻을 수 있습니다. 기술 적용.


5

1) 가능합니다! 실제로, 이것은 인기있는 딥 러닝 프레임 워크 인 Keras의 예입니다. 체크 아웃 소스 코드를 볼 수있는 링크를 .

2)이 특정 예는 반복적 인 신경망 (RNN)을 사용하여 문제를 일련의 문자로 처리하여 답을 구성하는 일련의 문자를 생성합니다. 이 접근 방식은 인간이 간단한 추가 문제를 해결하는 방법과 다른 점이 있으며 컴퓨터가 그러한 문제를 해결하는 방법이 아닐 수도 있습니다. 대부분 Keras를 사용한 시퀀스 대 시퀀스 학습의 예입니다. 순차적 또는 시계열 입력을 처리 할 때 RNN이 널리 사용됩니다.


1

예. 이제이 문서에서 제공 한 예제에서 더 많은 것을 달성 할 수있을 것 같습니다. 본 논문은 DL 언어 솔루션에 대해 훨씬 더 어려운 문제에 대해 설명합니다 .

이 두 가지 모두 회귀 문제 (즉, 목표는 유효성 검사 세트에서 일부 손실 함수를 최소화하는 것)로 설명 할 수 있지만 자연어의 검색 공간은 훨씬 더 큽니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.