Ilya Sutskever와 Quoc Le의 신경망을 이용한 시퀀스 학습 의 초석 논문을 읽고 있습니다. 첫 페이지에는 다음과 같이 간단히 언급되어 있습니다.
A surprising example of the power of DNNs is their ability to sort
N N-bit numbers using only 2 hidden layers of quadratic size
숨겨진 레이어를 2 개만 사용하여 숫자를 정렬하는 방법을 간략하게 설명 할 수 있습니까?