신경망 아키텍처는 대부분 문제 자체와 입력 / 출력 유형을 기반으로하지만 여전히 빌드를 시작할 때 항상 "사각형"이 있다는 것을 알고 있습니다. 그래서 내 질문은 MxN 의 입력 데이터 세트 (M은 레코드 수, N은 피처 수) 및 C 가능한 출력 클래스 가 주어진다 는 것입니다. 우리는 몇 개의 레이어 / 단위로 시작해야하는 지름길이 있습니까?
신경망 아키텍처는 대부분 문제 자체와 입력 / 출력 유형을 기반으로하지만 여전히 빌드를 시작할 때 항상 "사각형"이 있다는 것을 알고 있습니다. 그래서 내 질문은 MxN 의 입력 데이터 세트 (M은 레코드 수, N은 피처 수) 및 C 가능한 출력 클래스 가 주어진다 는 것입니다. 우리는 몇 개의 레이어 / 단위로 시작해야하는 지름길이 있습니까?
답변:
이 질문은 CrossValidated : 피드 포워드 신경망에서 숨겨진 레이어와 노드의 수를 선택하는 방법 에 대해 자세히 답변되었습니다 .
그러나 내 자신의 두 센트를 추가하겠습니다.
최고의 신경망 아키텍처를 선택하는 마법의 규칙은 없지만, 비슷한 문제를 해결하기 위해 누군가가 사용한 아키텍처를 찾을 수 있다면 이는 종종 훌륭한 출발점입니다.
가장 좋은 곳은 Keras, PyTorch 또는 Tensorflow와 같은 인기있는 신경망 라이브러리를 사용하는 공식 또는 비공식 예제와 학술 문헌에 설명 된 아키텍처입니다. github의 keras / examples 는 훌륭한 리소스입니다.
이러한 아키텍처는 많은 시행 착오 후에 선택되었을 가능성이 크므로 대부분의 작업이 완료되었습니다.
노드와 레이어의 구성이 가장 효율적인 방법을 탐색하여 신경망을 사용하여 다른 신경망을 설계한다는 아이디어를 탐구하는 논문을 읽었습니다. 다음은 PDF를 다운로드 할 수있는 페이지입니다 https://arxiv.org/abs/1611.02120
@Imran 의 답변에 이어, 이 논문 은 그가 링크 한 CrossValidated 게시물의 의견 중 하나에서 발견 되었습니다. 2.1 절에서 대신 유전자 모델을 사용하여 올바른 아키텍처를 찾으려는 시도 외에도 2.1 절에는 1/2 숨김 계층 시스템에 몇 개의 숨겨진 단위가 있어야하는지에 대한 이론적 한계가 제시되어 있습니다.
편집 : 나는이 정리를 테스트 했으며 유전자 모델을 사용하는 것이 무작위 아키텍처를 선택하는 것만 큼 좋습니다.