NN 아키텍처를 동적으로 조정 : 불필요한 발명?


9

저는 박사 과정을 시작하고 있으며, 제가 스스로 결정한 궁극적 인 목표는 작업 환경을 모니터링하고 당면한 문제에 맞게 아키텍처를 동적으로 조정하는 ANN을 개발하는 것입니다. 데이터 세트가 연속적이지 않고 시간이 지나도 변경되지 않는 경우 왜 조정해야합니까?

가장 큰 문제는 최근에 딥 러닝이 등장함에 따라 여전히 관련 주제입니까? FFNN은 개념 드리프트 문제에서 틈새 시장을 발견 할 기회가 있습니까?

스레드에 너무 많은 질문이 오버로드되는 것을 두려워하지만, 이것은 완전히 논외가 아닙니다. RNN에 대해 알고 있지만, 그들에 대한 경험은 제한적입니다. RNN의 맥락에서 동적 아키텍처 적응이 관련 주제 여야한다고 생각합니다. 문제는 이미 답변을 받았으며 바퀴를 다시 발명 할 것인가입니다.

PS는 메타 최적화에 교차 게시


"아키텍처 조정"이라고 말하면 매개 변수 (가중치, 바이어스) 또는 네트워크의 실제 구조 (숨겨진 노드, 활성화 기능, 연결 등)를 업데이트합니까? 또한 많은 딥 러닝 응용 프로그램에서 최종 결과는 피드 포워드 신경망으로, 일부 감독되지 않은 프로세스에 의해 가중치가 초기화 된 네트워크입니다.
alto

@alto, 나는 실제 NN 구조-숨겨진 단위 및 가능한 층 수-다른 수준의 복잡성에서 구현 될 수 있다고 확신합니다. 아무 데나 가야한다면 딥 러닝에 대해 읽어야한다고 생각합니다.
anna-earwen

@ anna-earwen 재미있는 박사 주제, 어떻게 진행되고 있습니까, 아직 출판물이 있습니까?
Dikran Marsupial

1
@Dikran Marsupial, 나는 곧 IJCNN 2014로 가서 PSO가 어떻게 고차원 NN 훈련에 실패하는지에 대해 이야기 할 것입니다. 답은 '예'이며 알고 있습니다. 나는 원래의 연구 벡터에서 큰 우회를 취했으며 여전히 조정 가능한 아키텍처로 돌아갈 지 궁금합니다. 시간과 경험적 결과 만이 알려줄 것입니다!
anna-earwen 12

나는 그것이 진행되지 않는 이유를 이해하는 것이 과학이 더 필요로하는 것 (그리고 견고한 경험적 연구)을 이해하는 과정에서 찾아 볼 것이다.
Dikran Marsupial

답변:


6

Cascade-Correlation Neural Networks는 훈련 과정에서 숨겨진 노드를 추가하여 구조를 조정하므로 시작하기 좋은 곳이 될 수 있습니다. 내가 본 다른 대부분의 작업은 신경망의 진화 알고리즘을 사용하여 레이어 수, 숨겨진 노드 수 등을 자동으로 조정합니다.

안타깝게도이 작업은 제 영역을 벗어 났으므로 시작하는 데 도움이되는 특정 문서 나 참조를 추천 할 수 없습니다. 딥 러닝 커뮤니티 내에서 동시에 네트워크 구조와 매개 변수를 공동으로 최적화하려는 작업은 보지 못했다고 말할 수 있습니다. 실제로, 대부분의 딥 러닝 아키텍처는 한 번에 하나의 레이어를 탐욕스럽게 학습하는 것을 기반으로하므로 딥 뉴럴 네트워크에 대한 온라인 학습조차도 손대지 않은 영역으로 만듭니다 (Martens et al.의 Hessian Free Optimization에 대한 연구는 주목할만한 예외입니다).


고마워요, 당신은 이미 금을 파기 시작하기에 충분한 정보를 나에게주었습니다. :)
anna-earwen

2

건설적인 신경망 (예 : CC 알고리즘 @alto 등)에 대한 새로운 접근 방식을 개발해야하는 또 다른 이유 는 통계 외부의 응용 프로그램에 있습니다. 특히, 이론적 신경 과학 및인지 과학에서, 발달 신경 네트워크는 발달 및 신경 생성과 은유 적 유사성으로 인해 종종 사용된다. 이를 위해 계단식 상관 관계를 많이 사용하는 예를 보려면 Thomas R. Shultz의 간행물을 보십시오 . 불행히도 캐스케이드 상관 관계 접근법은 생물학적 비현실적 이며 신경 과학이 구부러지면 조절 가능한 아키텍처가있는 새로운 NN을 개발 및 / 또는 신경 생성의 더 나은 모델로 사용하는 방법을 고려할 가치가 있습니다.


1
고마워, Artem! 사실, 나는 다른 어떤 것보다 순수한 컴퓨터 과학자에 가깝기 때문에 신경 과학과인지 과학에 대한 나의 지식은 부족하지 않습니다. 그러나 흥미 진진한 것처럼 들리지만 모든 도로가 아직 열려 있기 때문에 적어도 어느 정도까지도 이것에 대해 탐구 할 수 있습니다. 현재 벤치마킹에 유용한 실제 엔지니어링 및 데이터 분석 문제에 대한 응용 프로그램에 특히 관심이 있습니다.
anna-earwen
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.