최근에 나는 베이지안 신경망 (BNN)에 관한 논문을 읽었다 [Neal, 1992] , [Neal, 2012] , 신경망의 입력과 출력 사이의 확률 관계를 제공한다. 이러한 신경망을 훈련시키는 것은 전통적인 역 전파 알고리즘과는 다른 MCMC를 통해 이루어진다.
내 질문은 : 그런 신경망을 사용하면 어떤 이점이 있습니까? 보다 구체적으로, NN보다는 BNN에 더 적합한 예제를 제공 할 수 있습니까?
최근에 나는 베이지안 신경망 (BNN)에 관한 논문을 읽었다 [Neal, 1992] , [Neal, 2012] , 신경망의 입력과 출력 사이의 확률 관계를 제공한다. 이러한 신경망을 훈련시키는 것은 전통적인 역 전파 알고리즘과는 다른 MCMC를 통해 이루어진다.
내 질문은 : 그런 신경망을 사용하면 어떤 이점이 있습니까? 보다 구체적으로, NN보다는 BNN에 더 적합한 예제를 제공 할 수 있습니까?
답변:
베이지안 신경망은 과적 합을 방지하는 방법으로 데이터가 부족한 영역의 문제를 해결하는 데 유용합니다. 그들은 종종 그러한 상황에서 다른 모든 방법을 이깁니다. 응용 분야의 예로 는 분자 생물학 ( 예 :이 백서 )과 의료 진단 (데이터가 종종 비용이 많이 들고 어려운 작업으로 인해 발생하는 영역)이 있습니다. 실제로 베이지안 그물은 보편적으로 유용하며 많은 작업에서 더 나은 결과를 얻을 수 있지만 큰 문제로 확장하기는 매우 어렵습니다.
NN에 비해 BNN의 장점 중 하나는 알 수없는 대상의 데이터를 처리 할 때 예측과 관련된 오류를 자동으로 계산할 수 있다는 것입니다. BNN을 통해 이제 베이지안 추론을 수행하고 있습니다. BNN 예측을 . 여기서 는 NN 함수이고 는 입력입니다 , 는 NN 매개 변수이고 x, t는 훈련 입력 및 목표입니다. 이것은 @forecaster가 제공하는 링크에서 Neal이 사용하는 구문과 호환되어야합니다. 그런 다음 사후 예측 분포의 표준 편차를 계산할 수 있습니다. 이는 예측에 대한 정확도로 순진하게 사용합니다.