베이지안 신경망 사용의 장점은 무엇입니까


12

최근에 나는 베이지안 신경망 (BNN)에 관한 논문을 읽었다 [Neal, 1992] , [Neal, 2012] , 신경망의 입력과 출력 사이의 확률 관계를 제공한다. 이러한 신경망을 훈련시키는 것은 전통적인 역 전파 알고리즘과는 다른 MCMC를 통해 이루어진다.

내 질문은 : 그런 신경망을 사용하면 어떤 이점이 있습니까? 보다 구체적으로, NN보다는 BNN에 더 적합한 예제를 제공 할 수 있습니까?

답변:


9

베이지안 신경망은 과적 합을 방지하는 방법으로 데이터가 부족한 영역의 문제를 해결하는 데 유용합니다. 그들은 종종 그러한 상황에서 다른 모든 방법을 이깁니다. 응용 분야의 예로 는 분자 생물학 ( 예 :이 백서 )과 의료 진단 (데이터가 종종 비용이 많이 들고 어려운 작업으로 인해 발생하는 영역)이 있습니다. 실제로 베이지안 그물은 보편적으로 유용하며 많은 작업에서 더 나은 결과를 얻을 수 있지만 큰 문제로 확장하기는 매우 어렵습니다.


2
베이지안 그물을 확장하기 어려운 이유를 확장 할 수 있습니까?
Ellis Valentiner

6

NN에 비해 BNN의 장점 중 하나는 알 수없는 대상의 데이터를 처리 할 때 예측과 관련된 오류를 자동으로 계산할 수 있다는 것입니다. BNN을 통해 이제 베이지안 추론을 수행하고 있습니다. BNN 예측을 . 여기서 는 NN 함수이고 는 입력입니다 , 는 NN 매개 변수이고 x, t는 훈련 입력 및 목표입니다. 이것은 @forecaster가 제공하는 링크에서 Neal이 사용하는 구문과 호환되어야합니다. 그런 다음 사후 예측 분포의 표준 편차를 계산할 수 있습니다. 이는 예측에 대한 정확도로 순진하게 사용합니다.f¯(x|x,t)=f(x,ω)p(ω|x,t)dωfxωσ(x)=[f(x,ω)f¯(x|x,t)]2p(ω|x,t)dω


1
이것은 대화에 흥미로운 추가 사항이지만 표준에 따라 조금 짧습니다. 좀 더 정교하게 설명해 주시겠습니까?
Sycorax는 Reinstate Monica가

확실한. BNN을 통해 이제 베이지안 추론을 수행하고 있습니다. BNN 예측을 . 여기서 f는 NN입니다. 함수, x '는 입력이고, 는 NN 매개 변수이고, 는 훈련 입력 및 목표입니다. 이것은 @forecaster가 제공하는 링크에서 Neal이 사용하는 구문과 호환되어야합니다. 그런 다음 사후 예측 분포의 표준 편차를 계산할 수 있습니다. 이는 예측의 정확도로 순진하게 사용합니다.f¯(x|x,t)=f(x,ω)p(ω|x,t)dωωx,tσ(x)=([f(x,ω)f¯(x|x,t)]2p(ω|x,t)dω)
Michelle K

이것을 답변으로 편집하십시오.
Sycorax는 Reinstate Monica가
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.