이 질문에 대한 명확한 답이 없을 것으로 기대합니다. 그러나 과거에는 많은 머신 러닝 알고리즘을 사용했으며 베이지안 네트워크에 대해 배우려고합니다. 어떤 상황에서 또는 다른 접근법에 대해 베이지안 네트워크를 사용하기로 선택한 어떤 유형의 문제에 대해 이해하고 싶습니다.
이 질문에 대한 명확한 답이 없을 것으로 기대합니다. 그러나 과거에는 많은 머신 러닝 알고리즘을 사용했으며 베이지안 네트워크에 대해 배우려고합니다. 어떤 상황에서 또는 다른 접근법에 대해 베이지안 네트워크를 사용하기로 선택한 어떤 유형의 문제에 대해 이해하고 싶습니다.
답변:
베이지안 네트워크 (BN)는 생성 모델입니다. 입력 세트 및 출력 가 있다고 가정하십시오 . BN을 사용하면 조건부 분포 를 모델링하는 로지스틱 회귀 또는 Support Vector Machine과 달리 관절 분포 를 배울 수 있습니다 .Y P ( X , Y ) P ( Y | X )
조건부 확률 (구별 모델)을 배우는 것보다 데이터의 결합 확률 분포 (생성 모델)를 배우는 것이 더 어렵습니다. 그러나 전자는 또는 등과 같은 쿼리를 실행할 수있는보다 다양한 모델을 제공합니다 . 차별적 모델의 유일한 목표는 를 배우는 것입니다. .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )
BN은 공동 배포를 처방하기 위해 DAG를 사용합니다. 따라서 이들은 그래픽 모델입니다.
장점 :
의학에서와 같이 결측 데이터가 많은 경우 BN은 관절 분포 (예 : 데이터 생성 방법에 대한 주장)를 모델링하여 완전히 관찰 된 데이터 세트를 갖는 데 따른 종속성을 감소 시키므로 매우 효과적 일 수 있습니다.
시각적으로 투명한 방식으로 도메인을 모델링하고 관계 를 캡처하려는 경우 BN은 매우 강력 할 수 있습니다. BN의 인과성 가정은 논쟁의 여지가 있습니다.
관절 분포를 배우는 것은 어려운 작업으로, 조건부 확률 테이블, 즉 CPT 계산을 통해 이산 변수를 모델링하는 것이 연속 변수에 대해 동일한 것을 시도하는 것보다 훨씬 쉽습니다. 따라서 BN은 불연속 변수에서 실제로 더 일반적입니다.
BN은 (모든 머신 러닝 모델이 허용하는 것처럼) 관찰 추론뿐만 아니라 인과 적 개입 도 허용 합니다. 이것은 일반적으로 무시되고 과소 평가되는 BN의 이점이며 반추 론적 추론과 관련이 있습니다.