다른 머신 러닝 방식보다 Bayesian Networks를 언제 사용해야합니까?


13

이 질문에 대한 명확한 답이 없을 것으로 기대합니다. 그러나 과거에는 많은 머신 러닝 알고리즘을 사용했으며 베이지안 네트워크에 대해 배우려고합니다. 어떤 상황에서 또는 다른 접근법에 대해 베이지안 네트워크를 사용하기로 선택한 어떤 유형의 문제에 대해 이해하고 싶습니다.


3
저에게 Bayesian Networks는 모델에서 조건부 독립성을 정의하는 방법입니다. 일단 정의하면 다양한 학습 도구를 사용하여 모델 매개 변수를 추정 할 수 있습니다. 따라서 매개 변수 학습과 모델이 명확하게 분리되어 있습니다. 그러나 나는 이것에 대한 전문가가 아니므로 더 나은 답변을 얻을 수 있습니다.
Luca

답변:


8

베이지안 네트워크 (BN)는 생성 모델입니다. 입력 세트 및 출력 가 있다고 가정하십시오 . BN을 사용하면 조건부 분포 를 모델링하는 로지스틱 회귀 또는 Support Vector Machine과 달리 관절 분포 를 배울 수 있습니다 .Y P ( X , Y ) P ( Y | X )XYP(X,Y)P(Y|X)

조건부 확률 (구별 모델)을 배우는 것보다 데이터의 결합 확률 분포 (생성 모델)를 배우는 것이 더 어렵습니다. 그러나 전자는 또는 등과 같은 쿼리를 실행할 수있는보다 다양한 모델을 제공합니다 . 차별적 모델의 유일한 목표는 를 배우는 것입니다. .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

BN은 공동 배포를 처방하기 위해 DAG를 사용합니다. 따라서 이들은 그래픽 모델입니다.

장점 :

  1. 의학에서와 같이 결측 데이터가 많은 경우 BN은 관절 분포 (예 : 데이터 생성 방법에 대한 주장)를 모델링하여 완전히 관찰 된 데이터 세트를 갖는 데 따른 종속성을 감소 시키므로 매우 효과적 일 수 있습니다.

  2. 시각적으로 투명한 방식으로 도메인을 모델링하고 관계 를 캡처하려는 경우 BN은 매우 강력 할 수 있습니다. BN의 인과성 가정은 논쟁의 여지가 있습니다.causeeffect

  3. 관절 분포를 배우는 것은 어려운 작업으로, 조건부 확률 테이블, 즉 CPT 계산을 통해 이산 변수를 모델링하는 것이 연속 변수에 대해 동일한 것을 시도하는 것보다 훨씬 쉽습니다. 따라서 BN은 불연속 변수에서 실제로 더 일반적입니다.

  4. BN은 (모든 머신 러닝 모델이 허용하는 것처럼) 관찰 추론뿐만 아니라 인과 적 개입 도 허용 합니다. 이것은 일반적으로 무시되고 과소 평가되는 BN의 이점이며 반추 론적 추론과 관련이 있습니다.


1
BN이 결 측값이 많은 데이터를 모델링하는 데 효과적이라는 이점 1에서이 결 측값이 데이터의 독립성을 올바르게 식별하는 데 영향을 미치지 않습니까?
호세인

1
예, 모델을 피팅하는 동안 몇 가지 가정으로 대치해야하지만 DAG의 인수 분해 (독립 가정을 캡슐화 에 따라 와 같은 구조가 있으면 가 이미 사용 가능한 경우 이 필요하지 않을 수 있습니다. X 1 X 2P(Y,X1,X2)X1X2
Zhubarb

1

내 경험상 Bayesian Networks는 차원높은 범주 형 데이터 가있을 때 매우 잘 작동 합니다 . 해석 가능한 모델을 제공하는데,이 모델은 여러 변수가 어떻게 상호 작용하는지 이해하는 데 도움이됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.