회귀에 대한 제한된 Boltzmann 기계?


13

RBM대해 이전에 질문 한 내용을 추적하고 있습니다. 나는 그것들을 설명하는 많은 문헌을 보았지만 실제로 회귀에 대해 이야기하지는 않았다 (라벨 데이터로 분류조차하지 않음). 레이블이없는 데이터에만 사용된다는 느낌이 들었습니다. 회귀 처리를위한 리소스가 있습니까? 아니면 숨겨진 레이어 위에 다른 레이어를 추가하고 CD 알고리즘을 위아래로 실행하는 것만 큼 간단합니까? 미리 감사드립니다.

답변:


18

라벨이없는 데이터에 대한 귀하의 권리입니다. RBM은 생성 모델이며 가장 자주 감독되지 않은 학습자로 사용됩니다.

Deep Belief Network를 구축 할 때 가장 일반적인 절차는 각각의 새로운 RBM이 서로 쌓여있을 때 한 번에 하나씩 훈련하는 것입니다. 당신이 생각하는 의미에서 대조적 발산은 오르락 내리락하지 않습니다. 이전 최상위 RBM의 숨겨진 계층을 새 최상위 RBM의 입력으로 사용하여 한 번에 하나의 RBM 만 사용합니다. 이 모든 후에 RBM 가중치 스택을 표준 피드 포워드 신경망의 초기 가중치로 취급하고 레이블이 지정된 데이터 및 역 전파를 사용하여 학습하거나 웨이크-슬립 알고리즘을 사용하는 것과 같이 더 이국적인 것을 수행 할 수 있습니다. 이 마지막 단계까지 레이블이있는 데이터를 사용하지 않았습니다. 이는 이러한 유형의 모델의 이점 중 하나입니다.

반면 RBM을 사용하여 분류 할 수있는 몇 가지 방법이 있습니다.

  • RBM 또는 여러 RBM 스택을 훈련시킵니다. 다른지도 학습자에 대한 입력으로 최상위 숨겨진 레이어를 사용하십시오.
  • 각 클래스에 대해 RBM을 훈련시키고 비정규 에너지를 차별 분류기에 대한 입력으로 사용하십시오.
  • RBM을 P (X, Y)의 결합 밀도 모델로 훈련시킵니다. 그런 다음 일부 입력 x가 주어지면 에너지 함수를 최소화하는 클래스 y를 선택하십시오 (상수 Z는 모든 클래스에서 동일하므로 정규화는 위와 같이 문제가되지 않습니다).
  • 차별적 인 RBM 훈련

Geoff Hinton 의 기술 보고서 A 볼트 만 기계 훈련 실용 가이드를 읽어 보시기 바랍니다 . 이 문제들에 대해 훨씬 자세하게 설명하고, 유용한 정보를 제공하고, 관련 논문을 많이 인용하며, 다른 혼란을 해결하는 데 도움이 될 수 있습니다.


1
RBM을 회귀에 사용할 수 있습니까?
waspinator

RBM을 관절 밀도 모델로 훈련시키는 방법은 무엇입니까? 숨겨지지 않은 입력으로 X와 Y를 모두 제공함으로써, 즉 P (X, Y | H) (H는 숨겨진 레이어)로 훈련합니까?
AkiRoss

본인은 본인의 의견에 스스로 답변합니다. 예, "RBM 교육에 대한 실용 가이드"(Hinton, 2010)에서 위에서 설명한 세 가지 방법에 대해 자세히 설명하고 세 번째 방법에서는 "두 세트의 가시성 데이터 "외에, 클래스를 나타 내기 위해 softmax 레이블 단위가 제공됩니다.
AkiRoss


0

RBM (Restricted Boltzman Machine)과 같은 신경망을 테스트 할 수있는 한 가지 방법은 새로운 데이터 세트 또는 더 일반적으로 총 데이터 세트의 서브 세트에 적용하여 성능을 확인하는 것입니다. 교차 검증을 통해 모델을 테스트 할 수도 있습니다. 설치 및 사용이 간단한 널리 사용되는 오픈 소스 머신 러닝 (ML) 소프트웨어 툴킷을 사용했으며 여러 모델의 회귀 통계 ( http : // www)를 사용하여 여러 유형의 ML 알고리즘을 개별적으로 쉽게 테스트 할 수 있습니다 . cs.waikato.ac.nz/ml/weka/ ). 데이터를 포맷하기가 어려울 경우 가치가 없을 수 있지만 프로그램을 실행하는 기본 사항을 제외하고 많은 개입없이 빠른 분석을 제공 할 수 있습니다 (예 : 일반적으로 Google "csv에서 arff로 온라인 변환"할 수는 있지만) 한 단계 포맷의 경우).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.