내가 읽은 것에서 :
먼 감독 :
A Distant supervision algorithm usually has the following steps:
1] It may have some labeled training data
2] It "has" access to a pool of unlabeled data
3] It has an operator that allows it to sample from this unlabeled
data and label them and this operator is expected to be noisy in its labels
4] The algorithm then collectively utilizes the original labeled training data
if it had and this new noisily labeled data to give the final output.
자기 훈련 :
자가 학습 ( 예이츠, 알렉산더 ( Yates, Alexander) 등 "텍스트 관리자 : 웹에서 공개 정보 추출") 휴먼 언어 기술의 진행 : 북미 계산 언어 협회 협회 : 시연. 전산 언어 협회, 2007. ) :
학습자는 두 단계로 작동합니다. 먼저 자체 교육 데이터에 자동으로 양수 또는 음수 레이블을 붙입니다. 둘째,이 레이블이 지정된 데이터를 사용하여 Naive Bayes 분류기를 훈련시킵니다.
약한 감독 (Hoffmann, Raphael, et al. "중복 관계의 정보 추출에 대한 지식 기반의 약한 감독.") .) :
종종 "약한"또는 "원거리"감독이라고하는보다 유망한 접근 방식은 데이터베이스의 내용을 해당 텍스트와 경험적으로 일치 시켜서 고유 한 교육 데이터를 만듭니다.
자체 학습이 레이블 휴리스틱이 훈련 된 분류 자라는 점에서 약간 다르다는 점을 제외하고는 모두 나에게 동일하게 들립니다. 그러나 Yao, Limin, Sebastian Riedel 및 Andrew McCallum. " 표지 된 데이터가없는 집단 간 문서 관계 추출. "2010 년 자연 언어 처리 경험적 방법론 회의. 전산 언어학 협회, 2010. 먼 감독 == 자기 훈련 == 약한 감독.
또한 다른 동의어가 있습니까?