Vowpal Wabbit (VW)는 SEARN을 통한 시퀀스 태깅 기능을 지원합니다 . 문제는 설명과 예제가있는 자세한 매개 변수 목록을 찾을 수 없다는 것입니다. 내가 찾을 수있는 가장 좋은 예는 Zinkov의 블로그 항목 입니다. 주요 위키 페이지는 거의 SEARN을 언급하고있다.
체크 아웃 된 소스 코드에서 일부 NER 샘플 데이터가있는 데모 폴더를 찾았습니다. 불행히도, 모든 테스트를 실행하는 스크립트는이 데이터에서 실행하는 방법을 보여주지 않습니다. 최소한 예상 형식이 무엇인지 알 수있을 정도로 정보가 충분했습니다. 항목이 빈 줄로 구분된다는 점을 제외하면 표준 VW 데이터 형식과 거의 동일합니다 (중요).
나의 현재 이해는 다음 명령을 실행하는 것입니다.
cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw
어디
--searn 25
-총 NER 라벨 수 (?)
--searn_task sequence
-시퀀스 태깅 작업 (?)
--searn_passes_per_policy 2
-그것이 무엇인지 명확하지 않습니다
다른 매개 변수는 VW에 표준이며 추가 설명이 필요하지 않습니다. 아마도 SEARN에 더 많은 매개 변수가 있습니까? 그들의 중요성과 영향은 무엇입니까? 그것들을 조정하는 방법? 경험상 규칙이 있습니까?
예제에 대한 모든 조언을 부탁드립니다.