NER에 Vowpal Wabbit 사용


9

Vowpal Wabbit (VW)는 SEARN을 통한 시퀀스 태깅 기능을 지원합니다 . 문제는 설명과 예제가있는 자세한 매개 변수 목록을 찾을 수 없다는 것입니다. 내가 찾을 수있는 가장 좋은 예는 Zinkov의 블로그 항목 입니다. 주요 위키 페이지는 거의 SEARN을 언급하고있다.

체크 아웃 된 소스 코드에서 일부 NER 샘플 데이터가있는 데모 폴더를 찾았습니다. 불행히도, 모든 테스트를 실행하는 스크립트는이 데이터에서 실행하는 방법을 보여주지 않습니다. 최소한 예상 형식이 무엇인지 알 수있을 정도로 정보가 충분했습니다. 항목이 빈 줄로 구분된다는 점을 제외하면 표준 VW 데이터 형식과 거의 동일합니다 (중요).

나의 현재 이해는 다음 명령을 실행하는 것입니다.

cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw

어디

--searn 25 -총 NER 라벨 수 (?)

--searn_task sequence -시퀀스 태깅 작업 (?)

--searn_passes_per_policy 2 -그것이 무엇인지 명확하지 않습니다

다른 매개 변수는 VW에 표준이며 추가 설명이 필요하지 않습니다. 아마도 SEARN에 더 많은 매개 변수가 있습니까? 그들의 중요성과 영향은 무엇입니까? 그것들을 조정하는 방법? 경험상 규칙이 있습니까?

예제에 대한 모든 조언을 부탁드립니다.

답변:


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.