파이썬을 사용하는 동안 NLTK에서 한동안 일했습니다. 내가 직면하고있는 문제는 NLTK의 NER를 내 사용자 정의 데이터로 훈련시키는 데 도움이되지 않는다는 것입니다. 그들은 MaxEnt를 사용하여 ACE 말뭉치에 대해 교육했습니다. 웹에서 많이 검색했지만 NLTK의 NER를 훈련시키는 데 사용할 수있는 방법을 찾지 못했습니다.
누구든지 NLTK NER 교육에 사용되는 교육 데이터 세트 형식으로 안내 할 수있는 링크 / 기사 / 블로그 등을 제공 할 수 있다면 특정 형식으로 데이터 세트를 준비 할 수 있습니다. 그리고 내가 링크 / 기사 / 블로그 등으로 연결되면 내 데이터에 대한 NLTK의 NER 교육에 도움이 될 수 있습니다.
이것은 광범위하게 검색되고 가장 적은 질문입니다. NER와 협력하는 미래의 누군가에게 도움이 될 수 있습니다.