그래서 사용에서 불용어를 제거하고 싶은 데이터 세트가 있습니다.
stopwords.words('english')
나는 단순히이 단어를 제거하기 위해 코드 내에서 이것을 사용하는 방법에 어려움을 겪고 있습니다. 이 데이터 세트의 단어 목록이 이미 있습니다. 제가 고민하고있는 부분은이 목록과 비교하여 불용어를 제거하는 것입니다. 도움을 주시면 감사하겠습니다.
from nltk.corpus import stopwords
for future googlers
nltk.download("stopwords")
불용어 사전을 사용하려면 실행해야 합니다.