프로그램 작성 nlp

18

포트폴리오 관리 도구를위한 내부 웹 사이트를 개발하고 있습니다. 많은 텍스트 데이터, 회사 이름 등이 있습니다. "Did you mean : xxxx"라는 쿼리에 매우 빠르게 응답 할 수있는 일부 검색 엔진 기능에 깊은 인상을 받았습니다. 지능적으로 사용자 검색어를 가져 와서 원시 검색 결과뿐만 아니라 "정말입니까?"로 응답 할 수 있어야합니다. 대체 답변 등이있을 …

436 algorithm machine-learning nlp spell-checking text-search

10

두 텍스트 문서 사이의 유사성을 계산하는 방법은 무엇입니까?

모든 프로그래밍 언어로 NLP 프로젝트를 작업하고 있습니다 (Python이 선호됩니다). 두 개의 문서를 가져 와서 얼마나 비슷한 지 결정하고 싶습니다.

207 nlp

10

Java Stanford NLP : 음성 레이블의 일부?

here 데모 된 Stanford NLP 는 다음과 같은 출력을 제공합니다. Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. 품사 태그의 의미는 무엇입니까? 공식 목록을 찾을 수 없습니다. 스탠포드 자체 시스템입니까, 아니면 범용 태그를 사용하고 있습니까? ( JJ예를 들어 무엇입니까?) 또한 문장을 반복하고 명사를 찾을 때 태그가 있는지 확인하는 것과 같은 일을 끝내게됩니다 …

172 java nlp stanford-nlp part-of-speech

15

단어에서 음절 감지

단어로 음절을 감지하는 상당히 효율적인 방법을 찾아야합니다. 예 : 보이지 않는-> in-vi-sib-le 사용할 수있는 일부 음절 규칙이 있습니다. V CV VC CVC CCV CCCV CVCC * 여기서 V는 모음이고 C는 자음입니다. 예 : 발음 (5 개 발음); CV-CVC-CV-V-CVC) 나는 정규식 (음절을 세고 싶을 때만 도움이 됨) 또는 하드 코딩 된 …

138 nlp spell-checking hyphenation

9

lemmatization과 stemming의 차이점은 무엇입니까?

언제 사용합니까? 또한 ... NLTK 기밀 화는 품사에 의존 하는가? 그것이 더 정확하지 않습니까?

131 python nlp nltk lemmatization

6

Apple은 이메일에서 날짜, 시간 및 주소를 어떻게 찾습니까?

iOS 전자 메일 클라이언트에서 전자 메일에 날짜, 시간 또는 위치가 포함되어 있으면 텍스트가 하이퍼 링크가되고 링크를 누르면 약속을 만들거나지도를 볼 수 있습니다. 영어 이메일뿐만 아니라 다른 언어로도 작동합니다. 이 기능을 좋아하고 그들이하는 방법을 이해하고 싶습니다. 이를 수행하는 순진한 방법은 많은 정규식을 가지고 모두 실행하는 것입니다. 그러나 나는 이것이 잘 확장되지 …

128 machine-learning nlp information-extraction named-entity-recognition

11

NLTK 토크 나이저를 사용하여 구두점을 제거하는 방법은 무엇입니까?

방금 NLTK를 사용하기 시작했는데 텍스트에서 단어 목록을 얻는 방법을 잘 모르겠습니다. 을 사용하면 nltk.word_tokenize()단어 목록과 구두점을 얻습니다. 대신 단어 만 필요합니다. 구두점을 제거하려면 어떻게해야합니까? 또한 word_tokenize여러 문장에서 작동하지 않습니다. 점이 마지막 단어에 추가됩니다.

125 python nlp tokenize nltk

1

구성 파서와 종속성 파서의 차이점

구성 파서 와 종속성 파서 의 차이점은 무엇입니까 ? 두 가지의 다른 사용법은 무엇입니까?

114 parsing nlp

2

자연어 처리를위한 Java 또는 Python [닫기]

닫힘 . 이 질문은 의견 기반 입니다. 현재 답변을 받고 있지 않습니다. 이 질문을 개선하고 싶으십니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 육년 전 . 이 질문 개선 자연어 처리에 어떤 프로그래밍 언어가 더 나은지 알고 싶습니다. Java 또는 Python ? …

112 java python nlp

21

단어 형태소 또는 기본형은 어떻게합니까?

PorterStemmer와 Snowball을 사용해 보았지만 둘 다 모든 단어에서 작동하지 않으며 매우 일반적인 단어가 누락되었습니다. 내 테스트 단어는 : " cats running ran cactus cactuses cacti community community "그리고 둘 다 절반 미만의 권리를 얻습니다. 또한보십시오: 실제 단어를 생성하는 어간 알고리즘 어간-코드 예제 또는 오픈 소스 프로젝트?

111 nlp stemming lemmatization

4

scikit Learn을 사용하여 다중 클래스 케이스에 대한 정밀도, 재현율, 정확도 및 f1 점수를 계산하는 방법은 무엇입니까?

나는 데이터가 다음과 같은 감정 분석 문제에서 일하고 있습니다. label instances 5 1190 4 838 3 239 1 204 2 127 그래서 내 데이터는 1190 instances이 5. scikit의 SVC를 사용하는 Im 분류의 경우 . 문제는 다중 클래스 케이스에 대한 정밀도, 재현율, 정확도 및 f1 점수를 정확하게 계산하기 위해 데이터의 균형을 …

109 python machine-learning nlp artificial-intelligence scikit-learn

3

Genia Corpus로 Stanford Parser를 훈련시키는 방법은 무엇입니까?

Stanford Parser의 새 모델을 만드는 데 몇 가지 문제가 있습니다. Stanford에서 마지막 버전도 다운로드했습니다. http://nlp.stanford.edu/software/lex-parser.shtml 그리고 여기에는 xml과 ptb (Penn Treebank)의 두 가지 형식의 Genia Corpus가 있습니다. Standford Parser는 ptd 파일로 학습 할 수 있습니다. 그런 다음 생의학 텍스트 작업을 원하기 때문에 Genia Corpus를 다운로드했습니다. http://categorizer.tmit.bme.hu/~illes/genia_ptb/ (더 이상 사용할 수없는 …

93 java nlp stanford-nlp

23

"a"와 "an"을 단어 앞에 올바르게 붙이려면 어떻게해야합니까?

명사가 주어진 경우 "a"또는 "an"을 정확히 접두사로 지정하는 .NET 응용 프로그램이 있습니다. 어떻게할까요? 첫 글자가 모음인지 확인하는 것이 답이라고 생각하기 전에 다음과 같은 구문을 고려하십시오. 정직한 실수 중고차

93 c# nlp linguistics

18

스탠포드 파서 및 NLTK

NLTK에서 Stanford Parser를 사용할 수 있습니까? (나는 스탠포드 POS에 대해 말하는 것이 아닙니다.)

90 python parsing nlp nltk stanford-nlp

3

좋은 자연어 처리 라이브러리가 있습니까 [닫힘]

현재이 질문은 Q & A 형식에 적합하지 않습니다. 사실, 참고 문헌 또는 전문 지식이 답변을 뒷받침 할 것으로 기대하지만이 질문은 토론, 논쟁, 여론 조사 또는 확장 된 토론을 유도 할 가능성이 높습니다. 이 질문을 개선하고 다시 열 수 있다고 생각 되면 도움말 센터 를 방문하여 안내를 받으세요. 휴일 칠년 전에 …

90 java nlp

«nlp» 태그된 질문