«nlp» 태그된 질문

자연어 처리 (NLP)는 자연어 데이터에서 유용한 정보를 변환하거나 추출하는 인공 지능의 하위 분야입니다. 방법에는 기계 학습 및 규칙 기반 접근 방식이 포함됩니다.

18
Google은 "무슨 의미인가요?" 알고리즘 작동?
포트폴리오 관리 도구를위한 내부 웹 사이트를 개발하고 있습니다. 많은 텍스트 데이터, 회사 이름 등이 있습니다. "Did you mean : xxxx"라는 쿼리에 매우 빠르게 응답 할 수있는 일부 검색 엔진 기능에 깊은 인상을 받았습니다. 지능적으로 사용자 검색어를 가져 와서 원시 검색 결과뿐만 아니라 "정말입니까?"로 응답 할 수 있어야합니다. 대체 답변 등이있을 …


10
Java Stanford NLP : 음성 레이블의 일부?
here 데모 된 Stanford NLP 는 다음과 같은 출력을 제공합니다. Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. 품사 태그의 의미는 무엇입니까? 공식 목록을 찾을 수 없습니다. 스탠포드 자체 시스템입니까, 아니면 범용 태그를 사용하고 있습니까? ( JJ예를 들어 무엇입니까?) 또한 문장을 반복하고 명사를 찾을 때 태그가 있는지 확인하는 것과 같은 일을 끝내게됩니다 …

15
단어에서 음절 감지
단어로 음절을 감지하는 상당히 효율적인 방법을 찾아야합니다. 예 : 보이지 않는-> in-vi-sib-le 사용할 수있는 일부 음절 규칙이 있습니다. V CV VC CVC CCV CCCV CVCC * 여기서 V는 모음이고 C는 자음입니다. 예 : 발음 (5 개 발음); CV-CVC-CV-V-CVC) 나는 정규식 (음절을 세고 싶을 때만 도움이 됨) 또는 하드 코딩 된 …


6
Apple은 이메일에서 날짜, 시간 및 주소를 어떻게 찾습니까?
iOS 전자 메일 클라이언트에서 전자 메일에 날짜, 시간 또는 위치가 포함되어 있으면 텍스트가 하이퍼 링크가되고 링크를 누르면 약속을 만들거나지도를 볼 수 있습니다. 영어 이메일뿐만 아니라 다른 언어로도 작동합니다. 이 기능을 좋아하고 그들이하는 방법을 이해하고 싶습니다. 이를 수행하는 순진한 방법은 많은 정규식을 가지고 모두 실행하는 것입니다. 그러나 나는 이것이 잘 확장되지 …

11
NLTK 토크 나이저를 사용하여 구두점을 제거하는 방법은 무엇입니까?
방금 NLTK를 사용하기 시작했는데 텍스트에서 단어 목록을 얻는 방법을 잘 모르겠습니다. 을 사용하면 nltk.word_tokenize()단어 목록과 구두점을 얻습니다. 대신 단어 만 필요합니다. 구두점을 제거하려면 어떻게해야합니까? 또한 word_tokenize여러 문장에서 작동하지 않습니다. 점이 마지막 단어에 추가됩니다.
125 python  nlp  tokenize  nltk 


2
자연어 처리를위한 Java 또는 Python [닫기]
닫힘 . 이 질문은 의견 기반 입니다. 현재 답변을 받고 있지 않습니다. 이 질문을 개선하고 싶으십니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 육년 전 . 이 질문 개선 자연어 처리에 어떤 프로그래밍 언어가 더 나은지 알고 싶습니다. Java 또는 Python ? …
112 java  python  nlp 

21
단어 형태소 또는 기본형은 어떻게합니까?
PorterStemmer와 Snowball을 사용해 보았지만 둘 다 모든 단어에서 작동하지 않으며 매우 일반적인 단어가 누락되었습니다. 내 테스트 단어는 : " cats running ran cactus cactuses cacti community community "그리고 둘 다 절반 미만의 권리를 얻습니다. 또한보십시오: 실제 단어를 생성하는 어간 알고리즘 어간-코드 예제 또는 오픈 소스 프로젝트?

4
scikit Learn을 사용하여 다중 클래스 케이스에 대한 정밀도, 재현율, 정확도 및 f1 점수를 계산하는 방법은 무엇입니까?
나는 데이터가 다음과 같은 감정 분석 문제에서 일하고 있습니다. label instances 5 1190 4 838 3 239 1 204 2 127 그래서 내 데이터는 1190 instances이 5. scikit의 SVC를 사용하는 Im 분류의 경우 . 문제는 다중 클래스 케이스에 대한 정밀도, 재현율, 정확도 및 f1 점수를 정확하게 계산하기 위해 데이터의 균형을 …

3
Genia Corpus로 Stanford Parser를 훈련시키는 방법은 무엇입니까?
Stanford Parser의 새 모델을 만드는 데 몇 가지 문제가 있습니다. Stanford에서 마지막 버전도 다운로드했습니다. http://nlp.stanford.edu/software/lex-parser.shtml 그리고 여기에는 xml과 ptb (Penn Treebank)의 두 가지 형식의 Genia Corpus가 있습니다. Standford Parser는 ptd 파일로 학습 할 수 있습니다. 그런 다음 생의학 텍스트 작업을 원하기 때문에 Genia Corpus를 다운로드했습니다. http://categorizer.tmit.bme.hu/~illes/genia_ptb/ (더 이상 사용할 수없는 …
93 java  nlp  stanford-nlp 



3
좋은 자연어 처리 라이브러리가 있습니까 [닫힘]
현재이 질문은 Q & A 형식에 적합하지 않습니다. 사실, 참고 문헌 또는 전문 지식이 답변을 뒷받침 할 것으로 기대하지만이 질문은 토론, 논쟁, 여론 조사 또는 확장 된 토론을 유도 할 가능성이 높습니다. 이 질문을 개선하고 다시 열 수 있다고 생각 되면 도움말 센터 를 방문하여 안내를 받으세요. 휴일 칠년 전에 …
90 java  nlp 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.