큰 텍스트 모음을 어디에서 찾을 수 있습니까? [닫은]


16

다운로드 할 큰 (> 1000) 텍스트 말뭉치를 찾고 있습니다. 세계 뉴스 나 어떤 종류의 보고서가있는 것이 바람직하다 . 특허가있는 제품 만 찾았습니다. 어떤 제안?


이 글타래는 주제가 아닌 것 같습니다. meta.stats.stackexchange.com/questions/1032/…를 참조하십시오 .
whuber

이 질문은 데이터 세트를 찾는 것이 아니라 통계 분석을하기에 관하여이기 때문에 주제 꺼져있는 것처럼 보이
분석 재개 모니카 - 피터 Flom에

2
이 Q & A가 정말 유용하기 때문에 어색합니다.
사이드 쇼 밥

@guaka, 그런 사소한 편집, 특히 닫힌 게시물에 대해 오래된 게시물을 부딪치지 마십시오. 우리의 스타일 선호는 "감사"를 갖는 것이 아니라,이 사소한 것에 대해서는, 우리는 그냥 떠날 것입니다.
gung-모니 티 복원

답변:




6

로이터 텍스트 코퍼스는 현장의 고전이며 여기 에서 찾을 수 있습니다


가장 흥미로운 (또는 다양한) 말뭉치가 아닙니다. 라이센스는 Wikileaks (퍼블릭 도메인 미국 문서) 또는 wikinews와 관련하여 제한적입니다.
ariddell

@ariddell 나는 동의하지만, 소개 NLP 예제에서 일반적으로 사용되며 학습에 유용 할만 큼 크지 만 좋은 랩톱에서 분석하기에는 작습니다.
richiemorrisroe



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.