단어 목록 출처


11

나는 여러 언어로 명사, 부사, 형용사, 동사를 찾고있다.

나는 목록을 원해. 이미 떨어져 나눠지고, 통과 할 필요가 없다. OED (그리고 비 영어 동등 물)를 손으로 재 작성하여 상기 목록을 작성합니다.

나는 정의에 대해 정말로 신경 쓰지 않는다. 그리고 나는 어떤 단어가 여러 부분의 연설이 될 수 있다는 것을 이해한다. "좋다"라는 단어는 명사 나 형용사가 될 수 있으며, 두 목록 모두에 나타날 수있다.

누구도 그런 원천에 대해 알고 있습니까? 그렇지 않다면 누군가 나를 올바른 방향으로 향하게 할 수 있습니까?

나는 형식이 다음 중 하나 인 (또는 사람들이 아이디어를 가지고 있다면 비슷하게) 괜찮습니다.

  • CSV : <word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • "명사", "동사"등과 같은 일반 텍스트 파일
  • mysql 테이블
  • 기타

답변:


8

나는 사용했다. WordNet 프린스턴 대학에서 일부 프로젝트를 위해. 이것은 영어로 된 어휘 데이터베이스입니다. 글로벌 워드 넷 모든 언어에 대해 동일한 작업을 수행하려는 프로젝트의 확장입니다.

관련 프로젝트에 관심이있을 수도 있습니다. http://wordnet.princeton.edu/wordnet/related-projects/


이것은 정말로 유망 해 보인다. 감사합니다!
warren

1
WordNet은 갈 길입니다. 모든 최고 연구원이 이것을 사용합니다.
Ritwik Bose

4

이것은 전혀 도움이되지 않을 수도 있습니다. 모르겠습니다. 하지만 MediaWiki에는 API 특정 카테고리에 속하는 모든 페이지를 나열합니다. 당신은 Wiktionary.org에서 그것을 사용해 볼 수 있습니다.

노트:

  • 각 쿼리는 500 개의 결과 만 반환합니다. 그러나 결국에는 다른 쿼리에서 다음 500 개의 결과를 얻기 위해 사용할 매개 변수도 지정합니다.
  • 여기에는 지정된 카테고리의 모든 항목, 심지어는 다른 하위 카테고리가 포함됩니다.
  • 결과는 영문자 순서로 표시되지만, 대문자로 시작하는 모든 것은 소문자의 앞에옵니다.

예 :

희망이 도움이, 내가 생각할 수있는거야.


1

나는 wordnet에 대한 두 번째 @ teknikqa의 제안을 하겠지만, 나는 당신이 그들의 API를 체크 아웃 할 것을 제안 할 것이다.

이야기 시간 : 나는 언어 분석 부분이있는 인공 지능 코스를 가졌다. 필자는 wordnet의 perl API를 사용하여 자동으로 상위 3 가지 정의 유형을 조회하고이를 거의 실시간으로 구문 분석했습니다 이야기의 끝

밖에 API가 있습니다. 다양한 언어

FYI : 프로젝트에 A +

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.