답변:
어떤 형태의 텍스트 마이닝 / 정보 검색 등을 포함하는 연구 프로젝트가있는 것 같습니다. 및 StackExchange 사이트.
Google / Google 학자를 통해 찾을 수있는 몇 가지 예 (전체 목록 근처에있을 가능성은 거의 없음) :
보다 일반적으로, 자동 질문 응답 시스템은 사소한 / "해결 된"문제가 아니라 여전히 활발한 연구 분야 인 것으로 보입니다. StackExchange는 이러한 시스템의 데이터 소스 중 하나 일 수 있지만 다른 데이터 소스 (Wikipedia, Quora 등)도 많이 있습니다.
DuckDuckGo 는 StackExchange에서 기술적 인 질문에 대한 답변을 배웁니다. DuckouckGo에 "진행중인 프로젝트 사용 스택 교환" 과 같은 기술적 인 질문을 입력 하면 오른쪽에 강조 표시된 답변이 제공됩니다. 그리고 오리는 많은 (100) 더 많은 질문에 답하는 데이터 소스를위한 공개 API를 가지고 있습니다. 또는 stackexchange api 로 직접 이동할 수 있습니다 .
프로젝트는 TOU 를 준수하는 한 SE 공개 API의 데이터를 사용할 수 있습니다 . 기본적으로 사용자가 데이터가 Stack Exchange에서 제공되었음을 알릴 수 있도록하십시오. 또한 저작권 라이센스는 학습 된 요약 정보와 함께 텍스트 내용을 변경하는 기능을 제한 할 수 있습니다. 아마도 이것이 Duck.com이 키워드를 강조하는 이유 일 것입니다.
데이터 권리 법은 특히 사이트에 제출 한 데이터와 해당 데이터에서 파생 된 머신 러닝 모델에 관한 한 유동적입니다. 새로운 유럽 데이터 및 개인 정보 보호 규칙을 사용하면 스택 교환과 같은 사이트에 제출 한 모든 데이터를 다운로드하거나 삭제할 수 있습니다.