딥 러닝 라이브러리를 사용하여 텍스트에서 키워드 / 구문 추출


20

아마도 이것은 너무 광범위하지만 텍스트 요약 작업에서 딥 러닝을 사용하는 방법에 대한 참조를 찾고 있습니다.

나는 표준 단어 빈도 접근법과 문장 순위를 사용하여 텍스트 요약을 이미 구현했지만이 작업에 딥 러닝 기술을 사용할 가능성을 탐색하고 싶습니다. 또한 감정 분석을 위해 CNN (Convolutional Neural Networks)을 사용하여 wildml.com에 제공된 일부 구현을 살펴 보았습니다 . 텍스트 요약 및 키워드 추출을 위해 TensorFlow 또는 Theano와 같은 라이브러리를 사용하는 방법을 알고 싶습니다. 신경망 실험을 시작한 지 약 일주일이 지났 으며이 라이브러리의 성능 이이 문제에 대한 이전 접근법과 어떻게 비교되는지 정말 기쁘게 생각합니다.

특히 이러한 프레임 워크를 사용하여 텍스트 요약과 관련된 흥미로운 논문과 github 프로젝트를 찾고 있습니다. 누구든지 나에게 참고 자료를 제공 할 수 있습니까?

답변:


15

구글 연구 블로그 의 맥락에서 도움이 될한다 TensorFlow .

위 기사에는 텍스트 요약에 일상적으로 사용되는 Annotated English Gigaword 데이터 세트에 대한 참조가 있습니다.

Sutskever 등의 신경 회로망을 이용한 Sequence to Sequence Learning 이라는 제목 의 2014 논문 은 짧은 텍스트의 경우 요약은 딥 러닝 기술을 통해 엔드 투 엔드로 학습 할 수 있음 을 보여 주므로 여행에서 의미있는 시작이 될 수 있습니다.

마지막으로, 여기 TensorFlow을 살리면서 좋은 Github의 저장소 시연 텍스트 요약입니다.


16

이것은 개방 된 리서치 영역이며 문제의 구성 방식에 따라 달라집니다. 다중 문서 요약에 대해 이야기하는 경우 문제는 단일 문서 요약에 대해 이야기하는 것과 약간 다릅니다.

문헌을 간단히 살펴볼 가치가 있습니다.

u / Society Of Data Scientists 가 제공하는 링크 는 훌륭하며 단일 문서 에서 추상적 인 요약 작업에 유용 합니다. 추출에 대한 중요한 문장을 식별하는 추출 요약 에 대한 작업도 있습니다 .

러쉬 등. al은 딥 러닝을 기반으로하는 Attention으로의 추상적 인 요약에 관한 훌륭한 논문을 가지고 있습니다.

추출 요약의 경우 LSTM을 사용하여 분류기를 빌드하고 표준 TensorFlow / Torch 라이브러리를 사용할 수 있지만이 방법에 대한 딥 러닝 사용에 대한 현재 발행물은 없습니다.

추가적인 GitHub 저장소는 다음과 같습니다.


감사합니다 @franciscojavierarceo 위에서 언급 한 논문을 살펴 보겠습니다.
shanky_thebearer 2016

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.