NLP의 분류 프로세스에서 구문 분석 트리에서 일반적으로 사용되는 기능은 무엇입니까?


13

다른 유형의 구문 분석 트리 구조를 탐색하고 있습니다. 널리 알려진 두 가지 구문 분석 트리 구조는 a) 구성 요소 기반 구문 분석 트리 및 b) 종속성 기반 구문 분석 트리 구조입니다.

Stanford NLP 패키지를 사용하여 두 가지 유형의 구문 분석 트리 구조를 모두 사용할 수 있습니다. 그러나 분류 작업에 이러한 트리 구조를 사용하는 방법을 잘 모르겠습니다.

예를 들어 감정 분석을하고 텍스트를 긍정 및 부정 클래스로 분류하려면 분류 작업을 위해 구문 분석 트리 구조에서 어떤 기능을 파생시킬 수 있습니까?

답변:


9

구문 분석 트리를 사용하면 문장을 여러 부분으로 나눕니다. 감정 분석의 예에서 해당 부분을 사용하여 각 부분에 긍정적 / 부정적 감정을 할당 한 다음 해당 부분의 누적 효과를 취할 수 있다고 가정합니다.

감정 분석

이 이미지는 더 많은 것을 이해하는 데 도움이됩니다. 상반기에는 부정적인 감정 (주로 "건조한"이라는 단어)이 있지만 "그러나"라는 단어와 "즐거운"이라는 단어의 사용 때문에 부정적인 감정이 긍정적 인 감정으로 바뀝니다.

그것들을 사용하는 것에 관해서 는 문장에서 개별 단어의 단어 벡터 표현 을 간단히 생성 하고 부모 노드 대신 뉴런을 사용할 수 있습니다. 각 뉴런은 가중치를 통해 다른 뉴런에 연결되어야합니다. 모든 리프 노드는 문장 단어의 단어 벡터 표현이됩니다. 상위 부모 뉴런 (이 경우 상위 파란색 + 기호)은 문장에 따라 양의 / 음의 정서를 생성해야합니다. 이 트리 구조는 감독 방식으로 훈련 될 수 있습니다.

이해를 통해 자세한 내용을 보려면이 백서 를 읽으십시오 .

이미지 크레디트 : cs224.stanford.edu


1

나는 의존성이 당신의 감정 분류기의 정확도를 향상시키는 데 사용될 수 있다고 생각합니다. 다음 예를 고려하십시오.

E1 : Bill은 과학자가 아닙니다

"과학자"라는 토큰이 특정 도메인에서 긍정적 인 감정을 가지고 있다고 가정합니다.

의존성 부정 (과학자가 아닌)을 알면 위의 예가 부정적인 감정을 가지고 있음을 알 수 있습니다. 이러한 의존성을 알지 못하면 아마도 문장을 긍정적으로 분류 할 것입니다.

다른 유형의 종속성은 분류기의 정확도를 향상시키기 위해 동일한 방식으로 사용될 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.