문법 규칙을 사용하여 영어를 일반화 할 수 있습니까?


10

프로그래밍 언어에는 유효한 문장과 표현을 구성하는 문법 규칙이 있습니다. 이 규칙은 사용자가 작성한 프로그램을 구문 분석하는 데 도움이됩니다.

영어로 된 문장을 정확하게 구문 분석 하고 AI 기반 프로젝트에 사용하기 위해 구현할 수있는 기능적으로 완전한 문법 규칙이있을 수 있습니까?

온라인에서 사용할 수있는 많은 NLP 툴킷이 있지만 그다지 효과적이지 않습니다. 그들 중 대부분은 특정 표현 체를 사용하여 복잡한 상관 관계를 유추하지 못하는 특정 시체를 사용하여 훈련됩니다.

다시 말해서, 내가 묻는 것은 컴퓨터가 영어로 작성된 잘 정돈 된 문장을 마치 성인 영어권 사람이 파싱 한 것처럼 파싱 할 수 있다는 것입니다.

편집 : 간단한 문법 규칙을 사용하여 표현할 수 없다면 어떤 종류의 의미 구조를 일반화하는 데 사용할 수 있습니까?

EDIT2 :이 백서 는 자연 언어로 문맥이 없음을 증명합니다. 너무 복잡하더라도 해결책을 찾고 있습니다.


2
나는 이것을 뒷받침 할 언급이 없지만 수학적으로 증명할 수 없다고 생각합니다. 영어를 이해하려면 완전히 포함 할 수없는 높은 수준의 의미 론적 추론을 요구하는 상황 신호 문법 규칙.
antlersoft

답변:


8

영어로 된 문장을 정확하게 구문 분석하고 AI 기반 프로젝트에 사용하기 위해 구현할 수있는 기능적으로 완전한 문법 규칙이있을 수 있습니까?

예, 정확하게 분석하십시오.

왜 ?

우리가 소리에서 의미를 얻는 방법에 대한 나의 이해에 따르면, 두 가지 보완 전략이 있습니다.

문법 규칙 : 의사 소통을 용이하게하기 위해 단어를 주문하기위한 규칙 기반 시스템입니다. 여기서 의미는 개별 사운드의 상호 작용과 독립적 인 의미에서 파생되므로 규칙 책을 기반으로 문장을 구문 분석 할 수 있습니다.

EG "이것은 승리"였다 : 파서는 대응하는 의미 (특정 인물 또는 사물)를 가진 대명사 ( 이것 )를 추출 할 것이다 . 동사 ( 했다 (발생) 의미 대응); ( a ) 여기서 파서 추출, 명사 또는 무기한 기사는 무엇입니까? 그래서 우리는 문법 규칙 책을 참조하고 의미 (무정형 기사 중 하나)에 정착합니다. 다음 단어를 구문 분석하고 참조해야하지만 지금은 그 단어에 대해 광택을 내고 마지막으로 명예 를 얻습니다. (동사 일 수도 있지만 문법 규칙 책 덕분에 우리는 다음과 같은 의미로 명사를 정했습니다 : (승리, 정복), 결국 우리는 (의미에 합류 함) :

특정한 일이 승리했습니다. 충분히 가깝고 몇 가지 다른 규칙을 고집하고 있지만 요점은 아닙니다. 다른 전략은 다음과 같습니다.

어휘 사전 (또는 사전) 단어 나 소리가 특정 의미와 관련되는 경우. 여기서 의미는 하나 이상의 단어 또는 소리를 단위로 파생 된 것입니다. 이것은 파서에 문제를 가져옵니다. 왜냐하면 아무것도 파싱해서는 안됩니다.

EG "Non Plus Ultra" 그리고 AI 파서는이 구절이 파싱되지 않고 대신 의미와 일치한다는 것을 인식합니다.

최고점 또는 정점

어휘 단위는 그 자체가 첫 번째 예의 일부가 될 수 있다는 또 다른 문제를 소개하므로 재귀로 끝납니다.

컴퓨터가 영어를 사용하는 성인이 구문 분석 한 것처럼 영어로 작성된 정통한 문장을 구문 분석 할 수 있습니까?

문법 규칙 책이나 어휘 부분을 효과적으로 다루는 대부분의 예가 가능할 수 있다고 생각하지만 둘 다의 조합을 알고 있지는 않지만 프로그래밍 측면에서 발생할 수 있습니다.

불행히도이 문제를 해결하더라도 인공 지능은 엄격한 의미로 사물을 이해하지 못하고 매우 정교한 동의어를 제시하며, 추가로 문맥 (주석에 언급 된 바와 같이)은 문법 및 사전 전략에 중요한 역할을합니다.

간단한 문법 규칙으로 표현할 수 없다면 어떤 종류의 의미 론적 구조를 일반화하는 데 사용할 수 있습니까?

문법 규칙과 어휘가 둘 다 혼합되어 있고 AI 고유의 상황과 경험을 기반으로 변경 및 영향을받을 수 있으며 이러한 객체를 처리하는 시스템은 한 가지 방법 일 수 있습니다.


내 영어 범위는 공식적인 사용으로 제한됩니다. 만약 우리가 은유 나 관용구와 같은 매우 복잡한 실체를 건너 뛰면 상황에 맞는 문법을 정의하는 것이 목적을 달성 할 수 있을까요?
skrtbhtngr

@skrtbhtngr : 이론적으로는 그렇습니다. 정식 언어의 하위 집합이 될 것입니다.하지만 여전히 어려운 문제가 될 것입니다.
키노

사이드 케이스 : "이것은 승리였다"는 여러 가지 이유로 모터 바이크 (첫 번째 자전거, 탄 자전거)에 대해 이야기 할 수 있습니다.
Tensibai

나는 텍스트의 의미를 이해하는 것이 어렵다는 것에 동의합니다. 간단한 문장 : "피터는 영화관에 갔다." Peter는 남성이며, 아마도 여자 친구와 함께 영화를 보러 갔고, 위치는 바뀌 었습니다. 예를 들어 텍스트를 기반으로 한 그래프를 작성하는 것만으로는 충분하지 않습니다. 정적 인 것이 아니라 여러 타임 라인, 이벤트 및 컨텍스트를 설명 할 수 있으며 이전 문장 또는 다음 문장을 이해하기 위해 추론하고 사용할 수있는 모든 문장에 숨겨진 정보가 있습니다.
inf3rno

2

영어는 단순히 공식적인 정의가 없기 때문에 가장 엄격한 의미에서 답은 "아니오"라고 확신합니다. 즉, 아무도 영어를 통제하지 않으며 모든 사람이 준수해야하는 공식 문법을 출판하지 않습니다. 영어는 경험적 과정을 통해 만들어지며 모순과 결함이 있지만 인간 정신의 확률 적 특성으로 인해 우리는 그러한 문제를 해결할 수 있습니다.

예를 들어,이 "문장"은 다음과 같습니다.

이 문장은 동사 없음

기술적으로 동사가 없기 때문에 전혀 문장이 아닙니다. 그러나 그 의미를 이해하는 데 문제가 있습니까? 못 미더운. 그래도 공식적인 규칙을 생각해보십시오. 그리고 그것은 하나의 예일뿐입니다.

이제 사례의 90 %를 다루고 대부분의 실제 사용에 "충분한"공식 문법을 만들 수 있습니까? 아마도, 아마도 아마. 그러나 나는 100 %에 도달 할 수 없다고 확신합니다.


1
귀하의 예는 문법이 아니므로 왜 문법에 설명을위한 공식 규칙이 포함되어야합니까?
BlindKungFuMaster

1
바로 내 요점입니다. 영어이고 명확하게 이해할 수 있지만 일반적으로 사용되는 영어 문법 정의를 충족하지 못하면 따라서 실제 영어가 엄격한 문법의 범위 밖에서 어떻게 작동하는지에 대한 예입니다.
mindcrime

2

우리는 그것이 두 가지면에서 순환적인 문제라는 결론을 내렸다. 구조는 맥락없이 추론 할 수 없지만 구조를 아는 것도 맥락을 추론하는 데 도움이된다. 따라서 복잡한 해결책은 다음과 같습니다. 문맥으로 시작합니다. 문맥에서 시작하여 단어 (조합 및 검색 문제)의 조합으로 결정하거나 구조를 결정하거나 "구문 분석"(이 단계에서 무의미한 단어 또는 최소한 더 적은 가중치를 할당) 컨텍스트로 돌아가서 구문 분석으로 돌아가서 의미에 도달 할 때까지 계속하십시오. 따라서 반복적이고 재귀적인 감소로 전체 문제를 해결할 수 있습니다.


2

나는 이전의 모든 의견에 강력히 동의하지 않습니다. 그들이 잘못 되었기 때문이 아니라 실수가 아니기 때문에 실수로 오도하기 때문입니다.

예를 들어 : 학업 적 입장에서 이러한 문제를 보면 문제는 항상 극복 할 수없는 것처럼 보일 것입니다. 그 이유는 모든 것이 다른 모든 것과 별도로 냉장 평가되고 계산되기 때문입니다.

대답은 주로 단어 연합에있다 . 방대한 디지털 서적 데이터베이스를 처리 할 수있는 프로그램을 작성하여 모든 단어와 그 단어와 관련된 모든 단어를 해당 언어로 등록해야합니다. 각 관련 단어 및 관련 문장 부호와 함께 모든 통계 정보를 제공합니다.

그러면 AI가 몇 가지 사항을 결정할 수있는 기반이됩니다.

  1. 주어진 문장의 구조가 올바른지 여부.
  2. 구조가 나쁘면 상황을 결정할 확률과 말하는 내용의 의도입니다.
  3. 통계에 따르면 다각적 인 단어 (Triumph)의 올바른 의미와 적용은 우연히입니다.
  4. 대화가 진행될 위치를 결정합니다.
  5. 올바른 문법과 문장 부호

결론적으로 두 가지를 찾아야합니다. 연관성과 확률.

언어 모델을 디지털 방식으로 데이터베이스화할 때, 단어 및 문장 "문자열"의 가능성이 발생하여, 주어진 문장에서 언어 구조의 모든 변형은 텍스트 샘플이 스 크라이 빙되기 전, 도중 및 후에 결정될 수있다. 언어 모델 패턴에 대한 이러한 친밀한 제어는 "대상"및 "개체"와 같은 민감한 구성 요소를 코드로 쉽게 결정할 수 있음을 의미합니다.


나는 그것이 지나치게 낙관적이라고 생각합니다. 이것이 작동하기에는 언어가 너무 지저분합니다.
Oliver Mason
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.