비 원자 데이터를 예측 기능으로 사용하고 싶습니다. 이 기능이있는 테이블이 있다고 가정하십시오.
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
예를 들어 열 2를 예측 / 분류하고 싶습니다.
"Foo Born은 어디 있었습니까?"와 같은 질문에 자동으로 응답하도록 무언가를 만들고 있습니다. ...
먼저 검색 엔진에 쿼리를 한 다음 결과로 일부 텍스트 데이터를 얻은 다음 모든 구문 분석 작업 (태그 지정, 형태소 분석, 구문 분석, 분할 ...)을 수행합니다.
첫 번째 접근 방식은 각 행에 텍스트 줄과 "First Word", "Tag of First Word", "Chunks"등과 같은 많은 기능이있는 표를 만드는 것입니다.
그러나이 접근법으로 문장 사이의 관계가 빠져 있습니다.
트리 구조 (또는 벡터) 내부를보고 관계를 만들고 예측 / 분류와 관련된 모든 것을 추출하는 알고리즘이 있는지 알고 싶습니다. 구현 해야하는 알고리즘보다 라이브러리를 알고 싶습니다.