다른 자체 정의 범주에 속하는 단어 목록이 있습니다. 각 범주에는 고유 한 패턴이 있습니다 (예를 들어, 하나는 특수 문자로 고정 길이를 가지며 다른 하나는이 범주에서 "단어"등으로 나타나는 문자가 존재 함).
예를 들면 다음과 같습니다.
"ABC" -> type1
"ACC" -> type1
"a8 219" -> type2
"c 827" -> type2
"ASDF 123" -> type2
"123123" -> type3
...
훈련 데이터를 기반으로 이러한 패턴을 스스로 학습하는 기계 학습 기술을 찾고 있습니다. 나는 이미 몇 가지 예측 변수 (예 : 단어 길이, 특수 문자 수 등)를 스스로 정의하려고 시도한 다음 신경망을 사용하여 범주를 배우고 예측했습니다. 그러나 그것은 내가 원하는 것이 아닙니다. 나는 전혀 생각하지 않은 패턴을 배우기 위해 각 범주의 패턴을 스스로 배우는 기술을 원합니다.
그래서 알고리즘 학습 데이터 (단어 범주 예제로 구성)를 제공하고 나중에 유사하거나 동일한 단어에서 범주를 예측하기 위해 각 범주에 대한 패턴을 배우기를 원합니다.
이를위한 최첨단 방법이 있습니까?
당신의 도움을 주셔서 감사합니다