일련의 입력이 주어지면이 시퀀스에 원하는 특정 속성이 있는지 확인해야합니다. 이 속성은 true 또는 false 만 가능합니다. 즉 시퀀스에 속할 수있는 클래스는 두 개뿐입니다.
시퀀스와 속성 간의 정확한 관계는 불분명하지만, 이것이 매우 일관되고 통계적 분류에 적합하다고 생각합니다. 분류기를 훈련시키는 사례가 많이 있지만,이 훈련 세트에서 시퀀스에 잘못된 클래스가 할당 될 가능성이 약간 있다는 점에서 약간 시끄 럽습니다.
훈련 데이터 예 :
Sequence 1: (7 5 21 3 3) -> true
Sequence 2: (21 7 5 1) -> true
Sequence 3: (12 21 7 5 11 1) -> false
Sequence 4: (21 5 7 1) -> false
...
거친 조건에서, 속성은 순서 값들의 세트에 의해 결정된다 (예를 들어 속성이 거의 확실하게 허위 것이라는 "11"수단의 존재)뿐만 아니라, 순서 값 (예 : "21 7 5 "속성이 true 일 가능성을 크게 증가시킵니다.)
훈련 후, 분류 자에게 이전에 볼 수 없었던 시퀀스 (예 :)를 제공 할 수 있어야 (1 21 7 5 3)
하고 속성이 참이라는 확신을 출력해야합니다. 이러한 종류의 입력 / 출력으로 분류기를 훈련시키는 잘 알려진 알고리즘이 있습니까?
나는 순진한 베이지안 분류기를 고려했습니다 (입력이 독립적이라는 가정을 심각하게 위반하지 않으면 서 순서가 중요하다는 사실에 실제로 적용 할 수는 없습니다). 또한 숨겨진 Markov 모델 접근 방식을 조사했는데, 입력 당 하나의 출력 대신 단일 출력 만 사용할 수 있기 때문에 적용 할 수없는 것으로 보입니다. 내가 놓친 게 무엇입니까?