숫자 벡터를 입력으로 사용하고 클래스 레이블을 출력으로 제공하는 분류기를 배우고 싶다고 가정 해보십시오. 내 훈련 데이터는 많은 수의 입력-출력 쌍으로 구성됩니다.
그러나 일부 새 데이터를 테스트 할 때이 데이터는 일반적으로 부분적으로 만 완료됩니다. 예를 들어 입력 벡터의 길이가 100 인 경우 요소 중 30 개에만 값이 제공되고 나머지는 "알 수 없음"입니다.
예를 들어, 이미지의 일부가 막힌 것으로 알려진 이미지 인식을 고려하십시오. 또는 데이터의 일부가 손상되었다고 알려진 일반적인 의미의 분류를 고려하십시오. 모든 경우에, 나는 데이터 벡터의 어떤 요소가 알려지지 않은 부분인지 정확히 알고 있습니다.
이런 종류의 데이터에 적합한 분류기를 배우는 방법이 궁금합니다. "알 수없는"요소를 임의의 숫자로 설정할 수는 있지만 알려진 요소보다 더 많은 알 수없는 요소가있는 경우 좋은 해결책처럼 들리지 않습니다. 또는 교육 데이터의 요소를 "알 수 없음"으로 임의로 변경하고 전체 데이터가 아닌 이들을 사용하여 학습 할 수 있지만 알려진 및 알려지지 않은 요소의 모든 조합에 대한 철저한 샘플링이 필요할 수 있습니다.
특히 신경망에 대해 생각하고 있지만 다른 분류 자에게 열려 있습니다.
어떤 아이디어? 감사!