시장에서 구매자와 판매자 사이의 "일치"를 관찰한다고 가정하십시오. 또한 미래의 경기를 예측하고 시장의 양쪽에 대한 추천을하는 데 사용하려는 구매자와 판매자 모두의 특성을 관찰하게됩니다.
간단히하기 위해, N 명의 구매자와 N 개의 판매자가 있고 각각이 일치하는 것을 찾는다고 가정하십시오. N 개의 일치 항목과 (N-1) (N-1)의 일치하지 않는 항목이 있습니다. 모든 것을 포함한 훈련 데이터 세트에는 N + (N-1) * (N-1) 관측치가 있으며 엄청나게 클 수 있습니다. (N-1) (N-1) 비 일치에서 무작위로 샘플링하고 감소 된 데이터에 대한 알고리즘을 교육하는 것이 더 효율적일 수 있습니다. 내 질문은 :
(1) 훈련 데이터 세트를 구축하기 위해 비 일치 항목에서 샘플링하여이 문제를 처리 할 수있는 합리적인 방법입니까?
(2) 만약 (1)이 참이라면, (N-1) (N-1)의 덩어리가 얼마나 큰지를 결정하는 엄격한 방법이 있습니까?