나는 하위 집합의 특성을 알지 못한 채 집단의 하위 집단을 식별하고 분리하기 위해 데이터 세트를 분석하고 파싱하는 새로운 방법을 연구하고있다. 이 방법은 인공 데이터 샘플 (예 : 모집단의 하위 집합을 식별하고 분리하기 위해 특별히 작성된 데이터 세트)에서 충분히 잘 작동하지만 실제 데이터로 테스트하려고합니다.
내가 찾고있는 것은 무료로 사용할 수있는 (즉, 기밀이 아닌 비 독점적) 데이터 소스입니다. 바람직하게는 바이 모달 (bimodal) 또는 멀티 모달 (multimodal) 분포를 포함하거나 전통적인 수단을 통해 쉽게 분리 될 수없는 다수의 부분 집합으로 구성되는 것이 바람직하다. 그러한 정보를 어디서 찾을 수 있습니까?