이름 : 먼저, 중간, 성.
공개적으로 사용 가능한 데이터 세트를 사용하여 이름에서 채굴 할 수있는 정보의 양이 궁금합니다. 나는 미국 인구 조사 데이터를 사용하여 (입력에 따라) 낮은 확률 사이에서 다음과 같은 것을 얻을 수 있음을 알고 있습니다 : 1) 성별. 2) 레이스.
예를 들어, Facebook은 사이트 사용자의 인종 분포 (https://www.facebook.com/note.php?note_id=205925658858)를 적절한 수준의 정확도로 정확하게 알아내는 데 사용했습니다.
다른 무엇을 채굴 할 수 있습니까? 나는 구체적인 것을 찾고 있지 않습니다. 이것은 내 호기심을 일으키는 매우 개방적인 질문입니다.
저의 예는 미국 고유의 이름이므로 미국에있는 사람의 이름이라고 가정하겠습니다. 그러나 누군가 다른 국가에서 공개적으로 사용 가능한 데이터 세트를 알고 있다면 그들도 개방적입니다.
이것이 이것이 올바른 장소인지 확실하지 않습니다. 그렇지 않다면 누군가가 나를 더 적절한 장소로 안내 할 수 있다면 고맙겠습니다.
나는 이것이 흥미로운 질문이기를 바란다. 그리고 이것은 적절한 장소 다!