저는 IPinfo 의 창립자 이므로 이에 관한 세부 정보를 제공 할 수 있습니다! 자체 지리 위치 데이터베이스 (또는 IP to company 또는 IP to carrier와 같은 다른 데이터 세트)를 생성하기 위해 우리가 사용하는 단일 방법 또는 단일 데이터 소스는 없습니다. 몇 년 동안 다양한 데이터 세트, 데이터 처리 기술 및 교훈을 혼합 한 것입니다!
자주 언급되지 않은 일부 데이터 소스 및 기술은 다음과 같습니다.
ISP로부터 직접 피드. Google 서비스는 하루에 약 5 억 건의 API 요청을 처리하며 많은 유명 웹 사이트에서 사용되었습니다. 따라서 ISP는 정확한 최신 지리 위치 데이터를 제공하여 고객이 웹에서 훌륭한 경험을 얻을 수 있도록 인센티브를 제공합니다. 우리는 점점 더 많은 ISP와 직접 협력하고 있습니다.
GPS 위치 데이터. 휴대 기기에서 GPS로 정확한 위치 정보를 수집 할 수 있습니다. IP 주소 및 일부 네트워크 토폴로지 유추와 쌍을 이루어 몇 번의 측정만으로 IP 범위의 위치를 계산할 수 있습니다.
사용자가 수정 사항을 제출했습니다. 위치가 잘못되면 (또는 변경 후 업데이트되지 않은 경우) 사용자로부터 신속하게 피드백을 받고 위치를 수동으로 수정하거나 알고리즘을 조정하여 다음 번 실행시 위치를 올바르게 지정할 수 있습니다. 데이터 처리 파이프 라인
IP 대 회사 데이터 세트의 경우 실제로 매월 모든 단일 도메인 이름을 긁어 내고 IP 소유권 정보, rwhois 레코드 등으로 추출한 데이터를 상호 참조합니다. 그런 다음 도메인 스크래핑 데이터를 사용하여 어떤 도메인이 어떤 IP 주소 및 IP 유형 분류기에서 다른 많은 데이터 소스와 함께 호스팅되는지 표시하여 IP 주소가 주로 주거용 ISP로 사용될 확률을 결정합니다. 비즈니스 또는 호스팅 제공 업체. 또한 해당 페이지의 링크 구조를 분석하고이 데이터 중 일부를 host.io 에 표시 합니다.