WHOIS 정보 외에 GeoIP 서비스에서 사용하는 방법은 무엇입니까? [닫은]


11

GeoIP 서비스가 IP 주소 WHOIS 정보를 확인하는 것 외에도 IP 지리적 위치에 대한 데이터를 수집하는 방법이 궁금합니다. 예를 들어 IP 74.207.244.221이 캘리포니아 프리몬트에 위치하고 있음을 나타내는이 웹 사이트를 우연히 발견했습니다. https://ipinfo.io/74.207.244.221

그러나이 IP whois 정보 에서이 정보를 찾을 수 없습니다. ipinfo.io는 다음과 같이 말합니다.

원래 API는 MaxMind 데이터를 사용했지만 자체 위치 정보 데이터를 만드는 데 매우 바빴습니다. 우리는 많은 진전을 이루 었으며 이제는 자체 데이터를 사용하여 모든 요청의 약 절반을 처리합니다. 우리는 여전히 MaxMind 데이터로 대체합니다.

ipinfo.io 및 MaxMind와 같은 서비스가 GeoIP 데이터를 수집하는 방법은 무엇입니까?

답변:


11

이러한 서비스는 일반적으로 IP 주소를 지리적 위치를 지정하는 3 가지 방법을 사용합니다.

  1. whois 데이터베이스를 통해 주소를 검색합니다.
  2. 도메인 이름 레코드를 기반으로 단서를 찾으려고 역방향 DNS 쿼리를 추적하거나 대상으로 전송 된 패킷 경로를 추적하여 단서를 제공 할 수도 있습니다 (예 : traceroute 사용).
  3. 마지막으로 RTT 삼각 분할을 사용합니다.

라운드 트립 시간 (RTT) 삼각 측량 은 세 가지 다른 위치에서 핑 대기 시간을 측정하여 IP 주소의 대략적인 지리적 위치를 얻는 데 사용되는 방법입니다.

예를 들어 3 개의 서버가 삼각형 모양으로 전 세계에 퍼져 있고 3 개의 서버에서 모두 IP 주소를 핑하고 대기 시간에 대해 동일한 결과를 얻는 경우 IP 주소가 올바른 위치에 있음을 의미합니다. 그 삼각형의 중심. 삼각 측량이 작동하는 방식이지만이 경우 ICMP 핑과 함께 사용됩니다.

읽을 수있는 리소스 :
Ping이란 무엇입니까? RTT 삼각 측량에 대한 @ Wikipedia
SIGCOMM 논문


5
와우, 나는 RTT에 기초한 삼각 측량이 있다고 생각하지 않을 것입니다. 흥미 롭군 따라서 일부 서버가 지리적 위치를 피하고 싶다면 ICMP 응답에 임의 지연이 발생할 수 있습니다.
학습자

iplocation.net에서 다음과 같이 tracert / traceroute를 보는 것이 도움이 될 수 있다고 덧붙이고 싶습니다. " 'traceroute'명령을 사용하여 IP 주소의 위치에 대한 단서를 찾을 수 있습니다. 라우터 이름 호스트에서 대상 호스트로의 패킷 흐름은 최종 위치의 지리적 경로를 암시 할 수 있습니다. "
학습자

1
그러나 @Learner는 훌륭한 추가 기능이지만 이미 "역방향 DNS 쿼리 추적"형식으로 제 답변에 있습니다. traceroute는 실제로 그렇게하지는 않지만 쿼리가 이동하는 모든 도메인 / 주소를 보여줍니다. 그럼에도 불구하고 나는 그것을 더 명확하게하기 위해 메모를 추가 할 것이다 :)
Fanatique

5

저는 IPinfo 의 창립자 이므로 이에 관한 세부 정보를 제공 할 수 있습니다! 자체 지리 위치 데이터베이스 (또는 IP to company 또는 IP to carrier와 같은 다른 데이터 세트)를 생성하기 위해 우리가 사용하는 단일 방법 또는 단일 데이터 소스는 없습니다. 몇 년 동안 다양한 데이터 세트, 데이터 처리 기술 및 교훈을 혼합 한 것입니다!

자주 언급되지 않은 일부 데이터 소스 및 기술은 다음과 같습니다.

  • ISP로부터 직접 피드. Google 서비스는 하루에 약 5 억 건의 API 요청을 처리하며 많은 유명 웹 사이트에서 사용되었습니다. 따라서 ISP는 정확한 최신 지리 위치 데이터를 제공하여 고객이 웹에서 훌륭한 경험을 얻을 수 있도록 인센티브를 제공합니다. 우리는 점점 더 많은 ISP와 직접 협력하고 있습니다.

  • GPS 위치 데이터. 휴대 기기에서 GPS로 정확한 위치 정보를 수집 할 수 있습니다. IP 주소 및 일부 네트워크 토폴로지 유추와 쌍을 이루어 몇 번의 측정만으로 IP 범위의 위치를 ​​계산할 수 있습니다.

  • 사용자가 수정 사항을 제출했습니다. 위치가 잘못되면 (또는 변경 후 업데이트되지 않은 경우) 사용자로부터 신속하게 피드백을 받고 위치를 수동으로 수정하거나 알고리즘을 조정하여 다음 번 실행시 위치를 올바르게 지정할 수 있습니다. 데이터 처리 파이프 라인

IP 대 회사 데이터 세트의 경우 실제로 매월 모든 단일 도메인 이름을 긁어 내고 IP 소유권 정보, rwhois 레코드 등으로 추출한 데이터를 상호 참조합니다. 그런 다음 도메인 스크래핑 데이터를 사용하여 어떤 도메인이 어떤 IP 주소 및 IP 유형 분류기에서 다른 많은 데이터 소스와 함께 호스팅되는지 표시하여 IP 주소가 주로 주거용 ISP로 사용될 확률을 결정합니다. 비즈니스 또는 호스팅 제공 업체. 또한 해당 페이지의 링크 구조를 분석하고이 데이터 중 일부를 host.io표시 합니다.


감사! 나는이 웹 사이트의 설립자가 내 질문에 대답 할 것이라고 기대하지 않았습니다 :) 그것은 매우 흥미 롭습니다.
학습자
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.