지오 코딩 / 가젯 웹 서비스를 만드시겠습니까?


14

Java의 계보를위한 지오 코딩 웹 서비스를 작성하고 싶습니다. 계보를위한 것이기 때문에 거리 수준으로 내려갈 필요가 없습니다. 카운티로 내려 가면됩니다.

계보 데이터를 보면 철자가 틀린 이름이 매우 일반적입니다. 사람들은 또한 많은 비표준 약어를 사용합니다. 예를 들어 볼티모어 카운티의 경우 다음과 같습니다.

  1. 볼티모어
  2. 볼티모어 카운티
  3. 볼티모어 공동
  4. 볼티모어시

답변:


10

이름에 관심이 있기 때문에이 질문이 명시 적으로 지리적이라고 생각하지 않으므로 Stack Overflow 에서 질문 할 수 있습니다 . 상태와 수정 된 카운티 이름이라는 두 가지 정보로 질문에 답변 할 수 있습니다. 수정을 수행하려면 퍼지 데이터를 수정 된 값과 일치시키기 위해 Levenshtein 거리 ( 예 및 Java 구현 )를 사용하려고 합니다.


+1 아마 그렇습니다. Levenshtein은 시작하기에 좋은 장소처럼 보이며 Postgres가 지원하는 것처럼 보입니다. 감사.
Jay Askren

Levenshtein 거리를 Geonames ( geonames.org ) 의 데이터와 결합하면 효과가 있다고 생각 합니다. 감사.
Jay Askren

5

지오 코딩 서비스에는 지리적 지오메트리 데이터, 관련 가제트 (이름 지정 및 이름 대체를 처리하기 위해) 및 사용자 인터페이스 (검색을 중재하기 위해)가 필요합니다. 역 지오 코더의 경우 토폴로지 유효성 검사기를 추가해야합니다. Java의 경우 오픈 소스 JTS 토폴로지 스위트가 자연스럽게 선택됩니다. http://www.vividsolutions.com/jts/jtshome.htm

미국의 카운티 지오메트리는 인구 조사에서 찾을 수 있습니다 : http://www.census.gov/geo/www/cob/co2000.html

공무원을 시작하기 위해 미국 지명위원회는 다음과 같은 데이터베이스를 가지고 있습니다 : http://geonames.usgs.gov/

대략적인 검색 일치를 허용하는 견고한 가제트 데이터베이스 및 직조 알고리즘을 만드는 것은 어려운 부분입니다.


알고리즘은 내가 찾고있는 것입니다.
Jay Askren

시맨틱 유사성 알고리즘에 대한 문의는 기본 스택 오버 플로우 사이트에서 더 많은 응답자를 가질 수 있습니다.
glennon


1

서비스 약관을 준수 할 수 있다면 Google은 지오 코딩을위한 멋진 API를 보유하고 있습니다. 기본 데모는 여기에서 찾을 수 있습니다 .

서비스를 사용하는 데는 몇 가지 제한이 있지만 결과는 직관적이고 빠르며 정확하며 대부분의 사용자에게 친숙합니다. 서비스의 계보 부분을 개발하는 데 집중할 수 있습니다.


나는 집안의 모든 것을 호스트하고 외부 API에 의존하지 않고 싶습니다.
Jay Askren

오픈 소스 라이센스 지오 코딩 DB를 찾고 계십니까?
Adam Matan
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.