지오 코드 품질 : Nominatim vs. PostGIS Geocoder vs. Geocoder :: US 2.0


14

때때로 >> 500,000 미국 거리 주소 (특징 또는 교차로 없음)를 지오 코딩해야합니다. 이러한 대량 지오 코드를 처리하기 위해 지오 코딩 서비스를 로컬로 설정하고 싶습니다.

과거 에는 Tiger 기반 Geocoder :: US 2.0을 로컬에서 사용했습니다. 초기 벤치마킹은 특히 루비 파서를 사용하지 않고 주소 요소를 지오 코더에 명시 적으로 전달할 때 Google 지오 코딩 된 주소에 대해 합리적인 정확도를 제공합니다.

PostGIS Geocoder 에 대해서도 많이 읽었습니다 . 내 데이터가 이미 PostGIS에 있으므로 매력적으로 들리지만 시험해보기 위해 로컬로 설정하지 않았습니다.

또한 누군가 로컬에서 Nominatim을 사용해 볼 것을 권장했습니다 . 타이거 기반이 아니라는 것을 제외하고는 그것에 대해 많이 알지 못합니다 (내가 말할 수있는 한), 더 신뢰할만한 결과를 얻을 수 있을지 궁금합니다.

위의 솔루션에 대한 경험이있는 사람에게 내 질문 : 세 가지의 정확성은 어떻게 비교됩니까? 특히 미국 주소에 대해 가장 일관되고 안정적인 지오 코드를 제공하는 것은 무엇입니까? 나는 속도에 지나치게 관심이 없거나 복잡성을 설정하지 않습니다.

답변:


14

Nominatim 및 Geocoder 미국 지오 코더를 테스트 할 기회가 없었습니다. 그래도 Geocoder와 Nominatim을 데이터베이스에서 직접 실행할 수 없다는 것이 이해됩니다. 데이터베이스에서 트리거 또는 일괄 업데이트와 같은 용도로 사용하기가 어렵 기 때문에 큰 단점입니다.

plpgsql 함수의 순수한 PostGIS / postgresql 세트 인 PostGIS 지오 코더는 데이터베이스에서 완전히 실행됩니다. Geocoder US와 PostGIS 지오 코더 결과는 필적이며 웹을 사용하여 테스트 한 결과와 같습니다. Google은 장소 이름을 활용하기 때문에 조금 더 좋습니다.

OSM 데이터를 사용하기 때문에 Nominatum은 호랑이 데이터를 간접적으로 사용한다고 생각합니다. OSM은 미국의 OSM 가져 오기가 사용자 기여 수정과 함께 TIGER에서 가져 오기 때문에 간접적으로 사용합니다. Tiger OSM의 빈티지 (년)가 현재 어떤 것인지 잘 모르겠습니다. 웹 인터페이스를 온라인에서 플레이 할 때 장소 이름도 활용하며 지오 코딩의 줌 레벨을 지정하여 필요한 줌 정밀도를 설정하여 지오 코딩을 더 빠르게 할 수 있다는 점에서 흥미로운 왜곡이 있습니다.

전체 공개-PostGIS Geocoder에 대해 많은 작업을 수행했으며 온라인 설명서를 작성했습니다. 내가 작업하고있는 버그는 그것이 보간하는 지점의 위치가 거리의 잘못된쪽에 있다고 생각한다는 것입니다. 나는 그것을 고치기 위해 노력하고 있습니다. 거리의 어느쪽에 대해 신경 쓰지 않는다면 (또는 적어도 때때로), 그것은 당신에게 문제가되지 않을 수 있습니다.

일부 주소 결과를 비교하는 온라인 버전으로 테스트하는 동안 아마도 가치가 있습니다. 예를 들어 nominatim 여기서 테스트 할 수 있습니다 : http://open.mapquestapi.com/nominatim/v1/search.php

유스 케이스의 경우 nominatum의 퍼지 검사가 PostGIS Geocoder의 성능만큼 좋지 않다는 것을 알았습니다. 예를 들어, 허영 주소 (우편 주소)는 1 MA 보스턴 데 번셔 플레이스입니다. PostGIS는 내가 기억하는 것에 가까운 답변을 반환하지만 Google은 답변을 반환하지만 Nominatim이 답변을 반환 할 수는 없습니다. 공정하게도 보스턴 소포 기록은 이것이 어디에 있는지 단서가 없으며 소포 기록에 워싱턴 스트리트로 표시됩니다. PostGIS는 교차로 등 다양한 수준의 검사 및 교차로를 수행하기 때문에 찾을 수 있습니다. 의도적으로 우편 번호를 잘못 입력하거나 PostGIS가 정확한 옵션 세트로 돌아 오는 다른 경우를 테스트했습니다. 구글도 마찬가지입니다.


위한 추가적인 코멘트 : 일부 주소 결과를 비교 온라인 버전으로 테스트하는 동안 아마 가치 : 예 nominatim 여기 테스트 할 수 있습니다 open.mapquestapi.com/nominatim/v1/search.php
LR1234567

답변 주셔서 감사합니다! 다음 주 정도 동안 벤치마킹을 해보 겠지만 지금까지 PostGIS Tiger 코더에 깊은 인상을 받았습니다.
danpelota


TIGER 2013 데이터를 사용하는 tigergeocoder.com , Amazon EC2 클라우드에서 자체 서버 인스턴스를 실행할 수 있으며 하루에 1,000,000+의 지오 코딩이 가능합니다. 언급 한 PostGIS는 Zillow Neighborhoods도로드했으며 주소 부분에 대한 FIPS 코드를 반환합니다. REST API는 Google과 유사하지만 자체 서버이며 할당량이 필요하지 않습니다.
Biba

Nominatim은 2019 년 새로운 타이거 데이터로 빠르게 실행되며보다 정확한 경향이 있습니다. 영역을 추정하지 않으며 주소 추측이 더 좋습니다.
앤드류 스콧 에반스

-1

기술적으로 Tiger 및 OSM 데이터베이스를 하나의 거대한 서버에 쌓아서 Nominatum OSM 내에 구축 할 수 있습니다. Tiger는 쉽게 가져올 수 있으며 OSM 서버를 보완합니다.

누구든지, 당신이받을 데이터의 질은 옥상이되지 않을 것입니다. OSM은 미국의 주소에 대한 정확성이 부족합니다. 어떤 경우에는 원래 목표에서 90 마일 떨어진 곳에서 보았습니다.

Tiger 데이터베이스는 또한 거리 번호 위치를 예측하기 위해 할당 된 보간 알고리즘으로 인해 정확하지 않습니다. 일반적으로 실제 목표는 300 피트에서 몇 마일로 상쇄됩니다.

자체 지오 코더를 구축하는 것보다 상업적 지오 코더를 사용하는 경우 시간과 호스팅 리소스를 평가해야한다고 생각합니다. 상업용 하나를 사용하면 옥상 위치를 얻고 아무것도 걱정하지 않아도됩니다. 500k의 가격은 다른 공급 업체에서 $ 600 ~ $ 800 정도입니다.


2
귀하의 답변은 회사와 어떤 관련이 있습니까? 이 예에서는 불필요한 면책 조항으로 웹 사이트에 대한 링크가 포함 된 서명을 포함하고있는 것으로 보이므로 편집하고 있습니다. 어떤 경우에도 면책 조항에 링크를 포함시키지 마십시오.
PolyGeo
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.