지오 코딩 알고리즘에 대한 유용한 자료


19

지오 코딩 알고리즘에 대한 유용한 자료를 알고 있습니까?

특히 쿼리의 부분 일치 및 가중치 적용, 맞춤법 오류 및 변형 처리, 실제 데이터 저장소에 대한 세부 정보 (예 : 직접 관계형 데이터베이스 쿼리에 대한 스키마, 데이터 인덱싱에 대한 접근 방식) 등 주소 쿼리 구문 분석에 관심이 있습니다. .

ArcGIS 10 지오 코딩에 대한 몇 가지 문서를 연구했지만 실제 구현 세부 사항에 약간의 영향을 미칩니다. 다른 고품질 프로덕션 구현에 대한 자세한 문서도 도움이 될 수 있습니다. 더 기술적 인 것이 좋습니다. 이론적 인 알고리즘 논문도 훌륭합니다.

감사.

답변:


14

텍스트에서 지리 좌표로 : 지오 코딩의 현재 상태

Daniel W. Goldberg, John P. Wilson 및 Craig A. Knoblock 개요 :이 기사는 기존 문헌에 대한 학제 간 역사적 검토를 통해 지오 코딩 관행에서 최신 기술에 대한 설문 조사를 제공합니다. 지오 코딩의 진화하는 개념과 프로세스의 기본 구성 요소를 살펴 봅니다. 자주 발생하는 오류 및 불확실성의 원인과이를 측정하는 데 사용되는 기존 측정 방법에 대해 논의합니다. 지오 코딩 프로세스의 일반적인 함정과 지속적인 문제에 대한 조사가 제시되며이를 극복하는 전통적인 방법이 설명됩니다.

10.1.1.119.714.pdf

PDF (34 페이지 이상) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf



@thanks 10.1.1.119.714.pdf는 올바른 게시물 중 하나입니다. 다른 이름 지정 규칙이 더 좋을 것입니다.
Mapperz

6

Mapperz와 관련된 논문은 매우 훌륭하고 관심을 끌만 한 인용문이 많이 있지만 문자열 일치와 지오 코딩 프로세스의 중요성을 설명하는 데는 그다지 훌륭하지 않다고 생각합니다. 그들은 간단히 Soundex에 대해 언급 했지만 Soundex가 유일한 옵션은 아니며 IMO 주소를위한 최상의 옵션은 아닙니다. 그들은 주제와 관련된 꽤 많은 인용을 나열했기 때문에 그 논문이 관심을 가질 것입니다.

Stats 교환 사이트 의이 스레드 는 두 문자열 세트의 퍼지 일치에 대해 이야기하며 주소를 일치시킬 때 동일한 기술이 모두 적용됩니다. 특히 편집 거리를 사용하는 것이 Soundex보다 더 의미가 있다고 생각합니다 . 특히 Soundex 아날로그가없는 주소 세부 사항에서는 더욱 그렇습니다. 두 문자열 사이의 Levenshtein 거리를 계산하는 것이 그렇게 복잡하지는 않으며 인터넷에 떠있는 많은 예제입니다 ( 여기서는 Python 의 예제입니다 ).

지난 몇 시간 동안 ESRI가 철자 감도와 다양한 후보 및 경기 점수를 구현하는 방법을 찾으려고 노력했습니다. 나는 단지 간단한 설명을 찾지 못했습니다 (이 PDF 및 9.3의 온라인 도움말 섹션 에서 찾은 최고의 것 ). 누군가가 좀 더 자세한 문서를 알려 줄 수 있다면 OP뿐만 아니라 감사 할 것입니다.


3

사우스 캐롤라이나 대학교 (University of South Carolina)는 기술적 세부 사항을 발표 한 주소 처리지오 코딩 서비스를 제공합니다. 그들은 그들의 사이트에 많은 좋은 참조가 있습니다.



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.