쉐이프 파일의 문자셋을 어떻게 결정합니까?


답변:


9

시행 착오. 모든 것을 올바르게 얻을 때까지 다른 설정을 사용하여 Ms Excel 또는 OpenOffice로 .dbf 파일을 열어보십시오.

더 많은 단서에 대해서는이 게시물을보십시오 : https : //.com/questions/319095/how-do-i-determine-the-character-set-of-a-string


인코딩에 대해 알려진 것이 없으면 latin1 또는 UTF-8을 먼저 시도해 보는 것이 좋습니다.
krlmlr

MS Excel에서 .dbf를 열었고 문자가 정상적으로 나타납니다. Excel에서 어떤 인코딩을 사용 / 감지하고 있는지 어떻게 알 수 있습니까? QGIS에서 설정할 수 있도록 ...
user3386170

12

프로그램이 쉐이프 파일의 문자 세트를 결정하는 두 가지 방법이 있습니다.


+1 dBase 파일 형식 페이지로 연결되는 링크가 훌륭합니다. 그러나 AFAIK 코드 페이지는 dBase III 형식에 포함되지 않았습니다. 이 형식의 FoxPro 확장에 대한 참조는 모든 .dbf 파일에 코드 페이지 정보가 포함되어 있지 않다는 것을 나타냅니다 (그렇지 않으면 헤더의 빈 영역에 가비지 바이트가 나타날 수 있음) ). 그러나이 정보를 찾아 낼 수 있다면 여전히 시행 착오 검색을 시작하는 것이 좋습니다. BTW, 우리 사이트에 오신 것을 환영합니다!
whuber

일부 Python dbf 라이브러리는 정보가있는 경우 코드 페이지를 읽을 수 있습니다.
Paulo Scardine

5

file유틸리티는 텍스트 파일의 인코딩을 추측 할 수 있습니다. 파일 이없는 경우ogr2ogr 원래 인코딩을 유지하는 변환에 사용하십시오 ..cpg

ogr2ogr -f CSV file.csv file.dbf
file file.csv

출력 예 :

file.csv: ISO-8859 text

가장 빈번한 인코딩 중 UTF-8과 latin1로 테스트했습니다. OS X에 대해 잘 모르는 Ubuntu에서 기본적으로 작동합니다 file. Windows 의 유틸리티에 대해 잘 모르겠습니다 .

참고 : .cpg인코딩을 나타내는 해당 파일이 있으면이를 ogr2ogr인식하고 출력은 UTF-8로 표시됩니다. 그러나 CSV 출력이 올 바르면 .cpg파일 의 정보 가 정확하다는 것을 알고 있습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.