GIS 프로젝트를 조직 하시겠습니까? [닫은]


27

나는 프로젝트 파일을 체계적으로 유지하는 데 오랜 시간 동안 어려움을 겪고 있습니다.

데이터 세트, 이미지, 셰이프 파일 등을 체계적으로 유지하기위한 팁은 무엇입니까?


2
이 [질문] [1]에 대한 답변도 참조하십시오. [1] : gis.stackexchange.com/questions/2976/…
jonatr

답변:


36

참고 :이 rant는 내가 갈 때 업데이트됩니다

나는 컴퓨터 나 ArcGIS pro는 아니지만 여기에 내가하는 일이있다.

기본 파일 / DBS

  • 이들은 본질적으로 "원시"파일이며 모든 분석의 기초가됩니다
  • 이러한 파일, 데이터베이스 및 데이터는 내 폴더 외부 에서 projects호스팅되며 인터넷 서버, 로컬 컴퓨터 및 보관 용 컴퓨터에서 호스팅됩니다. 나는 항상 그들에게 접근 할 수 있으며, 그들은 매우 조직되고, 분리되고, 집계됩니다. 이를 구성하는 데 많은 시간을 할애합니다.
  • Arc 또는 PostGIS에 관계없이 데이터베이스에 모두 넣었습니다.
  • 각 테이블에 테이블 자체 또는 메타 데이터에 3 개의 필드 (DATE_OBTAINED, DATA_DATE, SOURCE_NOTES)를 추가합니다.
  • 또한 기본 파일은 여러 개의 다른 테이블에 대한 쿼리 일 수 있습니다. 예를 들어, 테이블은 내가 얻은 모든 트래픽 수를 하나의 큰 쿼리 / 테이블로 집계 할 수 있습니다.
  • 또한 인터넷을 검색하는 다른 모든 데이터도 여기에 넣었습니다.
  • 기본 파일의 파일에 대한 직접적인 분석은 절대하지 않습니다.

프로젝트 파일

  • 모든 프로젝트 파일은 my_projects폴더에 들어갑니다 . 여기에는 해당 프로젝트와 관련된 모든 것이 포함되어 있습니다. 폴더를 다른 곳에 복사하여 붙여 넣으면 모든 것이 포함됩니다.
  • 일반적으로 나는 다음과 같은 구조를 가지고 있습니다 :
    • my_project /
      • 관리자/
      • 통신/
      • raw_data /
      • analyzed_data /
      • output_data /
      • from_client /
      • 결정적인/
      • 암호/
      • some_document_date_time.doc
      • 읽어보기
  • 천천히 로컬 GIT로 옮겼습니다. (로컬 또는 자체 서버에서 호스팅 할 수도 있습니다). GitHub에 넣지 않은 이유는 github에 GIS 분석에 쓸모없는 1.2GB 제한이 있기 때문입니다.
  • 프로젝트의 경우 일반적으로 분석에 필요한 모든 GIS 테이블을 새 데이터베이스 (project_whatever)로 복제합니다.
  • 10 명 중 9 번, 나는 SHP 파일에서만 일을하고 나는 내 모든 GIS (이미지, 엑셀, 좌표 등)를 저장 projects/my_project/raw_data, projects/my_projects/analyzed_dataprojects/my_projects/output_data.
  • 프로젝트가 완료되면 최종 제출 사본을 넣습니다. my_projects/FINAL/date_submitted
  • MXD의 경우 일반적으로 my_proj_dec_22_11__13_20.mxd예를 들어 2 ~ 3 시간마다 새 MXD에 저장합니다.
  • Ms Word 문서, 일러스트레이션 및 대부분 편집중인 문서의 경우 RFP_TENDER_Dec_22_11__11_15.docand와 같은 my_projects 폴더로 이동합니다 draft_ver5_Dec_31_11__12_30.doc. 다시 모든 최종 결과물이 FINAL 폴더에 들어갑니다.
  • R, Python 코드 및 일부 C #의 경우 프로젝트 외부에서 호스팅하지만 my_projects/code폴더에 복사 작업을 수행하면 약간 까다로워 집니다. 대부분의 파이썬 코드가 재사용 가능 하므로이 작업을 수행합니다. 프로젝트 외에 모든 파이썬 코드를 넣으면 잊어 버릴 것입니다. 또한 모든 파이썬 코드는 github에서 진행됩니다.
  • 프로젝트 파일에는 시간 추적, 통신 (모든 전자 메일을 .msg 파일로 저장)을 포함한 모든 파일 형식이 포함되며 모든 구두 통신을 단어 파일에 기록하고 모든 파일을 my_project / communication
  • ArcGIS에서는 모델, LYR 및 "선택을 새 shp 레이어로 저장"을 사용합니다. 이러한 도구를 사용하면 파일을 더 작은 형식으로 저장하고 파일을 재사용 할 수 있으며 모델과 함께 다른 장소에서 무언가를 사용할 수 있습니다.

최종 출력

  • 완성 된 각 프로젝트는 압축되어 외부 하드 드라이브에 장착됩니다.
  • 모든 최종 제품은 테이블의 파일로 변환되고 다른 모든 형식의 PDF로 변환됩니다.
  • 내가하는 모든 프로젝트는 하드 카피 백업을 위해 인쇄됩니다.

결론

  • 각 사람은 여러 개의 서로 다른 소프트웨어 및 도구를 사용합니다. 내가 아는 많은 사람들은 basecamp , Harvest 또는 기타 여러 도구를 사용하여 구성됩니다 . 또한 사람들은 다른 작업 습관과 강박 장애 경향이 있습니다. 나는 물건을 다른 것들보다 조금 더 정리하는 것에 상당히 집착하고 있습니다. 따라서 스트레스를 최소화하고 시스템을 적용하고 업데이트 할 때 일관성을 유지 하는 시스템을 개발하십시오.
  • 모든 것을 백업하고 복제
  • 원시 / 기본 데이터에서 직접 작업하지 마십시오
  • 프로젝트의 경우 시간이 지남에 따라 데이터가 변경되므로 항상 복제본 파일을 사용하고을 찾기 위해 스크램블하고 싶지는 않습니다 base_layer_2006.shp.
  • 폴더 각 my_projects 합니다 당신은 당신이 도로의 아래 프로젝트 2 년 방문 할 때 나중에 잊을 알고있는 몇 가지 기본 정보를 제공하는 프로젝트를하고있는 동안 당신이 그것을 편집하는 README 텍스트 파일이

아주 좋아요 모든 데이터 세트 (원시, 분석) 및 이것이 차지하는 공간의 복제본 생성에 관심이있는 것은 아닙니다.
dchaboya

2
@dchaboya 디스크 공간 비용은 내가 절약하는 스트레스 수준과 비교할 때 상대적으로 낮습니다. 또한 나는 아무것도 삭제하는 것을 믿지 않습니다 .
dassouki

왜 github 제한이 중요한지 궁금합니다. 코드가 아닌 모든 것에 git을 사용하고 있습니까? 나는 동일한 목적으로 버전 관리를 사용하기 시작하고 좋은 사례를 배우려고 노력하고 있습니다.
djq

@ dassouki, git을 사용할 때 왜 mxd 파일의 새 버전을 작성합니까? 이 mxd 파일을 버전 관리 할 수도 있습니다.
Paul Hiemstra

@PaulHiemstra 대부분 여러 버전을 동시에 쉽게 열 수 있기 때문입니다.
dassouki

8

Desktop GIS 소프트웨어로만 작업한다고 언급하지 않았으므로 프로그래밍 지향 사고 방식에서 얻은 경험을 공유하겠습니다. @dassouki가 말한 것에 동의한다는 말부터 시작하겠습니다. 가장 중요한 것은 당신이 조직하는 방법이 아니라 당신이하는 것이라고 생각합니다.

그러나 내 워크 플로로 넘어갑니다. 프로그래밍 언어 (내 경우 R)를 사용하는 것에 대해 내가 좋아하는 것은 내가 수행하는 모든 단계를 문서화하는 스크립트입니다. 이것은 사용자가 원시 입력 데이터에서 mxd 파일에서 볼 수있는 것으로 어떻게 이동했는지 알기가 더 어려운 ArcGIS를 사용하는 것과 대조적입니다. 물론 GUI에서 취한 모든 단계를 기록 할 수 있지만 프로그래밍 언어는 수행 한 정확한 워크 플로를 저장하는 데 훨씬 더 적합하다고 생각합니다. 이는 고객 / 관리자가 어떤 방식으로 작업했는지 또는 특정 제품을 생산하기 위해 정확히 무엇을했는지 물을 때 특히 중요 할 수 있습니다.

실제로 드라이브에 중요한 몇 개의 폴더가 있습니다 (내가 과학자라는 점에 유의하십시오).

  • 실험, 여기에 내가 수행 한 모든 실험, 예를 들어 특정 데이터 본문에 대한 특정 분석 시도를 저장합니다. 각 실험에는 자체 디렉토리가 있습니다. 또한 결과 테이블 등을 여기에 저장합니다. 모든 R 스크립트는이 디렉토리에 있습니다.
  • 데이터 세트, 모든 원시 데이터 세트는
  • 도구, 다른 프로젝트에서 재사용하기 위해 일반화 한 코드를 저장하는 별도의 디렉토리가 있습니다.
  • 문서, 저의 작업은 과학 논문 작성에 중점을 둡니다. 각 용지마다 라텍스 파일을 저장하는 별도의 디렉토리가 있습니다. 이 파일은 실험 디렉토리에서 그림과 표를 읽습니다. 종이는 여러 그림을 포함 할 수 있습니다.
  • 소프트웨어는 별도의 디렉토리에 저장합니다. 주로 소프트웨어를 작성한 R 패키지와 모델을 실행하기 위해 컴파일하는 포트란 코드가 있습니다.

내가 사용하는 몇 가지 주요 아이디어 :

  • 정적 양식 동적 항목 분리 (예 : 단기 프로젝트 저장 위치와 다른 곳에 일반화 된 스크립트 저장) 또는 원시 데이터와 분석 데이터를 분리하십시오.
  • 가능한 한 버전 관리 소프트웨어를 사용하십시오. 나는 수은과 자식을 좋아한다.
  • 백업 자동화 !!!! 수동으로 할 때 생각하지 않으면 하드 드라이브가 충돌합니다. 리눅스에서는 이런 종류의 자동화가 쉽습니다. 이것이 Windows / Mac에서 어떻게 작동하는지 잘 모르겠습니다.

일반적으로 하나의 스크립트에서 원시 데이터에서 결과 그림 / 테이블로 이동할 수 있기 때문에 프로그래밍 언어를 사용하는 것이 좋습니다. R은 GIS 데이터를 쉽게 읽고 쓸 수 있고 GIS와 통계 모두에 대한 수많은 분석을 제공하기 때문에 상당히 좋은 후보입니다.


1
백업 자동화에 대한 +1 그래서 폴더를 드롭 박스에
Simlink

3
보관 용 계정에 필요한 저장 공간이 있습니까? 귀중한 작업을 외부 회사의 손에 맡기는 것에 대해 어떻게 생각하십니까?
Paul Hiemstra

3

위의 답변에 2 가지를 추가하고 싶습니다.

  1. 가져 오기 원시 데이터 디렉토리에 폴더를 갖고 싶습니다. 데이터 세트를 수신 할 때마다 폴더가 있습니다 (예 : from_clientname-2011dec23). 이렇게하면 프로젝트에 사용 된 각 데이터를 받았을 때 추적 할 수 있습니다.

  2. 나는 또한 이동 중에 프로젝트 문서를 접는 것을 좋아합니다. 그런 다음 여기에서 단어 문서 또는 간단한 TXT 파일을 만들어 프로젝트, 날짜 및 요청한 사람을 적어 둘 수 있습니다. 내가 돌아가서 스스로를 막을 수있는 방법은 내가 왜 무언가를했는지에 대한 질문입니다. 작은 요청에는 지루한 것처럼 들리지만 결국에는 비용을 절약 할 수 있습니다.


1
이것은 확실히 Project Management 101 자료입니다. 프로젝트에 소비하는 시간의 상당 부분이 모든 것을 체계적으로 정리하고 문서화하는 데 전념 할 수 있지만 결국에는 시간을 절약 할 수있을뿐 아니라 기대 수명을 단축 할 수 있습니다.
dchaboya
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.