파이썬 머신 러닝 / 데이터 과학 프로젝트 구조


10

Python Machine Learning 프로젝트를 구성하는 방법에 대한 정보를 찾고 있습니다. 파이썬의 일반적인 프로젝트에는 Cookiecutter 와 R ProjectTemplate이 있습니다.

이것은 현재 폴더 구조이지만 Jupyter Notebook을 실제 Python 코드와 혼합하고 있으며 명확하지 않습니다.

.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools

나는 scripts 폴더에서 작업하고 현재 my_module 아래의 파일에 모든 기능을 추가하지만 데이터로드 오류 (상대 / 절대 경로) 및 기타 문제가 발생합니다.

나는 이 주제에 관한 일부 우수 경쟁 솔루션 및 노트북 시작시 모든 기능이 응축 ​​된 노트북 외에 적절한 모범 사례 나 좋은 예를 찾을 수 없었습니다 .


이것이 도움 되는지 확인하십시오 (개인 경험 없음).
Emre

답변:


4

나는이 개발 분야에 모범 사례가 아직 없다고 생각하지만 쿠키 커터 외에도 SciPy 2016 컨퍼런스의 튜토리얼에 http://isaacslavitt.com/2016/07/20/ 데이터 과학은 소프트웨어 대화

개인적으로, 나는 그것들을 구별 할만한 좋은 방법이없고 그것들을 별도로 유지할 이유가 없다면 프로젝트에서 하위 폴더의 수를 최소화하려고 노력합니다. 나쁜 조직은 조직이없는 것만큼이나 나쁜 것입니다. 모범 사례는 유스 케이스에 따라 다를 수 있다고 생각합니다. 모든 프로젝트에 같은 양의 상용구가 필요한 것은 아닙니다.


3

워싱턴 대학교 (University of Washington)는 소규모 과학 파이썬 프로젝트 (데이터 과학 프로젝트 포함) 프로젝트 템플릿을 발표했습니다 shablona. 그게 당신이 찾고있는 것입니까?

https://github.com/uwescience/shablona

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.