머신 러닝 모델을 저장, 저장 및 공유하는 모범 사례는 무엇입니까?
파이썬에서는 일반적으로 pickle 또는 joblib을 사용하여 모델의 이진 표현을 저장합니다. 필자의 경우 모델은 ~ 100Mo 크기 일 수 있습니다. 또한 joblib은 설정하지 않는 한 하나의 모델을 여러 파일에 저장할 수 있습니다 compress=1
( /programming/33497314/sklearn-dumping-model-using-joblib-dumps-multiple-files-which-one-is-the- corre ).
그러나 모델에 대한 액세스 권한을 제어하고 다른 시스템의 모델을 사용하려면 모델을 저장하는 가장 좋은 방법은 무엇입니까?
몇 가지 선택이 있습니다.
- 파일로 저장 한 다음 Git LFS를 사용하여 저장소에 저장하십시오.
- SQL 데이터베이스에 이진 파일로 저장하십시오.
- 예를 들어 Postgresql https://wiki.postgresql.org/wiki/BinaryFilesInDB
- SQL Server 팀이 권장하는 방법이기도합니다.
- https://docs.microsoft.com/en-us/sql/advanced-analytics/tutorials/walkthrough-build-and-save-the-model
- https://microsoft.github.io/sql-ml-tutorials/python/rentalprediction/step/3.html
- https://blogs.technet.microsoft.com/dataplatforminsider/2016/10/17/sql-server-as-a-machine-learning-model-management-system
- HDFS