공개적으로 사용 가능한 데이터에 대한 호스팅 옵션


12

따라서 재현 가능한 연구 아이디어를 지원하기로 결정하고 사람들이보고 사용할 수 있도록 온라인에서 데이터를 사용할 수있게하려고합니다. 문제는 어디에서 호스팅합니까?

내 첫 번째 성향은 물론 대학 서버에있는 개인 웹 공간이지만, 실제로는 그렇게 오래 지속되지는 않습니다. 떠나면 디렉토리가 사라지기 전에 매우 짧은 시간 동안 열려 있습니다. 향후 사람들이 사용하고 작업 할 수 있도록 데이터를 사용할 수있는 올바른 설정은 아닙니다.

GitHub 또는 SourceForge와 같은 것을 사용합니까? 아니면 다른 서비스?

문제의 데이터는 매우 좁은 관심의 시뮬레이션 결과입니다. 따라서 InfoChimps 또는 다른 공용 데이터 저장소와 같은 곳이 꼭 필요한 곳이라고 생각할 필요는 없습니다. "이 코드로 배울 수 있습니다!" 그리고 더 많은 "이 논문에서 그림 3을 복제 할 수 있습니다".



1
절대적으로 관련성이 있음-왜 그것이 중복되지 않았다고 생각하는지에 대한 세부 사항을 추가하십시오.
Fomite

@EpiGrad : 어떤 종류의 날짜를 염두에두고 있습니까? 연구 프로젝트와 관련된 소스 코드 인 경우 arXiv 프리 프린트에 첨부 할 수 있습니다 .
Piotr Migdal

@PiotrMigdal 이상적으로, 나는 일반적인 종이 인용 전파 등이 잘 수행 될 수있을 정도로 오랫동안 몇 년 동안 데이터를 사용할 수 있기를 바랍니다. 내 필드에서만 사용하면 arXiv 프리 프린트에 첨부합니다 .)
Fomite

@EpiGrad 그렇다면 검색하기에 좋은 장소 는 Open Science ( michaelnielsen.org/blog/open-science) 의 한 측면으로서 Open Data 입니다.
Piotr Migdal

답변:


4

간단한 옵션 중 하나는 github 입니다.

데이터와 데이터 분석 코드를 공유 하기 위해 조금 사용합니다 . 이 질문 에는 사이트에서 코드와 데이터를 공유하는 다른 사람들의 좋은 예가 나와 있습니다 .

github의 장점

  • git에 익숙해지면 쉽게 업로드 할 수 있으며 버전 제어 요구에 git을 사용하지 않는 이유는 무엇입니까?
  • 간단한 단일 파일에 요점을 사용할 수 있습니다
  • 다른 사람이 하나 또는 여러 개의 파일을 아카이브로 다운로드하기 쉽습니다.
  • 충분한 양의 무료 저장 공간이 있습니다.
  • 인터넷에서 소스 코드를 찾아 볼 수 있습니다
  • 그리고 더...

물론 github은 데이터에 완벽하지 않습니다. 보다 영구적 인 아카이빙을 위해보다 영구적 인 기관 저장소 또는 기타 전용 도구를 사용하는 장점을 알 수 있습니다.


1
이것은 실제로 내가 함께했던 해결책입니다. 기관 리포지토리의 문제 중 하나는 내가 현재 사용중인 기관이 유동적이며 빅 데이터웨어 하우스 중 하나에 대해 데이터가 실제로 중요하지 않다는 것입니다.
Fomite

4

또 다른 옵션은 서비스와 오픈 소스 소프트웨어로 제공되는 Dataverse 입니다. 그래도 시도하지 않았습니다.


2

아카데미 사용자에게는 캠퍼스 라이브러리에서 종종 호스팅 하는 캠퍼스 디지털 저장소를 사용할 수 있습니다 (출판물과 함께 제공되는 데이터 세트의 논리적 위치).

널리 알려진 (무료) 디지털 저장소는 DSpace 로, 데이터 세트를 호스팅 할 수 있습니다. 그러나 이것은 기관의 누군가가 호스트해야하는 서비스입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.