알고리즘 / 루틴 테스트를위한 좋은 데이터 세트 / 테스트 문제를 어디서 얻을 수 있습니까?


41

계산 작업에 사용하려는 소프트웨어의 품질 (평가 한 패키지 또는 통조림 패키지)의 품질을 평가할 때 표준 데이터 세트 또는 문제에서 그것이 얼마나 잘 작동하는지 보는 것이 좋습니다. 계산 루틴을 검증하기 위해 이러한 테스트를 어디서 얻을 수 있습니까?

(답변 당 하나의 웹 사이트 / 책을 참조하십시오.)


나는 이것을 커뮤니티 위키 게시물로 만들려고했고, 따라서 그것을 변환을 위해 표시했다.
JM

3
이 질문이 너무 광범위하지 않습니까? 즉,이 소프트웨어가 해결하는 데 사용되는 문제의 알고리즘 / 본질에 달려 있습니까?
Andre Holzner

나는이 질문이 커뮤니티 위키 인 @Andre (자원의 "큰 목록")가 되기를 정말로 원했다 . 변환을 위해 플래그를 지정했지만 변환되지 않은 이유를 모르겠습니다.
JM

@ JM 변환했습니다.
David Ketcheson

답변:



13

제조 된 솔루션의 방법은 PDE 및 기타 솔버를 테스트하기위한 표준입니다. 대부분의 상징적 대수 시스템에는 코드 생성 기능이 있으므로 제조 된 솔루션을 만드는 데 유용합니다. SymPy와 Maple은 이러한 목적으로 ccode 기능을 가지고 있습니다.




8

전산 전자기에는 유명한 전자기 분석 방법 (TEAM) 테스트 와 같은 일련의 테스트 문제가 있습니다.

그들 중 일부는 실험 데이터에 맞는 정확한 시뮬레이션 결과를 얻기 위해 진지한 최신 수치 기술이 필요합니다. 예를 들어 도체 코일 문제 입니다.

맥스웰 방정식에 문제를 테스트하는 또 다른 세트로 컴파일 Dauge : 벤치 마크 계산을 맥스웰 방정식에 매우 특이 솔루션 근사 . 유명한 (또는 악명 높은) 피체 라 큐브 중 하나 :

피케 라

ϕH1+ϵE=ϕ

Δu=0,where u=rαsin(αθ).

7

분자 구조와 관련된 알고리즘 벤치마킹에 관심이있는 경우 pubchem 데이터베이스 에는 주로 유기 분자가 많이 있습니다. 이것은 다른 모델 / 프로그램으로 얻은 분자 특성의 예측을 비교하는 데 유용 할 수 있습니다. 이 사이트에는 사전 정의 된 기준 (예 : 화학 성분)을 만족하는 대량의 분자 배치를 다운로드하기위한 여러 옵션이 있습니다.



7

귀엽의 웹 사이트 최적화 및 선형 솔버에 대한 몇 가지 추가 문제 아놀드 Neumaier의 웹 사이트에 언급 된 CUTE 테스트 세트를 업데이트합니다. 또한 선형 대수 및 최적화 솔버의 테스트 및 업데이트를위한 소프트웨어 도구를 제공합니다.







3

Alan Genz는 다차원 통합 루틴 테스팅 논문에서 일련의 기능 테스트를 제안했다 . 이 백서의 온라인 버전을 찾을 수 없지만 CUBA 라이브러리 에 대한 백서 에서이 백서를 참조 할 수 있습니다 .




2

테스트 할 큰 그래프 또는 네트워크 데이터를 찾고있는 경우 스탠포드 네트워크 분석 프로젝트 (SNAP)은 일반적으로 익명 인접리스트의 형태로 많은 큰 그래프 셋을 갖는다. 옵션 중 일부는 다음과 같습니다.

데이터

데이터의 속성

  • 모서리 수 : ~ 10 ~ ~ 400 백만
  • 노드 수 : ~ 10 ~ 1 억
  • 에지 유형 : 방향, 비 방향, 가중치, 비가 중, 부호 및 부호 없음.
  • 네트워크 유형 : 직접, 비 방향, 이분, 다중 그래프, 시간, 레이블.

데이터 세트에서 사용할 수있는 기본 통계 :

도구


@JM 문제 없습니다! 얼마 전에 프로젝트에 소셜 네트워크 데이터 세트 중 일부를 사용한 다음이 스택 교환을 우연히 발견하고 여기에서 도움이 될 것이라고 생각했습니다.
ryan

-3

데이터는 쉽다; 그것을 얻는 API는 힘들 수 있습니다. Quandl을 추천 합니다 . 이 사이트에는 하나의 쉽고 REST-ful API를 통해 액세스 할 수있는 공개적으로 사용 가능한 천만 개 이상의 데이터 세트가 있습니다. 모든 데이터는 CSV 또는 JSON으로 반환됩니다. 또는 프로그래밍이 적합하지 않은 경우 Excel로 데이터를 가져 오는 쉬운 방법이 있습니다. R, Python 및 Ruby 프로그래머는 기본 라이브러리를 사용하여 집에서 바로 사용할 수 있습니다.


1
Scicomp에 오신 것을 환영합니다! 나는 이것이 질문에 관한 일종의 데이터라고 생각하지 않는다. 알고리즘을 테스트하려면 데이터 세트뿐만 아니라 결과 / 비교를 위해 알려진 알려진 결과 (문제 / 알고리즘에 따라 다름)가 필요합니다.
Christian Clason 8

감사합니다, @ChristianClason. 무슨 말인지 알 겠어 예를 들어, 소프트웨어가 선형 회귀 용 소프트웨어 인 경우 저자는 선형 회귀 패키지가 올바르게 작동하는지 테스트하기 위해 일련의 검증 된 분석 결과뿐만 아니라 데이터 세트에 관심이 있습니다.
Brian Risk
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.