계산 작업에 사용하려는 소프트웨어의 품질 (평가 한 패키지 또는 통조림 패키지)의 품질을 평가할 때 표준 데이터 세트 또는 문제에서 그것이 얼마나 잘 작동하는지 보는 것이 좋습니다. 계산 루틴을 검증하기 위해 이러한 테스트를 어디서 얻을 수 있습니까?
(답변 당 하나의 웹 사이트 / 책을 참조하십시오.)
계산 작업에 사용하려는 소프트웨어의 품질 (평가 한 패키지 또는 통조림 패키지)의 품질을 평가할 때 표준 데이터 세트 또는 문제에서 그것이 얼마나 잘 작동하는지 보는 것이 좋습니다. 계산 루틴을 검증하기 위해 이러한 테스트를 어디서 얻을 수 있습니까?
(답변 당 하나의 웹 사이트 / 책을 참조하십시오.)
답변:
희소 행렬에 대한 분석에 관심이 있다면 Davis의 University of Florida Sparse Matrix Collection 및 Matrix Market 도 고려할 것 입니다.
IVPs에 대한 테스트 세트 (ODE 해법에 대한 초기 값 문제는) 현재 CWI 암스테르담에서 그것을 인수 바리, 이탈리아, 대학의 명에 의해 유지된다.
그래프 분할 알고리즘을 테스트하기 위해 Walshaw의 그래프 분할 아카이브가 있습니다.
전산 전자기에는 유명한 전자기 분석 방법 (TEAM) 테스트 와 같은 일련의 테스트 문제가 있습니다.
그들 중 일부는 실험 데이터에 맞는 정확한 시뮬레이션 결과를 얻기 위해 진지한 최신 수치 기술이 필요합니다. 예를 들어 도체 코일 문제 입니다.
맥스웰 방정식에 문제를 테스트하는 또 다른 세트로 컴파일 Dauge : 벤치 마크 계산을 맥스웰 방정식에 매우 특이 솔루션 근사 . 유명한 (또는 악명 높은) 피체 라 큐브 중 하나 :
분자 구조와 관련된 알고리즘 벤치마킹에 관심이있는 경우 pubchem 데이터베이스 에는 주로 유기 분자가 많이 있습니다. 이것은 다른 모델 / 프로그램으로 얻은 분자 특성의 예측을 비교하는 데 유용 할 수 있습니다. 이 사이트에는 사전 정의 된 기준 (예 : 화학 성분)을 만족하는 대량의 분자 배치를 다운로드하기위한 여러 옵션이 있습니다.
Arnold Neumaier는 제약이없고 제한적인 최적화 (비선형 프로그래밍)를 위해 안정적인 테스트 문제 를 유지 합니다 . 이 컬렉션에는 Moré, Garbow 및 Hillstrom으로 인한 제한없는 최적화에 대한 표준 테스트 문제 가 포함되어 있습니다.
쌍곡선 보존법을 해결하는 경우 Athena의 테스트 .
빌딩 에너지 시뮬레이션 소프트웨어에서 날씨 데이터 세트를 사용합니다. 미국의 경우 데이터 세트는 20 년 이전의 시간마다 매시간 (보통 공항에서) 관측 한 기상 관측치로 구성됩니다.
통계 알고리즘을 테스트하기 위해 DJ Hand, F. Daly, K. McConway, D. Lunn 및 E. Ostrowski 의 소형 데이터 세트 핸드북이 있습니다. 이러한 데이터 세트 중 일부는 여기 에서 다운로드 할 수 있습니다 .
다변량 통계 분석 및 기계 학습 알고리즘을 테스트하기 위해 http://www.ics.uci.edu/~mlearn/에 UCI 데이터 세트 저장소가 있습니다 .
Hans Mittelman의 웹 사이트 는 수치 최적화에서 현재 소프트웨어 옵션을 탐색 할 수있는 훌륭한 리소스입니다. 그는 자체 벤치 마크와 최적화시 테스트 문제에 대한 다른 벤치 마크에 대한 링크도 포함합니다 .
Alan Genz는 다차원 통합 루틴 테스팅 논문에서 일련의 기능 테스트를 제안했다 . 이 백서의 온라인 버전을 찾을 수 없지만 CUBA 라이브러리 에 대한 백서 에서이 백서를 참조 할 수 있습니다 .
훌륭한 소프트웨어는 반드시 테스트를 거쳐야하며 저자가 테스트 한 방식을 말하고 테스트 데이터 세트 자체를 제공하거나 (예 : 회귀 테스트 형식으로) 테스트 된 데이터에 대한 링크를 제공해야합니다.
테스트 할 큰 그래프 또는 네트워크 데이터를 찾고있는 경우 스탠포드 네트워크 분석 프로젝트 (SNAP)은 일반적으로 익명 인접리스트의 형태로 많은 큰 그래프 셋을 갖는다. 옵션 중 일부는 다음과 같습니다.
데이터는 쉽다; 그것을 얻는 API는 힘들 수 있습니다. Quandl을 추천 합니다 . 이 사이트에는 하나의 쉽고 REST-ful API를 통해 액세스 할 수있는 공개적으로 사용 가능한 천만 개 이상의 데이터 세트가 있습니다. 모든 데이터는 CSV 또는 JSON으로 반환됩니다. 또는 프로그래밍이 적합하지 않은 경우 Excel로 데이터를 가져 오는 쉬운 방법이 있습니다. R, Python 및 Ruby 프로그래머는 기본 라이브러리를 사용하여 집에서 바로 사용할 수 있습니다.