이 데이터를 데이터베이스에 저장하는 방법을 결정하는 데 문제가 있습니다. 가장 좋은 방법은 무엇입니까? 나는 데이터베이스에 대해 많은 것을 알지 못한다.
형식이 지정된 데이터가 있지만 4가 아닌 열 수는 약 240이므로 각 날짜에는 240 개의 고유 값이 있습니다.
Date/Time 200,00 202,50 205,00
2010.11.12 13:34:00 45,8214 43,8512 41,5369
2010.11.12 13:35:00 461,9364 454,2612 435,5222
또한 행은 DataSites와 연관됩니다.
내 첫 번째 생각은 DataID (pk), DataSiteID, ParameterID, Date, Value, DataSite, Parameter 및 Date에 대한 인덱스가있는 테이블을 갖는 것입니다. ParameterID는 입력 열 헤더 (200,00 202,50 205,00 ...)를 저장하는 다른 테이블을 나타냅니다.
나의 두 번째 생각은 단순히 240- 홀수 열이 모두있는 테이블을 갖는 것이었다. 나는 몇 가지 다른 방법을 생각해 냈지만 꽤 불만족 스럽다.
첫 번째 솔루션에 대한 문제 (거대한 문제는 아니지만 마음에 들지 않음)는 Date 및 DataSiteID가 해당 입력 행의 모든 240 값에 대해 반복되므로 상당히 많이 사용한다는 것입니다 여분의 공간.
매년 약 40GB의 데이터가 위의 텍스트 형식으로 제공되며 DataSite, Parameter 및 Date로 데이터를 검색합니다. 들어오는 데이터의 양은 1 년 정도 4 배가 될 것입니다.
좋은 아이디어가 있습니까? 고마워, 제임스
편집 : 열이 다른 파장에서 측정되는 시계열 데이터입니다. 데이터는 비교적 좁은 범위의 파장 내에서 분석되기를 원할 것입니다. 향후 어느 시점에 추가 파장이 추가 될 수도 있습니다.
편집 : 답변을 주셔서 감사합니다, 정말 고맙습니다 :) 아마 500gb 정도의 테스트 데이터로 실험을 실행할 시간을 찾을 수 있다고 생각합니다. 나는 어떤 결론으로 다시 게시 할 것이다.;)