답변:
디스크 속도는 일반적으로 측정됩니다.
실제 평균이 없다는 것을 알 수 있듯이, 구매할 제품에 대한 권장 사항을 원한다면 최대한 많은 정보를 제공하여 예산을 부담하십시오. 여기에는 예산, 애플리케이션 유형, 데이터 세트 크기, 사용자 기반이 포함되어야합니다 , 하드웨어 / OS 및 기타 유용한 정보가 있습니다.
1.5TB 사본의 경우 USB 2 연결 7200rpm SATA 디스크 에이 작업을 수행하는 경우 30MBps-40MBps 이상이어야하므로 1.5TB 전체가 10 시간 이상 걸릴 수 있습니다. 이것이 전형적인 프로페셔널 DAS / SAN 시스템이라면 100MBps의 지역에서 약 3 시간이 소요될 것으로 예상됩니다.
이것이 도움이되기를 바랍니다. 오, MB = 메가 바이트, Mb는 메가 비트입니다.
이러한 종류의 계산에는 많은 변수가 있습니다. 실제 디스크 시스템에는 많은 상호 종속성이 있습니다. 단일 컴퓨터 내에서 :
보시다시피 디스크 자체의 속도는 많은 요인 중 하나입니다. 그것은 게으른 요소이지만 여전히 많은 것 중 하나입니다. 해당 1.5TB 사본이 모두 같은 디스크에있는 경우 디스크는 100 % 임의 읽기 / 쓰기 성능을 수행하며 (일반적으로 최악의 성능 지표). 사본이 한 디스크에서 다른 디스크로 복사되고 데이터가 100 % 순차이고 대상 디스크가 완전히 비어있는 경우이 디스크 서브 시스템에서 가능한 가장 빠른 성능을 발휘해야합니다. 실제 성능은이 두 극단 사이에있을 것입니다.
두 개의 별도 서버간에 복사하는 경우 더 많은 요소가 관련됩니다.
대량의 순차적 작업을 수행 할 때 3Gb (gigaBIT) SAS 채널을 포화시킬 수있는 스토리지 배열이 있습니다. 6Gb SAS를 사용했다면 아마 포화 상태에 가까워 질 수도 있습니다. 랜덤 I / O의 경우이 특정 시스템은 OS가 무엇인지에 따라 매우 다르게 수행됩니다 (예 : OpenSolaris는 최악의 랜덤 I / O를 가졌고 Linux XFS는 3 배로 최고였습니다).
이 질문에 확실하게 대답하기에는 너무 많은 변수가 있습니다.
1.5TB의 데이터를 복사하는 데 걸리는 시간은 데이터 유형에 따라 다릅니다. 1,500 개의 1GB 파일이 몇 개 있으면 몇 시간 밖에 걸리지 않지만 1KB 파일이 10 억 5 억 개이면 며칠이 걸릴 수 있습니다.
이는 디스크에 대한 두 가지 경합 사양, 즉 처리량과 평균 액세스 시간 때문입니다. 처리량이 100MB / 초이고 액세스 시간이 10ms 인 기존 디스크는 일반적입니다. 데이터를 순차적으로 스트리밍 할 수 있으면 100MB / 초를 얻을 수 있습니다. 그러나 다른 장소로 건너 뛰려면 10ms가 걸립니다. 스트리밍 중이라면 다른 위치로 이동하는 데 1MB의 데이터를 쓸 수있었습니다.
파일을 만들려면 몇 번의 탐색이 필요할 수 있으므로 1KB 파일을 만들면 몇 MB의 데이터를 스트리밍하는 것만 큼 "비용"이들 수 있습니다.
따라서 어떤 경우에는 rsync와 같은 것을 통해 파일 시스템에서 복사하는 것보다 블록 장치의 원시 디스크 복사를 수행하는 것이 좋습니다. 파일 시스템에 파일이 많은 경우 (예 : 50 % 이상), "dd"를 통해 전체 블록 장치를 복사하는 데 걸리는 시간이 더 낫습니다. 물론 파일 시스템이 마운트되어있는 동안에는이 작업을 수행 할 수 없으므로 단점도 있습니다.
SSD는 액세스 시간이 약 100 배 빠르기 때문에이를 완화하는 데 도움이 될 수 있지만 MLC SSD 드라이브에는 사전 삭제 된 블록 풀의 가용성에 따라 복잡한 액세스 문제가 있습니다. SLC SSD가이를 도울 수 있습니다.
캐시가 내장 된 RAID 컨트롤러는 SSD를 통해 블록 장치를 캐시 할 수있는 플래시 캐시 커널 모듈과 같은 검색 기능을 지원합니다.
RAID 시스템은 다중 병렬 탐색을 허용하여 평균 액세스 시간을 효과적으로 줄이고 병렬 처리를 통해 처리량을 증가시킵니다. 그러나 전반적인 성능은 종종 관련된 파일 수에 따라 다릅니다.