디스크 속도는 어떻게 측정되며 빠른 속도는 무엇입니까? 1500GB의 사본은 얼마나 오래 걸립니까?


11

디스크 속도는 어떻게 측정됩니까? 초당 Mbit 또는 Mbyte를 읽습니까? 오늘날 평균은 무엇이며 업계에서 빠르며 매우 빠릅니다.

누군가 1500GB의 파일 (데이터베이스 파일 등)의 사본을 만드는 데 시간이 오래 걸리고, 전문 시스템에 얼마나 오래 걸리며, 하드 디스크의 속도를 고려하여 계산할 수있는 방법이 있다고 가정 해 봅시다. ?

답변:


19

디스크 속도는 일반적으로 측정됩니다.

  • 분당 회전 속도 (4200rpm, 5400, 7200, 10k 및 15k에서 최저 회전 속도-SSD 또는 플래시 메모리에는 적용되지 않음).
  • 인터페이스 속도는 전자 장치가 디스크 컨트롤러에 데이터를 전송하려고 시도 할 수있는 가장 빠른 속도입니다 (ATA의 100MBps에서 SATA의 150 / 300 / 600Mbps, Fibre-Channel의 2 / 4 / 8 / 16Gbps 및 PCIe 속도까지). FusionIO와 같은 플래시 기반 스토리지).
  • 탐색 시간은 단순히 디스크의 특정 섹터를 읽거나 쓰는 데 걸리는 시간입니다. 디스크의 경우 3-15ms에서 SSD / 플래시 디스크의 일부에 이르기까지 다양합니다.
  • 그런 다음 우리는 당신이 기대할 수있는 실제 속도에 도달합니다. 순차적 읽기 (매우 큰 데이터 블록 읽기), 순차적 쓰기 (동일하지만 쓰기), 무작위 읽기 (디스크 전체에서 데이터 가져 오기) 및 무작위 쓰기. 디스크의 회전 속도는 엄청나게 다양하지만 순차적 읽기 및 쓰기의 경우 25MBps ~ 150MBps, 임의의 읽기 및 쓰기의 경우 3MBps ~ 50Mps까지 기대할 수 있습니다. SSD는 일반적으로 순차적 인 경우 200MBps 범위에 속하며 임의 작업의 경우 일반적으로 조금 적습니다. FusionIO는 모두 1GBps를 쉽게 달성 할 수 있지만 일반적으로 작고 비쌉니다.

실제 평균이 없다는 것을 알 수 있듯이, 구매할 제품에 대한 권장 사항을 원한다면 최대한 많은 정보를 제공하여 예산을 부담하십시오. 여기에는 예산, 애플리케이션 유형, 데이터 세트 크기, 사용자 기반이 포함되어야합니다 , 하드웨어 / OS 및 기타 유용한 정보가 있습니다.

1.5TB 사본의 경우 USB 2 연결 7200rpm SATA 디스크 에이 작업을 수행하는 경우 30MBps-40MBps 이상이어야하므로 1.5TB 전체가 10 시간 이상 걸릴 수 있습니다. 이것이 전형적인 프로페셔널 DAS / SAN 시스템이라면 100MBps의 지역에서 약 3 시간이 소요될 것으로 예상됩니다.

이것이 도움이되기를 바랍니다. 오, MB = 메가 바이트, Mb는 메가 비트입니다.


8

이러한 종류의 계산에는 많은 변수가 있습니다. 실제 디스크 시스템에는 많은 상호 종속성이 있습니다. 단일 컴퓨터 내에서 :

  • 드라이브 자체의 실제 정격 속도 (일반적으로 RPM, 5200, 7200, 10K, 15K)
  • 사용중인 파일 시스템
  • RAID 시스템 사용 여부
    • 그렇다면 RAID 카드의 성능
    • RAID의 유형
  • 사용중인 운영 체제
  • 읽기 및 쓰기 작업은 완전히 다른 성능 특성을 갖습니다.
  • 작업의 읽기 / 쓰기 비율
  • 순차적 작업의 경우 저장소의 조각화 요소

보시다시피 디스크 자체의 속도는 많은 요인 중 하나입니다. 그것은 게으른 요소이지만 여전히 많은 것 중 하나입니다. 해당 1.5TB 사본이 모두 같은 디스크에있는 경우 디스크는 100 % 임의 읽기 / 쓰기 성능을 수행하며 (일반적으로 최악의 성능 지표). 사본이 한 디스크에서 다른 디스크로 복사되고 데이터가 100 % 순차이고 대상 디스크가 완전히 비어있는 경우이 디스크 서브 시스템에서 가능한 가장 빠른 성능을 발휘해야합니다. 실제 성능은이 두 극단 사이에있을 것입니다.

두 개의 별도 서버간에 복사하는 경우 더 많은 요소가 관련됩니다.

대량의 순차적 작업을 수행 할 때 3Gb (gigaBIT) SAS 채널을 포화시킬 수있는 스토리지 배열이 있습니다. 6Gb SAS를 사용했다면 아마 포화 상태에 가까워 질 수도 있습니다. 랜덤 I / O의 경우이 특정 시스템은 OS가 무엇인지에 따라 매우 다르게 수행됩니다 (예 : OpenSolaris는 최악의 랜덤 I / O를 가졌고 Linux XFS는 3 배로 최고였습니다).

이 질문에 확실하게 대답하기에는 너무 많은 변수가 있습니다.


3

1.5TB의 데이터를 복사하는 데 걸리는 시간은 데이터 유형에 따라 다릅니다. 1,500 개의 1GB 파일이 몇 개 있으면 몇 시간 밖에 걸리지 않지만 1KB 파일이 10 억 5 억 개이면 며칠이 걸릴 수 있습니다.

이는 디스크에 대한 두 가지 경합 사양, 즉 처리량과 평균 액세스 시간 때문입니다. 처리량이 100MB / 초이고 액세스 시간이 10ms 인 기존 디스크는 일반적입니다. 데이터를 순차적으로 스트리밍 할 수 있으면 100MB / 초를 얻을 수 있습니다. 그러나 다른 장소로 건너 뛰려면 10ms가 걸립니다. 스트리밍 중이라면 다른 위치로 이동하는 데 1MB의 데이터를 쓸 수있었습니다.

파일을 만들려면 몇 번의 탐색이 필요할 수 있으므로 1KB 파일을 만들면 몇 MB의 데이터를 스트리밍하는 것만 큼 "비용"이들 수 있습니다.

따라서 어떤 경우에는 rsync와 같은 것을 통해 파일 시스템에서 복사하는 것보다 블록 장치의 원시 디스크 복사를 수행하는 것이 좋습니다. 파일 시스템에 파일이 많은 경우 (예 : 50 % 이상), "dd"를 통해 전체 블록 장치를 복사하는 데 걸리는 시간이 더 낫습니다. 물론 파일 시스템이 마운트되어있는 동안에는이 작업을 수행 할 수 없으므로 단점도 있습니다.

SSD는 액세스 시간이 약 100 배 빠르기 때문에이를 완화하는 데 도움이 될 수 있지만 MLC SSD 드라이브에는 사전 삭제 된 블록 풀의 가용성에 따라 복잡한 액세스 문제가 있습니다. SLC SSD가이를 도울 수 있습니다.

캐시가 내장 된 RAID 컨트롤러는 SSD를 통해 블록 장치를 캐시 할 수있는 플래시 캐시 커널 모듈과 같은 검색 기능을 지원합니다.

RAID 시스템은 다중 병렬 탐색을 허용하여 평균 액세스 시간을 효과적으로 줄이고 병렬 처리를 통해 처리량을 증가시킵니다. 그러나 전반적인 성능은 종종 관련된 파일 수에 따라 다릅니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.