나는 바보 같은 질문을 내 머리에 떠오르게했다. C : / test1에 파일이 있고 C : / test2로 이동 한 다음 D : / Other로 이동하면 파일이 손상 될 수 있습니다. 파일을 반복해서 복사하는 것은 어떨까요 (사본의 사본의 사본)?
나는 바보 같은 질문을 내 머리에 떠오르게했다. C : / test1에 파일이 있고 C : / test2로 이동 한 다음 D : / Other로 이동하면 파일이 손상 될 수 있습니다. 파일을 반복해서 복사하는 것은 어떨까요 (사본의 사본의 사본)?
답변:
그들은 그렇게해서는 안됩니다. 파일은 켜기 / 끄기 패턴이며 이동 및 복사와 같은 모든 작업은 손실없이 데이터 전체를 이동하도록 설계되었습니다. 그것은 "전화"의 인간 게임과는 달리 파일을 계속해서 복사하면 모든 것이 엉뚱한 때까지 더 혼란스럽고 혼란스럽게 만듭니다.
그러나 , 당신이 무언가를 할 때마다, 잘못 될 가능성이 아주 적습니다. 당신이하는 일이 많을수록 그 중 하나에 잘못 들어갈 가능성이 커집니다. 예를 들어, 그들 중 하나는 움직이는 중간에 powercut입니다 - 당신은 결국 무엇입니까? 부분 파일? 파일 없음? 두 파일?
완벽한 것은 없습니다. 2005 년에, 연구 디스크 드라이브 오류율을 살펴보고 다음을 찾습니다.
우리는 1.4 PB를 읽는 동안 3 개의 손실 이벤트를 관찰했습니다. 이것은 3 개의 손실 된 파일입니다. 데이터 센터 환경에서 우리는 32,000 개의 10GB 파일 중 2 개를 잃었습니다. 사무실 설정 (시스템 1) 우리는 35,000 회 시도에서 10GB 파일 하나를 잃어 버렸습니다. 7,560 회 시도에서 100GB 파일 없음
그것은 단지 디스크 에러 일뿐입니다. "experienced at least 4 controller firmware or driver errors"
.
그 위에는 메모리 오류가 있습니다. 정보를 컴퓨터 메모리에로드 한 다음 다시 쓰는 것 사이의 부패의 가능성이 있습니다. 악명 높은 Google 연구에서 위키 백과에서 수천 개의 서버에 대한 메모리 오류를 추적합니다. 이리 어떤 상태 :
"SIGMETRICS / Performance'09 컨퍼런스에서 Google의 매우 많은 수의 서버를 기반으로 한 대규모 연구가있었습니다. [4] 실제 오류율 [메가 비트 당 10 억 장치 시간당 25,000 ~ 70,000 오류 [..] ] DIMM 메모리 모듈의 8 % 이상이 연간 오류의 영향을받습니다. "
물론 오류, 오판, 전력 스파이크 나 우주선에 의한 부패, 싼 하드웨어의 낮은 허용 오차, 디스크상의 자기 미디어, 케이블을 통한 전송, 마더 보드, 칩셋, 프로세서, 메모리, 펌웨어 또는 소프트웨어 및 모든 과정을 다시 거쳐야합니다.
부수적으로, 여기 환상적인 기사입니다 컴퓨팅 장치가 인터넷 주소를 검색하는 동안 메모리의 데이터를 손상시키는 경우 잘못된 주소를 조회 할 수 있다는 생각에 기반합니다. 따라서 저자는 인기있는 인터넷 사이트 이름이 손상된 경우 얻을 수있는 "잘못된 주소"를 등록하여 장치가 연결되어 있는지 확인했습니다. 거의 6 개월 만에 52,000 건의 요청이있었습니다.
컴퓨팅에서 일을 더 / 더 / 신뢰할 수있게 만드는 방법에 대한 연구는 바쁜 영역입니다. CRCs 및 체크섬부터 패리티가있는 RAID, 체크섬 트리 기반 파일 시스템 ZFS, 자동 복제, ECC 메모리 등.
동일한 파일 시스템 내에서 파일을 이동하면 파일의 데이터를 전혀 건드려서는 안되며 파일을 포함하는 디렉토리 만 변경하면됩니다.
하드웨어와 소프트웨어는 언제든지 실패 할 수 있습니다. 데이터 손상을 방지하기 위해 할 수있는 일이 많지만, 데이터 손상이 발생하지 않도록하기 위해 할 수있는 일은 거의 없습니다. 우주선과 심지어 대기는 데이터에 약간의 썩음을 일으킬 수 있습니다. 어떻게 대다수의 사용자가이를 피할 수 있습니까? 권리? 99 %의 웹 사이트가 다운로드 된 사본이 손상되지 않았는지 사용자가 테스트 할 수 있도록 체크섬 파일을 제공하지 않기 때문에 데이터 전송 중에 데이터 손상이 발생할 수 있습니다.
결국, 내 경험으로는 데이터 손상이 거의 발생하지 않습니다.