짧은 답변
엔트로피 (죽음이라고도 함)로 인해 오랜 시간을 보장하는 것은 불가능합니다. 디지털 데이터는 우주의 다른 어떤 것과 마찬가지로 부패하고 죽습니다. 그러나 속도가 느려질 수 있습니다.
현재 30 년이 넘는 콜드 데이터 보관을 보장 할 수있는 확실한 방법과 과학적으로 입증 된 방법은 없습니다. Long Now 박물관 의 Rosetta Disks 프로젝트 와 같은 일부 프로젝트는 여전히 비용이 많이 들고 데이터 밀도가 낮습니다 (약 50MB).
한편, 파나소닉과 같은 Blu-ray Discs HTL 유형 또는 Verbatim Gold Archival과 같은 보관 등급 DVD + R과 같은 냉장 보관을 위해 과학적으로 입증 된 탄력성 광학 매체를 사용하여 부드러운 상자에 부드러운 장소에 보관할 수 있습니다 높은 온도) 빛에서.
또한 중복 : 데이터 (적어도 4)의 여러 사본을 확인하고 계산은 모든 것이 괜찮아 것을 정기적으로 확인하는 해시, 모든 몇 년 새 디스크에 데이터를 다시 작성해야합니다. 또한 많은 오류 수정 코드 를 사용하면 손상된 데이터를 복구 할 수 있습니다!
긴 대답
왜 시간이 지남에 따라 데이터가 손상됩니까? 답은 한 단어에있다 : 엔트로피 . 이것은 우주의 주요하고 불가피한 힘 중 하나이며, 시간이 지남에 따라 시스템의 순서가 점점 줄어 듭니다. 데이터 손상 은 정확히 다음과 같습니다. 비트 순서의 장애. 다시 말해, 우주는 당신의 데이터를 싫어합니다 .
엔트로피 싸움은 죽음과 싸우는 것과 똑같습니다. 당신은 결코 성공하지 못할 것입니다. 그러나 엔트로피를 늦출 수있는 것처럼 죽음을 늦출 수있는 방법을 찾을 수 있습니다. 또한 손상을 복구하여 엔트로피를 속일 수 있습니다 (즉, 손상을 중지 할 수는 없지만 미리 조치를 취하면 손상이 발생한 후 복구 할 수 있습니다!). 삶과 죽음에 관한 것과 마찬가지로, 마법의 총알도없고 하나의 솔루션도 없으며 최상의 솔루션을 위해서는 데이터 의 디지털 큐 레이션 에 직접 참여 해야합니다. 모든 작업을 올바르게 수행하더라도 데이터를 안전하게 유지한다고 보장 할 수는 없으며 기회 만 극대화 할 수 있습니다.
이제 좋은 소식 : 지금 당신이 경우, 데이터를 유지하는 매우 효과적인 방법이있다 결합 좋은 품질의 저장 매체를 , 그리고 좋은 보관 / 큐 레이션 전략 : 당신이해야 실패를 설계 .
좋은 큐 레이션 전략은 무엇입니까? 똑바로 살펴 보겠습니다. 대부분의 정보는 보관이 아니라 백업에 관한 것입니다. 문제는 대부분의 사람들이 백업 전략에 대한 지식을 보관으로 옮기므로 많은 신화가 일반적으로 들린다는 것입니다. 실제로, 몇 년 동안 데이터를 저장 (백업)하고 최소한 수십 년에 걸쳐 가장 긴 시간 동안 데이터를 저장 (아카이브)하는 것은 완전히 다른 목표이므로 다른 도구와 전략이 필요합니다.
운 좋게도 많은 연구와 과학적 결과가 있으므로 포럼이나 잡지보다는 과학 논문을 참조하는 것이 좋습니다. 여기, 내 독서의 일부를 요약합니다.
또한 그러한 저장 매체가 완벽하다고 주장하는 주장과 독립적이지 않은 과학적 연구에 주의하십시오 . 유명한 BBC Domesday 프로젝트를 기억하십시오 : «Digital Domesday Book은 1000 년이 아닌 15 년 동안 지속됩니다» . 항상 독립적 인 논문으로 연구를 다시 확인하고,없는 경우 저장 매체가 보관에 적합하지 않다고 가정하십시오.
(질문에서) 원하는 것을 명확히하자.
장기 보관 : 현명하고 재현 할 수없는 "개인"데이터의 사본을 유지하려고합니다. 보관은 (A)보다 근본적으로 다른 백업 으로, 여기에서도 설명 : 백업 아카이브 반면, 정기적으로 업데이트받을 따라서 백업 (즉, OS, 작업 폴더 레이아웃 등)로 갱신 할 필요가 동적 기술 데이터를위한 정적 데이터가 당신은 가능성이 것 한 번만 쓰기 그냥 읽어 에서 때때로 . 아카이브는 일시적인 데이터 , 일반적으로 개인용입니다.
냉장 보관 : 보관 된 데이터를 최대한 유지 관리하지 않으려 고합니다. 이는 매체가 부품이나 컴퓨터 또는 전기 공급 장치에 연결하지 않고도 오랫동안 안정적으로 유지되는 구성 요소와 필기 방법을 사용해야한다는 의미이므로 BIG 제약 조건입니다.
분석을 용이하게하기 위해 먼저 냉장 보관 솔루션과 장기 보관 전략을 살펴 보겠습니다.
냉장 매체
우리는 좋은 냉장 매체가 무엇인지 위에서 정의했습니다. 데이터를 조작하지 않고도 오랫동안 데이터를 유지해야합니다 (그래서 "콜드"라고합니다). 데이터를 유지 관리하는 컴퓨터).
종이 는 지구상에서 가장 탄력적 인 저장 매체처럼 보일 수 있습니다. 우리는 종종 고대부터 아주 오래된 원고를 발견하기 때문입니다. 그러나 종이는 주요 단점이 있습니다. 먼저 데이터 밀도가 매우 낮으며 (작은 문자 및 컴퓨터 도구를 사용하여 종이에 ~ 100KB 이상을 저장할 수 없음), 용지를 모니터링 할 수있는 방법없이 시간이 지남에 따라 저하됩니다. 하드 드라이브와 마찬가지로 자동 손상이 발생합니다. 그러나 디지털 데이터의 자동 손상을 모니터링 할 수는 있지만 종이로는 할 수 없습니다. 예를 들어 사진이 10 년 동안 만 동일한 색상을 유지한다고 보장 할 수는 없습니다. 색상이 저하되고 원래 색상을 찾을 방법이 없습니다. 물론, 당신은 큐 레이트 할 수 있습니다 이미지 복원 전문가라면 사진을 찍는 데 시간이 많이 걸리지 만 디지털 데이터를 사용하면이 큐 레이션 및 복원 프로세스를 자동화 할 수 있습니다.
하드 드라이브 (HDD)가 되어 알려진 하는 이 3 ~ 8 년의 평균 수명 : 그들은 단지 시간이 지남에 따라 저하되지 않는, 그들은되어 결국 사망 보장 (: 액세스 예). 다음 곡선은 모든 HDD가 엄청난 속도로 죽는 경향을 보여줍니다.
오류 유형에 따른 HDD 고장률의 변화를 보여주는 욕조 곡선 (엔지니어링 된 장치에도 적용 가능) :
HDD 오류율을 보여주는 곡선, 모든 오류 유형이 병합 됨 :
출처 : Backblaze
고장과 관련하여 3 가지 유형의 HDD가 있음을 알 수 있습니다. 급격하게 죽는 HDD (예 : 제조 오류, 불량 HDD, 헤드 고장 등), 끊임없는 사망률 (좋은 제조, 다양한 " 정상적인 "이유는 대부분의 HDD에 해당되며) 마지막으로 대부분의 HDD보다 약간 더 오래 살고"정상적인 HDD "(예 : 운이 좋지 않은 HDD, 이상적인 환경 조건 등). 따라서 HDD가 죽을 것이라는 보장이 있습니다.
왜 HDD가 그렇게 자주 죽습니까? 즉, 데이터는 자기 디스크에 기록되며 자기장은 사라지기 전에 수십 년 동안 지속될 수 있습니다. 그들이 죽는 이유는 저장 매체 (자기 디스크)와 판독 하드웨어 (전자 보드 + 회전 헤드)가 결합되어 있기 때문입니다. 분리 할 수 없으며, 자기 디스크를 추출하여 다른 헤드로 읽을 수는 없습니다. 전자 보드 (물리적 데이터를 디지털로 변환)는 거의 모든 HDD (동일한 브랜드 및 참조조차도 원산지 공장에 따라 다름)마다 다르며, 회전 헤드가있는 내부 메커니즘은 오늘날 매우 불가능합니다. 자기 디스크를 죽이지 않고 회전 디스크를 완벽하게 배치 할 수 있습니다.
또한, 하드 디스크 드라이브는 알려진 탈자 (SSD 포함)를 사용하지 않을 경우 시간이 지남. 따라서 하드 디스크에 데이터를 저장하고 옷장에 저장하고 전기 연결없이 데이터를 유지할 것이라고 생각할 수는 없습니다. 최소 1 년에 한 번 또는 몇 년마다 HDD를 전원에 연결 해야합니다 . 따라서 HDD는 냉장 보관에 적합하지 않습니다.
마그네틱 테이프 : 종종 백업 요구 및 보관을위한 확장으로 설명됩니다. 자성 테이프의 문제점은 매우 민감하다는 것입니다. 자성 산화물 입자는 태양, 물, 공기, 긁힘, 시간 또는 전자기 장치에 의해 자화되거나 시간이 지남에 따라 떨어지거나 인쇄 될 수 있습니다 . 이것이 전문가들이 데이터 센터에서만 사용하는 이유입니다. 또한 10 년 이상 데이터를 보유 할 수 있다는 것이 입증 된 적이 없습니다. 그렇다면 왜 종종 백업을 권장합니까? 예전에는 가격이 저렴했기 때문에 HDD보다 자기 테이프를 사용하는 데 10 배에서 100 배가 저렴했으며 HDD는 현재보다 훨씬 덜 안정적이었습니다. 따라서 비용 효율성으로 인해 자기 테이프는 주로 백업에 권장됩니다복원력이 아니라 데이터를 보관할 때 가장 관심을 갖는 것은 아닙니다.
CompactFlash 및 SD (Secure Digital) 카드 는 매우 견고하고 강력하며 치명적인 조건에서도 견딜 수 있습니다 .
대부분의 카메라의 메모리 카드는 사실상 파괴 할 수 없으며 Digital Camera Shopper 잡지에서 찾을 수 있습니다. 5 가지 메모리 카드 포맷은 커피 나 콜라에 끓여서 짓밟고 씻고 덩크 한 채 살아 남았습니다.
그러나 다른 자기 기반 매체와 마찬가지로 데이터를 유지하기 위해 전기장에 의존하므로 카드에 주스가 없으면 데이터가 완전히 손실 될 수 있습니다. 따라서 전기장을 새로 고치기 위해 때때로 카드의 전체 데이터를 다시 작성해야하므로 냉장 보관에 적합하지는 않지만 백업 및 단기 또는 중기 보관에 적합한 매체가 될 수 있습니다.
광학 매체 : 광학 매체는 CD, DVD 또는 Blu-ray (BD)와 같이 데이터를 읽는 데 레이저를 사용하는 일종의 저장 매체입니다. 이것은 종이의 진화로 볼 수 있지만, 데이터를 아주 작은 크기로 작성하므로 종이보다 더 정확하고 탄력적 인 재료가 필요했으며 광학 디스크는 바로 그 것입니다. 광학 매체의 두 가지 가장 큰 장점은 저장 매체가 판독 하드웨어와 분리되어 있다는 것입니다 (즉, DVD 리더가 고장 나면 항상 다른 디스크를 구입하여 디스크를 읽을 수 있습니다). 미래의 증거 (즉, 레이저를 만드는 방법을 알고 있다면 CAMILEON이 Domesday BBC Project에서했던 것처럼 항상 에뮬레이션을 통해 광 디스크의 비트를 읽도록 레이저를 조정할 수 있습니다 ).
다른 기술과 마찬가지로, 새로운 반복은 더 큰 밀도 (저장소)를 제공 할뿐만 아니라 더 나은 오류 수정과 환경 붕괴에 대한 복원력을 향상시킵니다 (항상은 아니지만 일반적으로 사실임). DVD의 신뢰성에 대한 첫 번째 논쟁은 DVD-R과 DVD + R 사이에 있었고, 오늘날 DVD-R이 여전히 흔하더라도 DVD + R은 더 안정적 이고 정확한 것으로 인식됩니다 . 이제 보관 용 DVD 디스크가 있으며 특히 유지 관리없이 최소 ~ 20 년 동안 견딜 수 있다고 주장합니다.
Verbatim Gold Archival DVD-R [...]은 저명한 독일 c't 잡지에 의해 철저한 장기 스트레스 테스트에서 가장 신뢰할 수있는 DVD-R로 평가되었습니다 (2008 년 6 월 16 일자, 116-123 페이지). ) [...] 18 년의 최소 내구성과 32-127 년의 평균 내구성 (25C, 50 % 습도) 달성. 이 값에 가까운 다른 디스크는 없었으며, 두 번째 최고의 DVD-R은 최소 5 년의 내구성을 가졌습니다.
LinuxTech.net에서 .
또한, 일부 회사는 매우 장기적인 DVD 보관을 전문으로 하며 Millenniata의 M-Disc 또는 DataTresorDisc와 같이 1000 년 이상 데이터를 보존 할 수 있다고 주장하며 (독립적이지 않은) 일부 연구 ( 비과학적인 다른 사람들 사이에서 .
이 모든 것이 매우 유망한 것 같습니다! 불행히도, 이러한 주장을 확인하기위한 독립적 인 과학적 연구가 충분하지 않으며, 이용 가능한 소수의 주장은 그렇게 열성적이지 않습니다.
데이터의 가독성을 정기적으로 점검하여 2000 시간 (약 83 일)에 걸쳐 여러 DVD에서 습도 (80 % RH) 및 온도 (80 ° C) 노화가 가속화되었습니다.
프랑스의 디지털 데이터 보관 기관 (Archives de France)에서 2012 년부터 연구 한 결과.
첫 번째 그래프는 저하 속도가 느린 DVD를 보여줍니다. 빠른 저하 곡선을 가진 두 번째 DVD. 그리고 세 번째는 M-Disc 및 DataTresorDisc와 같은 특별한 "매우 장기적인"DVD를위한 것입니다. 우리가 볼 수 있듯이, 그들의 성능은 주장 수준에 맞지 않습니다. 보관 수준이 아닌 표준 DVD와 비교할 때 낮습니다!
그러나 M-Disc 및 DataTresorDisc와 같은 무기 광 디스크는 다음과 같은 장점이 있습니다.
240 시간 동안 빛 (750 W / m²)을 사용한 가속 노화 :
이것들은 훌륭한 결과이지만 Verbatim Gold Archival과 같은 보관 등급 DVD도 동일한 성능을 달성하며, 조명은 객체에 가장 제어 가능한 매개 변수입니다 .DVD를 닫힌 상자 나 옷장에 넣기가 매우 쉽습니다. 빛의 영향을 제거합니다. 빛보다 온도와 습도에 매우 강한 DVD를 얻는 것이 훨씬 더 유용합니다.
이 같은 연구팀은 또한 Blu-ray 시장을 조사하여 장기 냉장 보관에 적합한 매체를 가진 브랜드가 있는지 알아 봅니다. 결과는 다음과 같습니다.
DVD와 동일한 매개 변수 하에서 여러 Blu-ray 브랜드의 습도 및 온도 가속 노화 :
여러 BluRays 브랜드에서 동일한 가속 매개 변수, 동일한 매개 변수 :
2012 년 Archives de France에 대한이 연구에서 번역되었습니다.
여기 와 여기에 있는 모든 결과 (프랑스어)의 두 가지 요약 .
파나소닉의 최고 Blu-ray 디스크는 습도와 온도 테스트에서 최고 수준의 보관 등급 DVD와 비슷한 성능을 발휘하면서 빛에 거의 영향을받지 않습니다! 이 Blu-ray 디스크는 보관 등급이 아닙니다. 또한 Blu-ray 디스크는 DVD보다 향상된 오류 수정 코드 (CD에 비해 향상된 버전을 사용하는 경우)를 사용하므로 데이터 손실 위험을 최소화합니다. 따라서 일부 BluRay 디스크는 냉장 보관에 매우 적합한 것으로 보입니다.
실제로 일부 회사는 Panasonic 및 Sony와 같은 보관 등급의 고밀도 스토리지 Blu-ray 디스크 작업을 시작 하여 평균 수명이 50 년인 300GB ~ 1TB의 스토리지를 제공 할 수 있다고 발표 했습니다. 또한, 대기업은 냉장 광학 매체를 향해 자신을 돌리고있다 등, (당신이 어떤 전기 공급없이 저장할 콜드 수 있기 때문에 훨씬 적은 자원을 소모하기 때문에) 감기 "로 블루 레이 디스크를 사용하는 로봇 시스템을 개발 페이스 북 데이터 저장 을 위해 시스템에 거의 액세스하지 않습니다.
Long Now 보관 이니셔티브 : Long Now 박물관 의 Rosetta Disc 프로젝트 와 같은 흥미로운 다른 리드가 있습니다 . 이 프로젝트는 창세기가 번역 된 지구상의 모든 언어로 미시적 규모의 창세기 페이지를 작성하는 프로젝트입니다. 이것은 매우 장기적인 냉장 저장을 위해 50MB를 저장할 수있는 매체를 제공하는 최초의 훌륭한 프로젝트이며 (탄소로 작성되었으므로) 미래에 액세스 할 수 있습니다. 데이터 (이상한 형식 사양이나 Blu-ray의 바이올렛 빔과 같은 기술적 인 번거 로움이 없으므로 돋보기 만 있으면됩니다!). 그러나 이것들은 여전히 수동으로 만들어 졌으므로 약 $ 20K의 비용이들 것으로 추정됩니다.
인터넷 기반 솔루션: 데이터를 콜드 저장하는 또 다른 매체는 인터넷을 통해 이루어집니다. 그러나 클라우드 백업 솔루션은 적합하지 않습니다. 클라우드 호스팅 회사가 데이터를 유지하려는 한 오래 살지 못할 수도 있습니다. 다른 이유는 (인터넷을 통해 전송하기 때문에) 백업 속도가 엄청나게 느리다는 사실을 포함하며 대부분의 공급자는 파일을 온라인 상태로 유지하기 위해 시스템에 파일이 있어야한다고 요구합니다. 예를 들어 CrashPlan과 Backblaze는 지난 30 일 동안 컴퓨터에서 한 번 이상 보지 못한 파일을 영구적으로 삭제하므로 외부 하드 드라이브에만 저장 한 백업 데이터를 업로드하려면 플러그를 연결해야합니다. 적어도 한 달에 한 번 USB HDD를 사용하고 클라우드와 동기화하여 카운트 다운을 재설정하십시오. 하나, 일부 클라우드 서비스는 SpiderOak과 같이 카운트 다운없이 파일을 무한정 (물론 지불하는 한) 유지할 수 있도록 제공합니다. 따라서 선택한 클라우드 기반 백업 솔루션의 조건과 사용법에 매우주의하십시오.
클라우드 백업 제공 업체에 대한 대안은 온라인으로 개인 서버를 임대하고 가능한 경우 하드웨어 장애가 발생할 경우 데이터 자동 미러링 / 백업을 사용하는 서버를 선택하는 것입니다 (몇몇은 계약서에서 손실 된 데이터에 대해 보증합니다) 물론 더 비싸다). 이 방법은 먼저 데이터를 소유하고 있기 때문에 두 번째로, 하드웨어 오류를 관리 할 필요가 없기 때문에 호스트의 책임입니다. 언젠가 호스트가 업무를 중단하더라도 데이터를 다시 가져올 수 있습니다 (심야 호스트를 선택하여 밤에 종료되지 않고 사전에 알려 주면 계약서에 요청할 수 있음). 다른 곳으로 다시 호스트하십시오.
개인 온라인 서버를 설정하는 데 어려움을 겪지 않고 여유가 있다면 Amazon은 Glacier 라는 새로운 데이터 아카이빙 서비스를 제공 합니다. 목적은 정확히 데이터를 장기적으로 냉장 저장하는 것입니다. 따라서 빙하에 데이터를 저장하는 데 많은 비용이 들지만이 서비스를 통해 데이터를 저장하지 않기 때문에이 데이터를 다시 가져 오는 데 더 많은 비용이 듭니다. 자주 액세스하려는 데이터를 유지하지 않습니다. 즉,이 서비스는 데이터 쓰기 및 읽기 가격을 인용합니다. 이 서비스는 비용이 많이 들지만 가장 합리적인 데이터의 경우에는 상당한 비용이 될 수 있습니다 (예 : 매우 합리적인 텍스트 파일 또는 이미지가 몇 개있는 경우 이러한 종류의 데이터는 보통 크기가 작기 때문에 빙하에 저장하는 데 많은 비용이 들지 않습니다).
콜드 스토리지의 단점 : 그러나 콜드 스토리지 매체에는 큰 결함이 있습니다. 콜드 스토리지 매체는 데이터의 무결성을 자동으로 확인할 수 없기 때문에 무결성 검사가 없습니다 (그들은 단지 약간의 "치료"하기 위해 오류 수정 체계를 구현할 수 있습니다) 컴퓨터와 달리 파일 시스템을 계산 / 저널링 / 체크 및 수정하는 처리 장치가 없기 때문에 손상이 발생한 후 손상이 발생했지만이를 방지하거나 자동으로 관리 할 수는 없습니다!) 컴퓨터와 여러 저장 장치의 경우 데이터 보관에서 손상이 발생한 경우 (동일한 보관의 사본이 여러 개있는 한) 보관의 무결성을 자동으로 확인하고 필요한 경우 다른 장치에 자동으로 미러링 할 수 있습니다.
장기 보관
현재 사용 가능한 최고의 기술이 있더라도 디지털 데이터는 몇 십 년 (약 20 년) 동안 만 냉장 보관할 수 있습니다. 따라서 장기적으로 콜드 스토리지에만 의존 할 수는 없습니다. 데이터 보관 프로세스에 대한 방법론을 설정하여 향후 (기술 변경이 있더라도) 데이터를 검색 할 수 있도록하고 위험을 최소화해야합니다. 데이터 손실 다시 말해, 데이터 의 디지털 큐레이터 가되어 손상이 발생했을 때이를 복구하고 필요할 때 새 복사본을 다시 만들어야합니다.
확실한 규칙은 없지만 여기에는 몇 가지 확립 된 큐레이팅 전략 , 특히 작업을보다 쉽게 해주는 마법 도구가 있습니다.
- 리던던시 / 복제 원칙 : 리던던시는 엔트로피의 영향을 되돌릴 수있는 유일한 도구이며 , 이는 정보 이론에 기초한 원칙입니다. 데이터를 유지하려면이 데이터를 복제해야합니다. 오류 코드는 정확히 중복 원칙을 자동으로 적용하는 것입니다. 그러나 데이터가 중복되어 있는지 확인해야합니다.: 다른 디스크에있는 동일한 데이터의 여러 사본, 다른 매체에 대한 여러 사본 (내재적 문제로 인해 하나의 매체가 실패하는 경우 다른 매체의 다른 매체도 동시에 실패 할 가능성이 거의 없음) 등 , 엔지니어링에서 3 모듈 중복성이라고도하는 데이터 사본이 항상 3 개 이상 있어야하므로 사본이 손상 될 경우 간단한 과반수의 투표를하여 3 개의 사본에서 파일을 복구 할 수 있습니다. 항상 선원의 나침반 조언을 기억하십시오.
두 개의 나침반을 가져 오는 것은 쓸모가 없습니다. 하나가 잘못되면 어느 쪽이 올바른지 또는 둘 다 잘못되었는지 알 수 없기 때문입니다. 항상 하나의 나침반 또는 3 개 이상을 가져 가십시오.
오류 수정 코드 : 인생을 편하고 데이터를 안전하게 만드는 마술 도구입니다. ECC (오류 수정 코드)는 데이터를 복구하는 데 사용할 수있는 데이터를 생성하는 수학적 구성입니다. ECC는 단순한 복제보다 저장 공간을 적게 사용하여 (예 : 파일의 여러 복사본 만들기) 훨씬 더 많은 데이터를 복구 할 수 있으며 파일이 있는지 확인하는 데 사용될 수 있기 때문에보다 효율적 입니다. 부패, 심지어 그 부패가있는 곳을 찾아. 실제로 이것은 중복성 원칙을 정확히 적용한 것이지만 복제보다 영리한 방식입니다. 이 기술은 현재 4G, WiMax 및 NASA의 우주 통신과 같은 모든 장거리 통신에 광범위하게 사용됩니다. 불행하게도, ECC는 통신 분야에 존재하지만 파일 복구에 포함되어 있지 않습니다. 아마도 약간 복잡하기 때문일 수 있습니다. 그러나 잘 알려진 PAR2, DVD Disaster (광 디스크에 오류 수정 코드를 추가하는 기능) 및 pyFileFixity (PAR2 제한 사항 및 문제를 부분적으로 극복하기 위해 일부 개발 )와 같은 일부 소프트웨어를 사용할 수 있습니다 . 기술적으로 RAID5의 일반화 인 Linux 용 ZFS 또는 Windows 용 ReFS와 같이 선택적으로 Reed-Solomon을 구현하는 파일 시스템도 있습니다.
파일 의 무결성 을 정기적으로 확인하십시오: 파일을 해시하고 수시로 확인합니다 (예 : 연 1 회, 저장 매체 및 환경 조건에 따라 다름). 파일이 손상되었다는 것을 알게되면 생성 한 ECC를 사용하여 복구하거나 새 저장 매체에 새로운 데이터 복사본을 새로 만들어야합니다. 데이터를 확인하고 손상을 복구하고 새로운 복사본을 새로 만드는 것은 데이터를 안전하게 보관할 수있는 아주 좋은 큐 레이션주기입니다. 파일 사본이 자동으로 손상 될 수 있으므로 특히 확인하는 것이 매우 중요하며, 변조 된 사본을 복사하면 파일이 완전히 손상 될 수 있습니다. 이는 데이터의 무결성을 자동으로 확인할 수없는 광 디스크와 같은 냉장 매체의 경우 더욱 중요합니다 (이미 ECC를 구현하여 그러나 새로운 사본을 자동으로 확인하거나 만들 수는 없습니다. 파일 변경 사항을 모니터하기 위해 rfigc.py 스크립트를 사용할 수 있습니다.pyFileFixity 또는 다른 UNIX 도구 md5deep . Hard Drive Sentinel 또는 오픈 소스 smartmontools 와 같은 도구를 사용하여 하드 드라이브와 같은 일부 저장 매체의 상태를 확인할 수도 있습니다 .
홍수 나 화재와 같은 실제 재앙을 피하기 위해 보관 매체 를 다른 장소에 보관 하십시오 (집 밖에서 사본이 하나 이상!). 예를 들어, 작업중인 하나의 광 디스크 또는 클라우드 기반 백업은이 요구 사항을 충족하는 것이 좋습니다 (클라우드 공급자가 언제라도 종료 할 수있는 경우에도 다른 사본이 있으면 안전합니다) 클라우드 제공 업체는 비상시에만 오프 사이트 아카이브로 사용됩니다).
환경 매개 변수가 제어 되는 특정 용기에 보관하십시오 . 광학 매체의 경우 빛을 피하고 습기가없는 방수 상자에 보관하여 습도를 피하십시오. 하드 드라이브 및 sd 카드의 경우, 전자기 슬리브에 보관하여 드라이브를 조작 할 수있는 잔류 전기를 피하십시오. 밀폐 및 방수 백 / 박스에 보관하고 냉동실에 보관할 수도 있습니다. 느린 온도는 엔트로피를 느리게하고 이와 같은 모든 저장 매체의 수명을 상당히 연장 할 수 있습니다 (물이 이겼는지 확인하십시오). 안에 들어 가지 않으면 매체가 빨리 죽습니다).
양질의 하드웨어를 사용 하고 미리 확인하십시오 (예 : SD 카드를 구입할 때 HDD 스캔과 같은 소프트웨어로 전체 카드를 테스트하여 데이터를 쓰기 전에 모든 것이 올바른지 확인하십시오). Frances de France 연구 (실제 DVD 버너는 DVD의 생산량이 훨씬 적음)에서 알 수 있듯이, 품질이 구운 디스크의 품질을 크게 변화시킬 수 있기 때문에 광학 드라이브에 특히 중요합니다.
파일 형식을 신중하게 선택하십시오. 모든 파일 형식이 손상에 대해 탄력적이지는 않지만 일부는 명확하게 약합니다. 예를 들어, .jpg 이미지는 1 바이트 또는 2 바이트 만 변경하여 완전히 손상되어 읽을 수 없습니다. 7zip 아카이브와 동일합니다. 이것은 우스운 일이므로 보관하는 파일의 파일 형식에주의하십시오. 일반적으로 간단한 일반 텍스트가 가장 좋지만 압축해야하는 경우 비 고체 zip을 사용하고 이미지에는 JPEG2 (오픈 소스는 아님)를 사용하십시오. 여기 , 여기 및 여기 에서 프로 디지털 큐레이터에 대한 자세한 정보 및 리뷰 .
데이터를 읽는 데 필요한 모든 소프트웨어 및 사양을 데이터 아카이브와 함께 저장하십시오. 사양이 빠르게 변경되므로 나중에 파일에 액세스 할 수 있어도 더 이상 데이터를 읽을 수 없을 수 있습니다. 따라서 오픈 소스 형식과 소프트웨어를 선호하고 프로그램 소스 코드를 데이터와 함께 저장하여 항상 소스 코드에서 프로그램을 조정하여 새 OS 또는 컴퓨터에서 시작할 수 있도록해야합니다.
여기 , 여기 및 인터넷의 다양한 부분에서 다른 많은 방법과 접근 방법을 사용할 수 있습니다 .
결론
나는 당신이 가질 수있는 것을 사용하는 것이 좋지만 항상 중복 원칙을 존중하고 (4 사본을 만드십시오!) 항상 무결성을 정기적으로 점검하십시오 (따라서 미리 MD5 / SHA1 해시 데이터베이스를 미리 생성해야 함) 손상이 발생한 경우 사본. 그렇게하면 저장 매체가 무엇이든 원하는만큼 기술적으로 데이터를 유지할 수 있습니다. 각 확인 사이의 시간은 저장 매체의 안정성에 따라 다릅니다. 플로피 디스크 인 경우 2 개월마다 확인하고 블루 레이 HTL 인 경우 2/3 년마다 확인하십시오.
이제 최적의 상태에서 냉장 보관을 위해 불투명 불투명 상자에 보관하고 신선한 장소에 보관 하는 Blu-ray HTL 디스크 또는 보관 등급 DVD 디스크를 사용하는 것이 좋습니다. 또한 SD 카드 및 SpiderOak과 같은 클라우드 기반 공급자를 사용하여 중복 데이터 사본 또는 액세스하기 쉬운 하드 드라이브를 저장할 수 있습니다.
많은 오류 수정 코드를 사용하면 하루를 절약 할 수 있습니다. 또한 이러한 ECC 파일의 사본을 여러 개 만들 수 있습니다 (그러나 ECC 파일은 스스로 복구 할 수 있기 때문에 여러 개의 사본이 ECC의 사본보다 중요합니다!).
이 전략은 모두 내가 개발하고있는 도구 세트 (오픈 소스) : pyFileFixity를 사용하여 구현할 수 있습니다 . 이 도구는 실제로 파일 수정을 완전히 관리 할 수있는 무료 도구가 없다는 것을 알게 된 후에이 토론에서 시작되었습니다. 또한 파일 수정 및 디지털 큐 레이션에 대한 자세한 내용은 프로젝트 추가 정보 및 위키를 참조하십시오.
마지막으로, 나는이 문제에 대해 더 많은 R & D가 이루어지기를 정말로 바란다. 이것은 현재의 사회에서 가장 중요한 문제로 점점 더 많은 데이터가 디지털화되었지만이 대량의 정보가 몇 년 이상 지속될 것이라는 보장은 없습니다. 그것은 매우 우울한 일이며, 실제로이 문제는 앞으로 더 많은 것을 넣어야한다고 생각합니다. 그래서 이것은 생성자와 회사가 미래 세대를 위해 지속될 수있는 저장 장치를 만드는 마케팅 지점이됩니다.
/ EDIT : 실용적인 큐 레이션 루틴은 아래를 참조하십시오 .