비즈니스 크리티컬 데이터의 장기 저장


16

이것은 정말 까다로운 기술이며 어느 정도는 기술적 인 문제가 아니며 여기에 속하지 않을 수도 있습니다.

서버 결함은 시스템 관리자를위한 것이며 ... 전문적인 능력으로 컴퓨터를 관리 또는 유지 관리하는 사람

그리고 나는 .. 그리고 이것은 내 임무 중 하나입니다. 어쨌든.

A4의 5000 + 양면 페이지가 있다고 상상해보십시오. 회사 데이터, 모든 비즈니스 크리티컬.
어떻게 든 백업해야합니다. 지금까지 제안 된 솔루션은 다음과 같습니다.

  1. PDF-> 온라인 스토리지
  2. PDF-> DVD / BluRay / 테이프
  3. PDF-> 휴대용 HDD / SSD / 플래시 드라이브.
  4. 대형 복사기를 구입 / 임대 / 대여 / 'Steal'하고 사본을 만드십시오.
  5. ???

위의 문제에 대한 즉각적인 문제 :

  1. 스토리지 파트너가 파산하면 어떻게됩니까?
  2. DVD는 시간이 지남에 따라 부패합니다. 마찬가지로 테이프.
  3. 이것들도 시간이 지남에 따라 휴식을 취합니다.
  4. 비싼. 느린. 무거운. 친절한 나무가 아닙니다.

질문 :

중장기 데이터 보존 및 보관을위한 금본위 제는 무엇입니까? 직장에서 비슷한 문제를 해결 했습니까?

초기로드 후 한 달에 약 100 페이지를 컬렉션에 추가해야합니다. 쉽게 검색 할 수 있어야하지만 드물게 발생합니다.
이상적으로 나는 회사를 떠난 후에도 솔루션이 오랫동안 작동 할 수 있고 유지 관리하기 위해 많은 양이 필요하지 않기 때문에 많은 DVD를 저장하는 것이 이상적이지 않을뿐만 아니라 좋은 장기 솔루션입니다.

종이 사본을 만드는 것이 가장 쉬운 방법은 아니지만 먼 길이 아니라 가장 친환경적이지는 않습니다. 또한 관리하기가 어렵고 검색, 색인 생성 등이 어렵습니다. 무겁고 물리적으로 보관하기가 어렵습니다.

나는 모든 것을 전자적으로 저장한다는 원칙을 매우 좋아하지만, 이것을하는 실제 메커니즘은 투명하고 쉬워야한다. 나는 하루 종일이 일에 대해 책임지고 싶지 않아서 사무실 사용자가 문서를 잃어 버릴 때 지원하고 문서를 잃어 버립니다. 또한 단일 스토리지 공급 업체에 의존하고 싶지 않습니다. Dropbox (온라인 백업 솔루션 ATM이 있지만 Dropbox가 아닙니다)가 파산하거나 그렇지 않으면 재난이 발생할 수있는 상황 누가 그들의 서비스를 사용하고 있습니까?

여기에는 약간의 예산 유연성이 있지만, 현재 온라인 백업 (예 : 2500USD / 년)보다 많은 비용이 드는 것은 침대 밑에 신발 상자에 두는 것보다 호의적 인 것으로 보이지 않을 것입니다. 내가 아무것도하지 않고 내일 사임하면 어떤 일이 일어날 지 의심의 여지가 없습니다.

어떤 아이디어?

-편집하다-

이렇게하는 이유는 두 가지입니다.

1) 사무실이 무너 졌을 때 업무상 중요한 서류를 적절하고 안전하게 백업합니다.

2) 데이터 보관법 WRT 영국 세법 (비즈니스 등)을 만족시키기 위해.

편집 2 :

문서를 색인화하는 메커니즘이 있으면 피의 유용 할 것입니다.


고스트 스크립트와 gocr을 사용하여 PDF-> Txt를 수행하는 빠른 스크립트를 작성했습니다. 데이터에 대한 흥미로운 인덱스를 만들기 위해 모든 것을 SQLlite db로 분출하는 것을 고려하고 있습니다.
Tom O'Connor

디지털 미디어의 중복성과 수년 동안 중복성을 유지하는 것이 가장 친한 친구 일 수 있습니다.
Vortico

답변:


5

데이터를 읽을 수있는 무료 도구가 있기 때문에 데이터를 PDF와 같은 형식으로 유지하는 것이 안전 할 것입니다. 당신이 말하는 데이터의 양은 상당히 작기 때문에 (1,200 페이지 / 년) 300 dpi 스캔 해상도조차도 매년 약 수십 기가 바이트 만 이야기합니다.

그러나 실제 저장 장치 문제는 사라지지 않을 것입니다. 전자 데이터 (테이프, 광학 등)를 저장하는 데 사용하는 미디어는 결국 새로운 미디어로 업데이트해야합니다. 새로운 형식이 기존 형식을 대체함에 따라 새로운 형식으로 "길을 따라 데이터를 걷어차"기위한 계획 및 예산.

데이터가 너무 적기 때문에 광학 미디어를 첫 번째 선택으로 보았을 것입니다. 또한 모든 3 배 사본을 레코딩하고 2-3 년마다 미디어를 새로 고칠 계획입니다.

광학 미디어가 너무 작은 경우 LTO 테이프를 사용하여 4-5 년마다 미디어를 새로 고칩니다. 그러나 적은 양의 데이터에 대해서는 꽤 비쌉니다.


DVD? 아니면 블루 레이? BR이 아직 데이터에 적합한 형식입니까?
톰 오코너

1
@ 톰 오코너 : 그들은 나에게 동일하게 보인다. 그 결정을 내리는 데 비용이 들었습니다. 현재 "아카이브 등급"Blu-Ray 블랭크가 있으므로 기술적 인 관점에서 보면 실용적인 형식으로 보입니다. (Blu-Ray 미디어의 수명이 200 년이라고 말한 제조업체는 보관 DVD 미디어의 수명이 100 년인 "정격 수명"이라고 말한 사람들보다 더 자신감을 얻지 못합니다 ...
Evan Anderson

약 1998 년 정도의 Kodak GOLD CD-R을 가지고 있으며 여전히 읽을 수 있습니다. 나는 또한 염료 층이 분리되어 나사로 조여진 무료를 가지고 있습니다.
톰 오코너

보관 미디어와 비 보관 미디어에는 차이가 없다고 제안하지 않습니다. Blu-Ray 보관 등급 미디어와 DVD 보관 등급 미디어는 나에게 크게 다르지 않다는 것입니다. 보관 등급과 "20.00 달러의 스핀들 100"을 비교하는 것은 완전히 다른 이야기입니다.
Evan Anderson

언급되지 않은 항목 중 하나는 솔리드 스테이트 스토리지 (USB 썸 드라이브)입니다. 광학보다 크고 LTO보다 작습니다. USB는 적어도 10 년 또는 2 년 정도 지속될 것으로 보이며, 16GB 또는 32GB 썸 드라이브 (또는 2, 3)는 아카이빙 비용 측면에서 상당히 저렴합니다. Write-Once-Read-Many가 될 것이기 때문에 SSD 셀이 마모되는 것에 대해 걱정할 필요가 없으므로 이론적으로 내화 금고에 5 년 이상 스틱을 유지할 수 있습니다.
voretaq7

6

내부적으로 DVD를 사용하고 매번 데이터를 새로운 미디어로 마이그레이션하는 특정 시스템이 있습니다. 디지털 보존을 찾아보십시오.

스토리지 요구 사항이 매우 빠르게 증가하므로 몇 년마다 더 새롭고 더 큰 유형의 미디어로 전환하는 것이 좋습니다.

종이 형태로 데이터를 얻는다고 가정하면 다음을 수행해야합니다.

  1. 메일 입력시 데이터를 나열하십시오. 이는 각 시트에 고유 한 바코드를 제공한다는 의미 일 수 있습니다.
  2. 스캔하십시오. 바코드 식별자를 파일 이름으로 사용하십시오. 종이를 보관하십시오.
  3. 데이터를 보관하십시오. 개정 보안 보관 시스템에 데이터를 넣습니다. 쓰기 권한이있는 파일에 파일이있을 수 있으므로 파일 서버가 충분하지 않습니다.
  4. 다른 시스템에서 읽을 수 있도록하십시오.

고객의 경우 온라인 시스템 (SAP)으로 전송해야하는 대기업의 모든 송장입니다. 아카이브 스토리지는 지금까지 여러 차례 반복되었습니다. 현재 그들은 파란 광선으로 움직이고 있습니다.

반면, 요즘에는 모든 것이 디스크에 저장되므로 다음 줄을 따라 이동하는 것이 좋습니다. http://www.eurostor.com/german/iTernity.D.php


대부분의 DVD-R (et al)은 성능이 저하되기 몇 년 전만 지속됩니다. 지침에 따라 보관하면 값 비싼 "보관"항목이 더 오래 지속됩니다.
Chris S

대부분의 디스크, 서버, 파일 시스템 또는 문서 형식도 마찬가지입니다. 보관은 데이터 이동을 의미합니다. 20 년 안에 pdf를 읽으십시오. 10 년 전의 표준이 무엇인지 기억하십니까? 실제로 종이에 가까운 것은 없습니다. 복사하여 붙여 넣기를 제외하고 ...
Posipiet

순수한 텍스트 문서는 여전히 읽을 수 있습니다.
Bart Silverstrim

PDF를 읽을 수있는 무료 도구가 있습니다. 그들이 "일반 바닐라"인 한 나는 너무 걱정하지 않을 것입니다. TIFF도 좋은 옵션입니다.
Evan Anderson

3

솔루션 : PDF로 스캔-> 테이프로 백업

우리는 문서 스캐너를 가지고 있으며 ~ 30 페이지 / 분을 수행하며 OCRed PDF 파일을 생성합니다. 우리는 저장 수명이 50 년에서 100 년 사이 인 테이프 (LTO4)로 백업합니다 (시간 내에 테이프 드라이브를 찾는 것이 어려울 수 있지만 여전히 8 인치 플로피 디스크를 복구 할 데이터 복구 장소가 있습니다).


2
나는 구글 8 "플로피해야했다 ....
Holocryptic

Mac OS 7.5에서 백업 테이프를 유지합니다. 그러나 디스크가 고장 나고 백업 프로그램 미디어가 손실됩니다. Mac을 다시 설치했지만 백업 프로그램이 없기 때문에 테이프를 읽을 수 없습니다. 그리고 솔직히, 나는 그 이름조차 기억하지 못합니다. 예, 테이프는 100 년 동안 지속될 수 있습니다. 그러나 독자는 그렇지 않습니다.
Posipiet

@Holocryptic : 몇 개월 전만해도 미개봉 된 Verbatim 하드 섹터 8 "플로피 디스크 상자를
버렸습니다

1
@Holocryptic : NSFW! NSFW !!
Bart Silverstrim

@Posipiet, 나는 드라이브가 영원하지는 않지만 일반적으로 사용되는 거의 모든 미디어에서 데이터를 복구하는 전문 회사가 있다는 사실을 다루었다고 생각합니다.
Chris S

3

아마존의 새로운 빙하 서비스 는이 분야에서 흥미로운 제안 이라고 생각 합니다.

Amazon Glacier는 자주 액세스하지 않고 몇 시간의 검색 시간에 적합한 데이터에 최적화되어 있습니다. Amazon Glacier를 사용하면 고객은 매월 기가 바이트 당 최소 $ 0.01의 적은 양의 데이터를 안정적으로 저장할 수 있으므로 온 프레미스 솔루션에 비해 크게 절감됩니다.


2
검색 비용은 엄청나게 엄청납니다.
Tom O'Connor

2

1 단계 : 백업 : 문서를 OCR 한 다음 모든 단어를 가톨릭 교회, Opus Dei 및 Templars에 관한 일련의 소설로 재 배열하십시오. 약 10 권의 소설에 대해 충분한 입력 데이터가 있어야하며 매년 약 1 회 이상 계속됩니다. 원본 문서에서 원본 위치 (원본 순서로)라는 단어가 포함 된 조회 테이블을 유지하고 소설의 최종 위치를 유지하십시오. 테이블의 한 항목에 중복 단어를 저장하십시오. 출판 계약을 확보하고 수백만 권의 소설을 출판하십시오. 장부 판매에서 얻은 수입을 사용하여 OCR 및 단어 재정렬 작업에 자금을 지원하십시오. 원본 문서를 파쇄하여 햄스터 침구로 판매하십시오. 입력 문서에 어휘가없는 경우, 십자가에 못박 히기, 반물질 또는 비행기 표를 이국적인 장소로 구매 주문해야 할 수도 있습니다.

2 단계, 복구 / 액세스 : 데이터 사본을 저장할 필요가 없습니다. 조회 테이블과 중고 서점 만 있으면됩니다.

찾아보기 테이블은 단일 실패 지점이므로 여전히 백업해야합니다. 사용 된 허프만 인코딩 체계 덕분에 입력 문서와 비교할 때 크기가 매우 작아 DVD로 복사 될 수 있습니다. 오프 사이트 백업의 경우 로그 화재 앞에 앉아 비디오를 보면서 조회 테이블을 읽습니다. 예술과 기술이 융합 된 비디오 성능을 테이트 모던 갤러리 (Tate Modern Gallery)에 영구적으로 전시합니다.


1

비트 너무 일찍 구입하지만, HDS는 함께 온 것처럼 보인다하는 영구적 인 석영 기반으로 데이터 저장 메커니즘 - 테이크 READ를 .


1
나는 영속성 주장을 여러 번 들었으므로 결코 그것을 믿지 않을 것이며 우리 중 아무도 그것을 입증 할만 큼 오래 살지 않을 것입니다. 영속성 예측 은 절대로 쓸모가 없으며 항상 틀린 것으로 판명됩니다.
John Gardeniers

-2

Humyo.com을 전달해야합니다 (Trend Micro가 인수 함-중간 이름은 보안입니다).

모든 사용자 데이터를 암호화하고 서버는 영국 은행에 보관소에 보관됩니다.

꽤 안전합니다 :)


1
나는 그들이 실제로 영국 은행에 있지 않다 내기. 거기에 방이없고 은행 가로 가득합니다.
Tom O'Connor 17 년 2

5
중간 이름이 bloatware 인 Trend Micro ...
Tom O'Connor

나는 Trend Micro에 동의하지만 그들은 오직 그것을 소유하고, 당신은 Humyo의 소프트웨어로 작동합니다
benhowdle89
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.