rsync가 동기화를 위해 의미있는 양의 데이터 전송을 저장합니까?
1) zip 파일
2) ASCII 기갑 GPG 암호화 파일
3) Mathematica .mx 파일
각각?
일반적인 시나리오는 이미 오래된 사본이 있고 압축 및 / 또는 암호화 된 파일이 동기화 할 파일이 아니라 압축되지 않은 파일과 암호화되지 않은 파일이 존재할 수 있다는 것입니다.
rsync가 동기화를 위해 의미있는 양의 데이터 전송을 저장합니까?
1) zip 파일
2) ASCII 기갑 GPG 암호화 파일
3) Mathematica .mx 파일
각각?
일반적인 시나리오는 이미 오래된 사본이 있고 압축 및 / 또는 암호화 된 파일이 동기화 할 파일이 아니라 압축되지 않은 파일과 암호화되지 않은 파일이 존재할 수 있다는 것입니다.
답변:
암호화 또는 압축 파일의 문제점은 데이터에서 1 바이트 만 수정하더라도 변경된 데이터 바이트뿐만 아니라 나머지 모든 파일 내용이 다르다는 것입니다.
이것은 rsync가 데이터 전송을 줄이기 위해 사용하는 하나의 전략, 즉 전체 파일이 아닌 파일의 변경된 섹션 만 전송하는 것을 막습니다.
따라서 디스크에 공간이 필요하지 않으면 데이터를 압축하지 마십시오 (이 경우에는 rsync와 같은 응용 프로그램에 투명한 디스크 기반 압축을 사용하십시오).
컴퓨터 (또는 디스크)를 도난 당하거나 분실 한 경우 데이터의 개인 정보를 보호해야하는 경우가 아니면 데이터를 암호화하지 마십시오. 데이터, 특히 암호화 키 또는 복구 키의 백업을 유지하십시오. 또한 전체 디스크 암호화는 rsync 성능에 가장 해로운 영향을 줄 수 있지만 하드 디스크 오류 및 데이터 백업을 사용할 수 없거나 백업을하지 않고 OS를 다시 설치하면 심각한 데이터 손실이 발생할 수 있습니다. 다른 데이터 디스크 / 파티션의 복구 키)
위의 내용은 관련 비 압축 / 언시 텐트 파일이 상당수의 데이터를 변경하지 않은 채 일부 편집 또는 추가를 통해 때때로 부분적으로 변경 될 수 있다고 가정합니다.
하나의 파일 만 재 동기화하고 해당 파일이 암호화 또는 압축 된 경우 변경하지 않는 경우 파일을 전혀 전송할 필요가없는 대역폭 만 절약 할 수 있습니다.
그러나 ZIP 또는 JPEG 또는 GPG 파일로 가득 찬 디렉토리가있는 경우 rsync는 여전히 변경된 파일 만 전송하므로 새 파일 만 쉽게 전송할 수 있습니다.
참고 : 가능하면 압축되지 않은 데이터를 재 동기화하고 필요한 경우 링크의 양쪽에 저장하기 위해 압축하는 것이 유용하다는 것을 알았습니다. 이러한 방식으로 전송 대역폭을 절약 할 수 있습니다. 즉 :
mkdir /tmp/torsync
cd /tmp/torsync
unzip /home/me/somefile.zip
rsync -avz . remote:/tmp/somefile
ssh remote 'zip -r somefile.zip /tmp/somefile'
물론 YMMV.
OT : 백업 옵션을 사용하면 교체 된 파일의 백업 사본을 생성하여 기록 사본을 쉽게 검색 할 수 있으므로 대역폭을 절약하지 않아도 rsync가 유용하다는 것을 알았습니다.
후속 조치 : 이것은 압축 또는 암호화가 관련된 모든 형식에 적용되지만 Mathematica 사용자에게는 익숙하지 않습니다.