새로운 파일 및 변경된 파일 만 인식하는 웹 다운로드 관리자


1

똑똑하고 새롭거나 변경된 크기의 파일 만 덮어 쓰거나 이름을 바꿀 수있는 웹 다운로드 관리자를 찾고 있습니다. 1 년에 몇 번씩 수십에서 수백 기가 바이트에 이르는 파일의 로컬 복사본을 새로 고쳐야합니다.

지금까지 FileZilla와 WinSCP를 사용했는데 로컬 파일 날짜 / 시간 스탬프와 파일 크기를 서버 복사본과 비교하고 다른 항목 만 다운로드하는 기능이 있습니다. 나와 호스트 모두 시간과 시간과 100GB의 대역폭을 절약하는 매우 유용한 기능입니다.

Ftp는 여전히 작동하지만 호스트는 ftp를 4 개의 연결로 제한하고 최대 결합 속도는 ~ 1-2MB / s입니다. http를 통한 동일한 사이트는 8 개의 연결 및 ~ 3-4MB / s 결합 속도로 제한됩니다. ftp를 사용하면 작업을 밤새 실행하고 아침에 일이 어떻게 진행되는지 확인해야합니다 (일부는 일부를 다시 실행할 수 있음). http를 사용하면 변경된 파일 대신 모든 것을 맹목적으로 덮어 쓰고 실수 나 다시 실행하는 경우에도 점심과 약간의 작업을 실행할 수 있습니다.

그렇다면 http 소스에서 변경된 새 파일 만 대량으로 다운로드하는 방법이 있습니까?

Windows를 선호하지만 Linux VM이 가장 좋은 방법이라면 스핀 업 할 수 있습니다.

이것은 "토렌트 없음"방화벽 규칙 세트를 허용하지 않고 시행하는 회사 환경에 있습니다. 너무 나쁘다. 이것은 피어 투 피어 기술의 비웨어 애플리케이션에 대한 완벽한 시나리오이다.

테스트 할 소스 : http://ftp2.cits.rncan.gc.ca/pub/geobase/official/nhn_rhn/

FileZilla의 새 크기 및 변경된 크기 대화 상자 만 덮어 쓰기

답변:


2

이런 건 어때?

wget -Nr -A.zip  http://ftp2.cits.rncan.gc.ca/pub/geobase/official/nhn_rhn/gdb_en/01

@ mattwilkie 흠, 공정 포인트.
Nic Hartley

몇 년 전에 wget을 시도했지만 때로는 아카이브를 손상시키는 문제가 발생했습니다. 가장 좋은 방법은 다른 (더 큰) 파일 크기를 확인한 다음 전체 내용을 덮어 쓰는 대신 새 파일을 기존 파일에 추가하는 것과 관련이 있습니다. 우리는 종종 연결 끊김을 경험했기 때문에이 문제를 수용하기 위해 "불완전한 이력서"다운로드를 사용하는 것을 포기하고 싶지 않았습니다. 그래도 지금 다시 방문해야 할 때입니다.
matt wilkie 19.29에

다음은 wget 시도의 최신 버전입니다. 어쩌면 내 문제는 명령 줄 옵션의 잘못된 혼합에 의한했다 (?) gist.github.com/maphew/0f2f1b4f3659440bae82
매트 윌키

나는 그것이 효과가 있다는 것에 놀랐다. 나는 재귀 적 옵션에 좌절했다. 핵심은 지오베이스 호스트가 색인 생성을 허용한다는 것입니다. 그렇지 않으면 원하는 모든 파일의 경로를 알아야합니다.
snorris

--continue 옵션에 여전히 문제가있는 것 같습니다. 연결이 끊어진 동안 wget 작업을 계속 실행할 수 없으면 운이 좋지 않을 수 있습니다.
snorris
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.