주어진 웹 사이트의 모든 파일을 archive.org에서 가져오고 싶습니다. 이유는 다음과 같습니다.
- 원래 작성자는 자신의 웹 사이트를 보관하지 않았으며 현재 오프라인 상태입니다. 공개 캐시를 만들고 싶습니다
- 나는 일부 웹 사이트의 원저자이며 일부 내용을 잃어 버렸습니다. 나는 그것을 회복하고 싶다
- ...
어떻게합니까?
archive.org Wayback Machine이 매우 특별하다는 점을 고려하면 웹 페이지 링크는 아카이브 자체를 가리키는 것이 아니라 더 이상 존재하지 않는 웹 페이지를 가리 킵니다. JavaScript는 클라이언트 측에서 링크를 업데이트하는 데 사용되지만 재귀 wget과 같은 트릭은 작동하지 않습니다.
gem install wayback_machine_downloader
. 매개 변수로 검색하려는 웹 사이트의 기본 URL을 사용하여 wayback_machine_downloader를 실행하십시오.wayback_machine_downloader http://example.com
자세한 정보 : github.com/hartator/wayback_machine_downloader