오프라인으로 사이트를 보는 웹 사이트 다운로더 (캐시?)


9

오프라인에서 볼 수 있도록 웹 사이트의 모든 페이지를 다운로드하거나 캐시 할 수있는 이식 가능한 방법이 있습니까? 나는 내일 크로스 컨트리 비행을하고 있으며, 몇 개의 웹 페이지 (특히 python doc 페이지 ( http://docs.python.org/ ) 및 pyqt 참조 ( http : // www. )를 캐시 할 수 있기를 바랍니다 . riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

이상적으로는 Firefox 애드온이나 그와 비슷한 것을 원하지만 Linux에서 실행할 수 있으면 아무 문제가 없습니다.


답변:


15

HTTrack을 사용 합니다.

인터넷에서 로컬 디렉토리로 월드 와이드 웹 사이트를 다운로드하여 재귀 적으로 모든 디렉토리를 작성하고 HTML, 이미지 및 기타 파일을 서버에서 컴퓨터로 가져옵니다.


나는 이것을 과거의 멋진 무료 솔루션으로 사용했습니다.
MaQleod

1
나는 그것을 사랑 ... HTTrack는 모두 리눅스와 윈도우에 가장 적합하고 다운로드 프로세스를 구성하는 옵션의 거대한 목록이 있습니다
eslambasha

나도 그것을 사용했다; 그들은 이제 안드로이드 버전도 제공합니다.
gparyani

-1 "모든 디렉토리"를 빌드하지는 않으며 "이미지 및 기타 파일"을 모두 얻지는 않습니다. 링크 된 항목 만 가져옵니다.
barlop

6

이러한 옵션과 함께 wget을 사용하여 오프라인 사용을 위해 사이트를 미러링합니다.

wget -cmkE -np http://example.com/a/section/i/like

어디

-m은 사이트를 로컬로 미러링하기위한 미러링 옵션을 설정합니다.

-c 이미 일부 페이지를 다운로드 한 경우 이전 다운로드를 계속합니다

-k는 오프라인보기를 위해 절대 href를 로컬 것을 가리 키도록 변환합니다.

-E는 다운로드 후 파일의 확장자가 .html인지 확인합니다.

-np는 / a / section / i / 아래의 개체 만 다운로드하며 전체 사이트를 캐시하지 않습니다.

예를 들어 남쪽 문서는 다운로드하지 않고 남쪽 문서는 다운로드하지 않았습니다.

wget -cmkE -np http://south.aeracode.org/docs/index.html

Windows를 사용하고 cygwin에서 wget을 실행하지만 기본 Windows wget 포트도 있습니다.

귀하의 경우 파이썬 문서 섹션 에서 파이썬 오프라인 문서를 다운로드 할 수 있지만


1

http://www.downthemall.net/ Firefox 플러그인을 사용해보십시오 . 이 파일을 사용하여 20 개 이상의 개별 파일로 250 페이지의 PDF를 다운로드했습니다. 매우 강력합니다. 여기에는 와일드 카드 / 쿼리 구문이있어 원하는 파일 만 수술 적으로 가져올 수 있으며 관련없는 파일은 얻을 수 없습니다.


1

내가 아는 일부 Firefox 확장 프로그램 :

  • 스크랩북

    웹 페이지를 저장하고 컬렉션을 쉽게 관리 할 수 ​​있습니다. 주요 기능은 가벼움, 속도, 정확성 및 다국어 지원입니다. 주요 특징은 다음과 같습니다.

    • 웹 페이지 저장
    • 웹 페이지의 스 니펫 저장
    • 웹 사이트 저장
    • 북마크와 같은 방식으로 컬렉션 구성
    • 컬렉션의 전체 텍스트 검색 및 빠른 필터링 검색
    • 수집 된 웹 페이지 편집
    • Opera의 노트와 유사한 텍스트 / HTML 편집 기능
  • 스크랩북 플러스

    ScrapBook Plus와 ScrapBook의 차이점 :

    • 빠른 정렬
    • 빠른 가져 오기 및 내보내기
    • 사이드 바에서 직접 컬렉션을 관리 할 수있는 창을 엽니 다
    • "결합 마법사"처리를 단순화
    • "여러 URL 캡처"에 대한 새로운 기능 (링크 제외 필터, 웹 사이트 제목 또는 링크 제목을 사이드 바 항목의 새 제목으로 사용, 다운로드 간격을 0에서 3 초 사이로 지정, UTF-8 사용) 또는 문자 집합으로 ISO-8859-1)
    • 새로운 "캡처"창 (다운로드는 수동으로 시작해야하며 자동 스크롤 기능이 해제되어 있음)
    • 편집기의 형광펜 6 개
  • UnMHT

    MHT (MHTML) 웹 아카이브 형식 파일을보고 텍스트 및 그래픽을 포함한 전체 웹 페이지를 단일 MHT 파일로 저장할 수 있습니다

  • 포켓 (확장자가 아닌 내장 Firefox 기능)

    한 번의 클릭으로 웹 페이지와 비디오를 Pocket에 저장할 수 있습니다. Pocket은 혼란을 없애고 페이지를 깨끗하고 산만하게 볼 수있게 해주 며 Pocket 앱을 통해 이동 중에도 페이지에 액세스 할 수 있습니다.

    참고 :

    Firefox에서 포켓 목록을 저장하고 액세스하려면 인터넷에 연결되어 있어야합니다. Pocket 앱이있는 다른 장치에서 오프라인으로 볼 수 있습니다.


0

wget을 사용하여 전체 웹 사이트 또는 웹 사이트의 일부를 다운로드 할 수 있습니다.

wget -r http://docs.python.org/

대역폭 사용 제한, 재귀 수준 제어, 제외 목록 설정 등과 같은 다른 옵션에 대해서는 wget 매뉴얼을 확인하십시오.

오프라인 브라우징에 대한 또 다른 방법은 캐싱 프록시를 사용하는 것입니다. Wwwoffle 은 서버 지정 만료 날짜에 대한 재정의 및 재귀 프리 페칭 기능과 같은 오프라인 탐색을위한 보존을 용이하게하는 많은 기능을 가진 기능입니다. (전화 접속일 이후 wwwoffle을 사용하고 있습니다.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.