답변:
페이지를 표시하는 데 필요한 모든 것을 다운로드하지만 다른 페이지는 다운로드하지 않으므로 여기 대신 --page-requisites
( -p
짧게) 를 사용하는 것을 선호하며 -r
원하는 파일 유형에 대해 생각할 필요가 없습니다.
사실 나는 보통 다음과 같은 것을 사용하고 있습니다.
wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
이것은 다음을 의미합니다.
-E
: .html
HTML 파일이지만 끝나지 .html
않거나 유사한 경우 파일 이름에 추가-H
: 다른 호스트에서도 파일 다운로드-k
: 다운로드 후 다운로드 된 파일을 가리 키도록 링크를 변환하십시오.-p
: 적절한 오프라인보기에 필요한 페이지를 다운로드하십시오.-H
, 그리고에 대한 자세한 내용은 행복했다 -E
및 -k
도. 감사!
-r 매개 변수를 사용하면 wget이 이미지를 포함한 전체 폴더를 다운로드 할 수 있어야합니다.
wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
이 명령으로 시작할 수 있다고 생각합니다.
wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
이미지를 저장할 위치와 원하는 파일 형식을 지정할 수 있습니다. 아마도 이미지를 다운로드하는 것이 더 쉽습니다.
출처 :
-r은 재귀 검색을 가능하게합니다. 자세한 내용은 재귀 다운로드를 참조하십시오.
-P는 모든 파일과 디렉토리가 저장되는 디렉토리 접 두부를 설정합니다.
-A는 특정 파일 유형 만 검색하기위한 화이트리스트를 설정합니다. 문자열과 패턴이 허용되며 둘 다 쉼표로 구분 된 목록에서 사용할 수 있습니다 (위 참조). 자세한 내용은 파일 형식을 참조하십시오.
웹 사이트에서 PNG 이미지 파일을 사용하는 것으로 나타났습니다. 폴더에서 복사하면됩니다. 웹 페이지를 저장 한 폴더에서 실행해야합니다.
find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
Wget은 페이지의 HTML 파일에있는 이미지가 URL로 작성되므로 페이지에있는 이미지가 아닌 페이지의 HTML 파일을 다운로드합니다. 원하는 작업을 수행하려면 -R
(재귀), -A
이미지 파일 접미사와 함께 --no-parent
옵션, 오름차순으로 만드는 --level
옵션 및로 옵션을 사용하십시오 1
.
구체적으로 특별히 wget -R -A .jpg,.png,.gif --no-parent --level <url>
또한 대부분의 브라우저 에는 오프라인보기를 위해 페이지를 저장하는 방법이 있습니다.