wget을 사용하여 html 파일을 다운로드했습니다. 파일의 이미지는 어디에 저장됩니까?


15

Firefox는 매우 느리게로드되므로 wgetHTML 파일을 저장하는 데 사용 하기 로 결정했습니다 .

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

파일이 내 홈 폴더에 저장되었지만 이미지가 저장된 위치를 모르겠습니다.에서 사용할 파일이 필요합니다 Anki.

이미지는 어디에 저장됩니까?


이 기사 에서는 옵션과 유용한 방법에 대해 설명합니다.
Wilf

답변:


34

페이지를 표시하는 데 필요한 모든 것을 다운로드하지만 다른 페이지는 다운로드하지 않으므로 여기 대신 --page-requisites( -p짧게) 를 사용하는 것을 선호하며 -r원하는 파일 유형에 대해 생각할 필요가 없습니다.

사실 나는 보통 다음과 같은 것을 사용하고 있습니다.

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

이것은 다음을 의미합니다.

  • -E: .htmlHTML 파일이지만 끝나지 .html않거나 유사한 경우 파일 이름에 추가
  • -H: 다른 호스트에서도 파일 다운로드
  • -k: 다운로드 후 다운로드 된 파일을 가리 키도록 링크를 변환하십시오.
  • -p: 적절한 오프라인보기에 필요한 페이지를 다운로드하십시오.

나는이 찾고있는 사람이 여기 온 -H, 그리고에 대한 자세한 내용은 행복했다 -E-k도. 감사!
Charles Clayton

2

-r 매개 변수를 사용하면 wget이 이미지를 포함한 전체 폴더를 다운로드 할 수 있어야합니다.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

이미지 파일도 별도로 다운로드

이 명령으로 시작할 수 있다고 생각합니다.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

이미지를 저장할 위치와 원하는 파일 형식을 지정할 수 있습니다. 아마도 이미지를 다운로드하는 것이 더 쉽습니다.

출처 :

-r은 재귀 검색을 가능하게합니다. 자세한 내용은 재귀 다운로드를 참조하십시오.

-P는 모든 파일과 디렉토리가 저장되는 디렉토리 접 두부를 설정합니다.

-A는 특정 파일 유형 만 검색하기위한 화이트리스트를 설정합니다. 문자열과 패턴이 허용되며 둘 다 쉼표로 구분 된 목록에서 사용할 수 있습니다 (위 참조). 자세한 내용은 파일 형식을 참조하십시오.

폴더에서 이미지 파일 복사

웹 사이트에서 PNG 이미지 파일을 사용하는 것으로 나타났습니다. 폴더에서 복사하면됩니다. 웹 페이지를 저장 한 폴더에서 실행해야합니다.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget은 페이지의 HTML 파일에있는 이미지가 URL로 작성되므로 페이지에있는 이미지가 아닌 페이지의 HTML 파일을 다운로드합니다. 원하는 작업을 수행하려면 -R(재귀), -A이미지 파일 접미사와 함께 --no-parent옵션, 오름차순으로 만드는 --level옵션 및로 옵션을 사용하십시오 1.

구체적으로 특별히 wget -R -A .jpg,.png,.gif --no-parent --level <url>

또한 대부분의 브라우저 에는 오프라인보기를 위해 페이지를 저장하는 방법이 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.