답변:
wget 을 사용 하고 다음과 같은 명령을 실행할 수 있습니다 .
wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com
또는 짧은 옵션으로 :
wget -r -l 1 -nd -nH -A pdf http://example.com
업데이트 : 업데이트에 Windows 7을 실행 중이라고 표시 되어 있으므로 프롬프트 에서 Windows 용 wget을 사용하십시오 cmd
.
업데이트 2 : 그래픽 솔루션의 경우 다른 파일도 가져 오기 때문에 과잉 일 수 있지만 DownThemAll
-w 5
브라우저에서 CTRL+ SHIFT+ J를 누르고 다음을 입력하십시오.
var pdflinks = []; Array.prototype.map. call (document.querySelectorAll ( "a [href $ = \". pdf \ "]"), function (e, i) {if ((pdflinks || []). indexOf (e.href) ==-1) {pdflinks.push (e.href);}}); console.log (pdflinks.join ( ""));
콘솔로 돌아옵니다 :
" /superuser/tagged/somepdf1.pdf " " /superuser/tagged/somepdf2.pdf " " /superuser/tagged/somepdf3.pdf "
이제 wget
명령 행 옵션과 함께 사용wget url1 url2 ...
이것을 복사하여 붙여넣고 콘솔을 연 다음 wget
마우스 오른쪽 버튼을 눌러 클립 보드 내용을 삽입하고 Enter를 누르십시오.
다운로드 파일을 사용하려면 "\ n"으로 행을 결합하고 다음과 같이 매개 변수를 사용하십시오. wget -i mydownload.txt
대부분의 다른 (GUI) 다운로드 프로그램도 공백으로 구분 된 URL 목록으로 호출되도록 허용합니다.
이것이 도움이되기를 바랍니다. 이것이 내가 일반적으로하는 방법입니다. 그래픽 UI가있는 확장보다 빠르고 유연합니다. 배우고 친숙해야합니다.
console.log('"' + pdflinks.join('" "') + '"')
-그렇지 않으면 실제로 인용 된 URL을 얻지 못하는 것입니다
Google 검색 결과에 따라 웹 사이트에서 PDF 링크를 다운로드 할 수있는 Python 도구는 거의 없습니다.
예 :
google_dl
스크립트 (권장).
용법:
./google_dl -s http://www.example.com/ -f pdf ""
gsrchDwn
스크립트 ( 네오의 스크립트를 기반으로 함 ).
용법:
./gsrchDwn.py --query "site:http://www.example.com/" --ftype pdf
참고 : 나는 언급 된 두 스크립트의 관리자입니다.
둘 다 xgoogle
파이썬 라이브러리를 구현하고 있습니다. 이 라이브러리의 포크는 pkrumins/xgoogle
버전을 기반으로합니다 .
관련 : Linux 명령 행에서 웹 검색 .