wget을 사용하여 문서 본문과 헤더를 stdout에 출력하려고합니다. wget -S -O - http://google.com
그러나 그것은 html 문서만을 보여줍니다.
감사
UPD :
일했다 wget --save-headers --output-document - http://google.com
wget --version
GNU Wget 1.11.4 수정 된 Red Hat 표시
wget을 사용하여 문서 본문과 헤더를 stdout에 출력하려고합니다. wget -S -O - http://google.com
그러나 그것은 html 문서만을 보여줍니다.
감사
UPD :
일했다 wget --save-headers --output-document - http://google.com
wget --version
GNU Wget 1.11.4 수정 된 Red Hat 표시
답변:
추가 헤더없이 다음을 시도하십시오.
wget -qO- www.google.com
후행 -
. 이것은 -O
파일로 이동하기 위한 일반적인 명령 인수의 일부 이지만 파일을 지정하는 데 사용하지 않기 >
때문에 쉘로 이동합니다. 당신은 사용할 수 있습니다 -qO-
또는 -qO -
.
-S
옵션은 내 alpine
Linux 컨테이너 에서 지원되지 않았습니다 . 나는 그것을 생략하고 모든 좋았다
wget -S -O - http://google.com
예상대로 작동 하지만 주의해야합니다. 헤더는 디버깅 정보로 간주 되어 표준 출력이 아닌 표준 오류 로 전송됩니다 . 표준 출력을 파일이나 다른 프로세스로 리디렉션하는 경우 문서 내용 만 가져옵니다.
가능한 해결책으로 표준 오류를 표준 출력으로 리디렉션 할 수 있습니다. 예를 들면 다음과 bash
같습니다.
$ wget -q -S -O - 2>&1 | grep ...
또는
$ wget -q -S -O - 1>wget.txt 2>&1
이 -q
옵션은 진행률 표시 줄과 다른 성가 시게 수다스러운 wget
출력 부분을 억제합니다 .
-S
옵션은 내 alpine
Linux 컨테이너 에서 지원되지 않았습니다 . 나는 그것을 생략하고 모든 좋았다
apk add wget
. 그렇지 않으면 busybox 버전 만 사용됩니다.
여기에서 작동합니다.
$ wget -S -O - http://google.com
HTTP request sent, awaiting response...
HTTP/1.1 301 Moved Permanently
Location: http://www.google.com/
Content-Type: text/html; charset=UTF-8
Date: Sat, 25 Aug 2012 10:15:38 GMT
Expires: Mon, 24 Sep 2012 10:15:38 GMT
Cache-Control: public, max-age=2592000
Server: gws
Content-Length: 219
X-XSS-Protection: 1; mode=block
X-Frame-Options: SAMEORIGIN
Location: http://www.google.com/ [following]
--2012-08-25 12:20:29-- http://www.google.com/
Resolving www.google.com (www.google.com)... 173.194.69.99, 173.194.69.104, 173.194.69.106, ...
...skipped a few more redirections ...
[<=> ] 0 --.-K/s
<!doctype html><html itemscope="itemscope" itemtype="http://schema.org/WebPage"><head><meta itemprop="image" content="/images/google_favicon_128.png"><ti
... skipped ...
wget ( ~$ wget --version
GNU Wget 1.14 built on linux-gnu.
) 을 업데이트해야 할 수도 있습니다.
이것은 헤더로 응답을 인쇄하는 데 도움이되었습니다.
wget --server-response http://www.example.com/
--spider
arg 를 추가 할 수 있습니다 . 이 유용한 원인은 페이지 콘텐츠를 다운로드하지 않습니다.
작동하지 않습니다.
wget -q -S -O - google.com 1>wget.txt 2>&1
리디렉션은 오른쪽에서 왼쪽으로 평가되므로 html을 wget.txt로, 헤더를 STDOUT으로 보냅니다.
wget -q -S -O - google.com 2>&1 1>wget.txt
--save-headers
실제로이었다-save-headers