이 파일을 다운로드하려고합니다 http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
.wget을 다음과 같이 사용하십시오.
wget http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
서버가 쿠키 검사를 사용하기 때문에 동일한 URL에 대해 서로 다른 두 가지 요청을합니다. 첫 번째는 302를, 두 번째는 실제 데이터를 반환합니다.
리눅스를 실행하는 내 vps에서는 이것이 작동하지만 개발 시스템에서는 mac OS 10.9.5에서는 작동하지 않습니다.
이것은 다음에 대한 출력입니다 wget http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
.
내 Mac에서 :
--2015-01-12 15:22:47-- http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
Resolvendo www1.caixa.gov.br (www1.caixa.gov.br)... 200.201.160.210
Conectando-se a www1.caixa.gov.br (www1.caixa.gov.br)|200.201.160.210|:80... conectado.
A requisição HTTP foi enviada, aguardando resposta... 302 Found
Localização: http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip [redirecionando]
--2015-01-12 15:22:48-- http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
Conectando-se a www1.caixa.gov.br (www1.caixa.gov.br)|200.201.160.210|:80... conectado.
A requisição HTTP foi enviada, aguardando resposta... 404 Not Found
2015-01-12 15:22:49 ERRO 404: Not Found.
내 VPS에서 :
--2015-01-12 17:23:43-- http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
Resolving www1.caixa.gov.br (www1.caixa.gov.br)... 200.201.160.210
Connecting to www1.caixa.gov.br (www1.caixa.gov.br)|200.201.160.210|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip [following]
--2015-01-12 17:23:44-- http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
Connecting to www1.caixa.gov.br (www1.caixa.gov.br)|200.201.160.210|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 100675 (98K) [application/x-zip-compressed]
Saving to: 'D_megase.zip.5'
100%[===========================================================================================================================================>] 100,675 142KB/s in 0.7s
2015-01-12 17:23:45 (142 KB/s) - 'D_megase.zip.5' saved [100675/100675]
누구든지 나를 도울 수 있습니까?
이것은 디버그 출력입니다 : https://gist.github.com/NicosKaralis/4407d59e8d0c620fdcbd 당신은 요청이 동일하고 응답에 다른 것이 없음을 분명히 알 수 있습니다
그냥 시도했지만
—
Nicos Karalis
--retry-connrefused
여전히 404 오류가 발생하고 아무것도 저장하지 않고 여전히 404가 발생 --content-on-error
하지만 서버에서 제공하는 404 html은 출력 파일에 저장됩니다.
테스트 할 Mac 이 없어서 죄송 합니다. 두 옵션을 함께 사용해 보셨습니까? 순수 Linux 및 GNU wget v 1.15에서는 옵션이 없어도 작동합니다. 에 보인다 OSX 시스템 같은 버전이 (!). 강제로 실행하면 소스 코드에서 소스 코드를 다운로드하여 컴파일 할 수 있습니다 (아마 새 명령 및
—
Hastur
--static
옵션 포함). 또한 적어도 최신 버전의 wget for mac (1.16) 이있는 것 같습니다 . 시도해 볼 수 있습니다curl -L http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip -o ./D_megase.zip
curl -L
나에게 이것을 제공 curl: (47) Maximum (50) redirects followed
하지만, 통과 -H 'Cookie: security=true'
하면 리디렉션을 중지하는 것처럼 보이지만 Mac 10의 요청 10 개 및 7 404 오류 및 Linux vps의 8 오류와 같이 동작이 너무 불규칙합니다. 내가 차단하는지 확인하는 방법이 있습니까? IP인가?
나는 비슷한 것을 생각하고 있었다 ... 오류가없는 파일을 찾거나 더 나은 방법으로 Mac 에서 프록시를 사용하십시오 . 동일한 VPN에서 더 좋습니다. 그러나 두 시스템 ( mac 및 VPN-Linux ) 에서 동일한 프록시를 사용하는 경우 다른 버전의 문제
—
Hastur
wget
인지 또는 IP 차단 문제인지 확인할 수 있습니다.
wget --retry-connrefused ...
또는 더 나은 시도 했습니까wget --content-on-error ...
?