웹 사이트에 다운로드 할 수있는 파일 목록


1

특정 웹 사이트에서 다운로드 할 수있는 모든 파일을 나열하는 방법이 있습니까?

내 전형적인 문제는 다음과 같습니다. toto.pdf 자신의 웹 사이트에 다음 종이가 게시되고 저자가 제거 (또는 리디렉션) 링크 그의 파일에 index.html하지만 파일 자체는 공용 폴더에 보관합니다.

그 이름이 toto.pdf 당신은 여전히 ​​그것을 다운로드 할 수 있지만 링크가 없거나 (예를 들어 이름을 잊어 버린 경우) 어떻게 될까요?

답변:


1

Google은 확장을 알고 있다면이 경우 pdf를 사용하여 쿼리를 사용할 수 있습니다.

filetype:pdf site:google.com

google.com은 pdf를 검색하려는 사이트로 바꿉니다.

링크


filetype:pdf site:google.com 더 정확한 결과를 제공한다.
user1055604

1
@ user1055604 완료 :)
HackToHell

감사. 나는이 정도 진행되었지만 당신의 방법은 더 정확합니다. 그러나 이것은 여전히 ​​완벽하지는 않습니다.이 방법으로 숨겨진 .pdf 파일을 발견하는 것은 불가능합니다. 또한 구글 검색은 놀라 울 정도로 일부 사이트에서 많은 PDF 파일을 그리워합니다.
Niels

0

이것은 HTTP 서버가 어떻게 구성되었는지에 따라 달라지며, 이는 (대부분의 HTTPd 하에서) 디렉토리 레벨 및 / 또는 전역 적으로 수행 될 수 있습니다.

서버가 허용하도록 구성된 경우 주소 표시 줄에 주소를 입력하여 특정 디렉토리의 내용을 탐색 할 수 있습니다. 디렉토리의 주소는 동일하지만 (대개 URL 재 작성을 파일의 URL로 남겨 두자) 파일 이름은 표시되지 않습니다. 예를 들어, http://www.example.com/files/Form0123.pdf 에있는 디렉토리에 있습니다. http://www.example.com/files/. 서버가 그렇게하도록 구성된 경우 default index 명시 적 색인 파일이없는 디렉토리가 요청 될 때 페이지. 그만큼 default index 문자 그대로 아무것도 될 수는 없지만 대개 디렉토리 내용의 목록입니다.

디렉토리 URL을 탐색하면 많은 결과 중 하나를 얻을 수 있습니다. 먼저 404 또는 403 오류 메시지가 나타날 수 있습니다.이 경우 서버는 디렉토리에 대한 액세스를 거부하도록 구성됩니다 default index 디렉토리에 대해 색인이 지정되지 않은 경우 다른 설정은 다른 결과를 낳을 것이고, 주어진 URL에 어떤 일이 일어날지를 알 수있는 유일한 방법은 그것을 시도하고 보는 것입니다.


기술적 인 설명에 감사드립니다. 그러나 브라우징이 기본적으로 허용되지 않는 것처럼 보입니다. 매우 자주 .html 파일이 디렉토리의 내용 대신로드됩니다.
Niels
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.