wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
다운로드중인 tar
파일은 웹 서버의 동적 링크에서 제공 하는 아카이브 (이진 파일)입니다. wget
일반적으로 사용하는 URL의 일부를 사용하여 파일을 저장하지만이 경우 REST API 끝점 (또는 비슷한 것)이므로 이름이 다루기가 쉽지 않습니다 (여전히 유효한 이름이 될 것입니다. 파일 내용은 동일합니다).
그러나이 경우 서버는 실제 파일 이름이 포함 된 "Content Disposition"헤더를 제공하며이 옵션 wget
을 사용하면 사용할 수 --content-disposition
있습니다. 이 옵션은에 대한 내 설명서에서 "실험"으로 표시되어 있습니다 wget
.
또한 쉘에서 &
및 ?
문자를 해석하지 않도록 URL을 인용해야 합니다.
다음을 사용하는 것과 동등한 것 curl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
또는 동등한 긴 옵션을 사용하십시오.
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
파일을 다운로드 한 후 압축을 풀어야합니다.
tar -xvf GSE48191_RAW.tar
이 특정 아카이브가 생성 된 방식으로 인해 아카이브의 파일을 현재 디렉토리에 압축 해제합니다 (따라서 새 디렉토리를 작성하고 아카이브를 이동하고 압축을 풀면 좋습니다). 이 아카이브의 파일은 gzip
압축 된 CEL
파일입니다.