답변:
분명히 AWS 계정을 보유하고 있으므로 다음을 권장합니다.
wget http://example.com/my_large_file.csv
.. s3cmd
파일을 S3에 업로드하는 데 사용 합니다. 예를 들면 다음과 같습니다.s3cmd cp my_large_file.csv s3://my.bucket/my_large_file.csv
다양한 AWS 서비스간에 이루어진 연결은 AWS의 내부 네트워크를 활용하므로 EC2 인스턴스에서 S3로 업로드하는 것이 매우 빠릅니다. 자신의 컴퓨터에서 업로드하는 것보다 훨씬 빠릅니다. 이렇게하면 파일을 컴퓨터로 다운로드하지 않아도되고 웹 인터페이스를 통해 파일을 업로드하는 데 상당한 시간을 절약 할 수 있습니다.
충분한 스토리지로 EC2 인스턴스 시작
인스턴스에 ssh
로컬 머신에서 다운로드에 해당하는 curl 명령을 얻습니다. Google 크롬-> 네트워크 탭-> 복사-> 컬로 복사의 개발자 옵션을 사용할 수 있습니다 (이 단계는 kaggle과 같은 인증이 필요한 일부 웹 사이트에 필요합니다)
인스턴스 터미널에서 curl
명령을 실행하십시오 ( 명령에 추가 -o output_file
). 파일을 다운로드하여 저장합니다
인스턴스를 s3에 연결 aws config
하도록 AWS 자격 증명을 구성합니다 (한 가지 방법은 명령 사용 , AWS 액세스 키 ID 및 비밀 제공).
이 명령을 사용하여 파일을 s3에 업로드하십시오.
aws s3 cp path-to-file s3://bucket-name/
Aws documentation : http://aws.amazon.com/code를 참조하십시오 . 대부분의 프로그래밍 언어에 사용 가능한 라이브러리가 있습니다. 따라서 버킷을 생성하고 코드에서 URL에서 데이터를 가져 와서 S3에서이 버킷에 쓰도록 구성 할 수 있습니다.
예를 들어 파이썬에서 :
from boto.s3.key import Key
k = Key(bucket)
k.key = 'foobar'
k.set_contents_from_string(url_data)