미국과 캐나다에 중점을 둔 프로젝트의 과거 원시 날씨 데이터는 어디에서 찾을 수 있습니까? 나는 주로 온도가 필요하지만 다른 세부 사항은 좋을 것입니다. 이 데이터를 찾는 데 매우 어려움을 겪고 있습니다. 날씨 사이트를 긁어 내고 싶지 않습니다.
답변:
미국 국립 심한 폭풍 연구소 과거 기상 데이터 아카이브 (참고 : 이후 폐기되었습니다).
또한 미국 국립 기후 데이터 센터 지리 데이터 포털 .
미국 국가 기후 데이터 센터 기후 데이터 온라인 .
미국 국립 기후 데이터 센터에서 가장 인기있는 제품 .
저도이 같은 질문을하고 있다는 것을 알게되었고 향후 Google 직원들에게 제 경험을 공유 할 것입니다.
나는 원시 데이터를 원했고 그 중 많은 것 ... API는 할 수 없습니다. 소스로 직접 가야했습니다. 모든 데이터에 대한 최상의 소스는 NCEP 또는 NCDC NOMADS 서버 인 것 같습니다.
http://nomads.ncdc.noaa.gov/dods/ <-과거 데이터에 적합
http://nomads.ncep.noaa.gov/dods/ <-최근 데이터에 적합
(참고 : 한 댓글 작성자가 http 대신 https를 사용해야한다고 말했습니다. 아직 테스트하지는 않았지만 문제가있는 경우 시도해보세요!)
데이터의 양에 대한 아이디어를 제공하기 위해 데이터는 1979 년까지 거슬러 올라갑니다! 캐나다와 미국을 찾고 있다면 북미 지역 재분석 데이터 세트가 가장 좋은 답일 것입니다.
나는 큰 파이썬 사용자이고 pydap 또는 NetCDF 는 사용하기에 좋은 도구처럼 보였습니다. 특별한 이유없이 pydap을 가지고 놀기 시작했습니다.
nomads 웹 사이트에서 특정 위치에 대한 모든 온도 데이터를 얻는 방법에 대한 예제를 제공하려면 Python에서 다음을 시도하십시오.
from pydap.client import open_url
# setup the connection
url = 'http://nomads.ncdc.noaa.gov/dods/NCEP_NARR_DAILY/197901/197901/narr-a_221_197901dd_hh00_000'
modelconn = open_url(url)
tmp2m = modelconn['tmp2m']
# grab the data
lat_index = 200 # you could tie this to tmp2m.lat[:]
lon_index = 200 # you could tie this to tmp2m.lon[:]
print tmp2m.array[:,lat_index,lon_index]
위의 스 니펫은 1979 년 1 월 전체 한 달 동안의 시계열 (3 시간마다) 데이터를 제공합니다! 여러 위치 또는 모든 달이 필요한 경우 위의 코드를 쉽게 수정할 수 있습니다.
나는 거기에서 멈추는 것이 행복하지 않았습니다. 저는이 데이터를 SQL 데이터베이스에 저장하여 쉽게 슬라이스하고 다듬을 수 있기를 원했습니다. 이 모든 작업을 수행하기위한 훌륭한 옵션은 파이썬 예측 모듈입니다.
공개 : 모듈 뒤에 코드를 모았습니다. 코드는 모두 오픈 소스입니다. 필요에 맞게 수정하거나 (아마도 화성에 대해 예측하고 있습니까?) 프로젝트에 대한 작은 조각을 가져올 수 있습니다.
내 목표는 Rapid Refresh 모델 에서 최신 예측을 가져올 수있는 것이 었습니다 (현재 날씨에 대한 정확한 정보를 원하는 경우 최선의 선택).
from forecasting import Model
rap = Model('rap')
rap.connect(database='weather', user='chef')
fields = ['tmp2m']
rap.transfer(fields)
그런 다음 좋은 'ole USA'의지도에 데이터를 플로팅합니다.
플롯의 데이터는 SQL에서 직접 가져 왔으며 원하는 모든 유형의 데이터를 얻기 위해 쿼리를 쉽게 수정할 수 있습니다.
위의 예가 충분하지 않으면 더 많은 예를 찾을 수있는 설명서를 확인하세요.
share my experience for future Googlers
<-이 미래의 Google
wunderground.com에는 좋은 API가 있습니다. 하루 500 통화 무료입니다.