Unix 시간을 Pandas 데이터 프레임에서 읽을 수있는 날짜로 변환


110

유닉스 시간과 가격이 포함 된 데이터 프레임이 있습니다. 사람이 읽을 수있는 날짜로 표시되도록 인덱스 열을 변환하고 싶습니다.

그래서 예를 들어 나는이 date같은 1349633705인덱스 열의하지만 난 그게로 표시 할 것 10/07/2012(또는 적어도 10/07/2012 18:15).

어떤 맥락에서 내가 작업중인 코드와 이미 시도한 코드는 다음과 같습니다.

import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)   
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates 
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date   

보시다시피 df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))문자열이 아닌 정수로 작업하기 때문에 작동하지 않는 여기를 사용하고 있습니다. 나는 내가 사용해야한다고 생각 datetime.date.fromtimestamp하지만 이것을 전체에 적용하는 방법을 잘 모르겠습니다 df.date.

감사.

답변:


221

이것은 epoch 이후 몇 초로 보입니다.

In [20]: df = DataFrame(data['values'])

In [21]: df.columns = ["date","price"]

In [22]: df
Out[22]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date     358  non-null values
price    358  non-null values
dtypes: float64(1), int64(1)

In [23]: df.head()
Out[23]: 
         date  price
0  1349720105  12.08
1  1349806505  12.35
2  1349892905  12.15
3  1349979305  12.19
4  1350065705  12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')

In [26]: df.head()
Out[26]: 
                 date  price
0 2012-10-08 18:15:05  12.08
1 2012-10-09 18:15:05  12.35
2 2012-10-10 18:15:05  12.15
3 2012-10-11 18:15:05  12.19
4 2012-10-12 18:15:05  12.15

In [27]: df.dtypes
Out[27]: 
date     datetime64[ns]
price           float64
dtype: object

1
그리고 0.13에서는 read_json 때 date_unit을 사용할 수 있습니다. : D
Andy Hayden

큰! 귀하의 솔루션은 완벽합니다. Pandas : Timestamps변환하는 과정이 꽤 잘 진행됩니다. 이제 to_datetime에 대해서도 알고 있습니다.
WA Carnegie

또 다른 요점. 이것은 0.11에서 나를 위해 작동하지만 잘 0.12+에서하지 않았다
워싱턴 카네기

1
이 솔루션은 나에게 제공합니다 OverflowError: Python int too large to convert to C long.
__name__이 None이면

2
신경 쓰지 마세요. 밀리 초 타임 스탬프가 있고 lambda x: x/1000.0, 또는 unit='ms'.
__name__은 아무도없는 경우

48

다음을 사용하려는 경우 :

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))

오류가 발생합니다.

"pandas.tslib.OutOfBoundsDatetime : 's'단위로 입력을 변환 할 수 없습니다."

이는이 DATE_FIELD초 단위로 지정되지 않음을 의미합니다 .

제 경우에는 밀리 초였습니다 EPOCH time.

변환은 다음을 사용하여 작동했습니다.

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms')) 

15

우리가 수입 가정 pandas as pddf우리의 dataframe입니다

pd.to_datetime(df['date'], unit='s')

나를 위해 작동합니다.


0

또는 위 코드의 줄을 변경하여 :

# df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.date = df.date.apply(lambda d: datetime.datetime.fromtimestamp(int(d)).strftime('%Y-%m-%d'))

또한 작동합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.