«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

2
Python Pandas 사용자 경고 : 비 연결 축이 정렬되지 않아 정렬 중입니다.
사용자 경고가 표시되는 동안 일부 코드 연습을 수행하고 데이터 프레임 병합을 적용하고 있습니다. /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201 : FutureWarning : 비 연결 축이 정렬되지 않아 정렬 중입니다. 이후 버전의 Pandas는 기본적으로 정렬되지 않도록 변경됩니다. 향후 동작을 수락하려면 'sort = True'를 전달하십시오. 현재 동작을 유지하고 경고를 무시하려면 sort = False를 전달하십시오. 이 코드 줄에서 …
94 python  pandas 

1
3 자리 숫자에 대한 히트 맵의 과학적 표기법을 보여주는 Seaborn
다음과 같이 pandas pivot_table에서 히트 맵을 만듭니다. table2 = pd.pivot_table(df,values='control',columns='Year',index='Region',aggfunc=np.sum) sns.heatmap(table2,annot=True,cmap='Blues') 아래와 같이 히트 맵을 생성합니다. 숫자가 크지는 않지만 (최대 750) 과학적 표기법으로 표시됩니다. 테이블 자체를 보면 이것은 사실이 아닙니다. 일반 표기법으로 숫자를 표시하는 방법에 대한 아이디어가 있습니까?


6
Pandas의 크고 지속적인 DataFrame
저는 오랜 SAS 사용자로서 파이썬과 판다로의 전환을 모색하고 있습니다. 그러나 오늘 몇 가지 테스트를 실행할 때 pandas.read_csv()128MB csv 파일을 시도 할 때 파이썬의 메모리가 부족하다는 사실에 놀랐습니다 . 약 200,000 개의 행과 200 개의 열이 주로 숫자 데이터로 구성되었습니다. SAS를 사용하면 csv 파일을 SAS 데이터 세트로 가져올 수 있으며 내 …
93 python  pandas  sas 

5
같은 그림에 다른 DataFrame을 플로팅합니다.
다음과 같은 형식으로 수년간의 온도 기록이있는 온도 파일이 있습니다. 2012-04-12,16:13:09,20.6 2012-04-12,17:13:09,20.9 2012-04-12,18:13:09,20.6 2007-05-12,19:13:09,5.4 2007-05-12,20:13:09,20.6 2007-05-12,20:13:09,20.6 2005-08-11,11:13:09,20.6 2005-08-11,11:13:09,17.5 2005-08-13,07:13:09,20.6 2006-04-13,01:13:09,20.6 매년 기록의 숫자와 시간이 다르므로 pandas datetimeindices는 모두 다릅니다. 비교를 위해 동일한 그림에 다른 연도의 데이터를 플로팅하고 싶습니다. X 축은 1 월 ~ 12 월이고 Y 축은 온도입니다. 이 작업을 어떻게해야합니까?

6
Ipython 노트북의 루프에서 플롯을 동적으로 업데이트하는 방법 (한 셀 내에서)
환경 : Python 2.7, matplotlib 1.3, IPython 노트북 1.1, linux, chrome. 코드는 하나의 단일 입력 셀에 있습니다.--pylab=inline IPython 노트북과 팬더를 사용하여 스트림을 소비하고 5 초마다 플롯을 동적으로 업데이트하고 싶습니다. print 문을 사용하여 데이터를 텍스트 형식으로 인쇄하면 완벽하게 작동합니다. 출력 셀은 데이터를 계속 인쇄하고 새 행을 추가합니다. 그러나 데이터를 플롯 한 …


4
날짜별로 Pandas 데이터 프레임 정렬
다음과 같이 팬더 데이터 프레임이 있습니다. Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 나는 그것을 기준으로 정렬하고 Date싶지만 열은 단지 object. 열을 날짜 개체로 만들려고했지만 해당 형식이 필요한 형식이 아닌 문제가 발생했습니다. 필요한 형식은 2015-02-20,등 입니다 . 이제 저는 numpy가 '미국식'날짜를 ISO 표준으로 변환하여 날짜 개체를 만들어 정렬 할 …
93 python  pandas 

6
팬더 그룹 별 누적 합계
Pandas 데이터 프레임에 누적 합계 열을 추가하여 다음을 수행하고 싶습니다. name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 된다 : Jack | …
93 python  pandas 

4
Pandas Merge-열 중복을 방지하는 방법
두 데이터 프레임 간의 병합을 시도하고 있습니다. 각 데이터 프레임에는 두 가지 인덱스 수준 (날짜, cusip)이 있습니다. 예를 들어 열에서 일부 열은 둘 (통화, 조정 날짜)간에 일치합니다. 인덱스별로 병합하는 가장 좋은 방법은 무엇입니까?하지만 두 개의 통화 및 수정 날짜를 사용하지 않는 것입니다. 각 데이터 프레임은 90 개 열이므로 모든 것을 …
93 python  pandas 

6
Pandas 시리즈를 DataFrame으로 변환
팬더 시리즈 SF가 있습니다. email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] 그리고 그것을 다음 DataFrame으로 변환하고 싶습니다. index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, 0.0] 1 | …


2
Python Pandas : 그룹 별 및 평균?
다음과 같은 데이터 프레임이 있습니다. cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 클러스터 당 조직 당 평균 시간을 계산하고 싶습니다. 예상 결과: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 나는 판다에서 그것을하는 방법을 …
92 python  pandas  group-by  mean 

11
데이터 프레임을 여러 데이터 프레임으로 분할
실험 데이터 (응답자 60 명)가 포함 된 매우 큰 데이터 프레임 (약 1 백만 행)이 있습니다. 데이터 프레임을 60 개의 데이터 프레임 (각 참가자에 대한 데이터 프레임)으로 나누고 싶습니다. 데이터 프레임 data에는 'name'각 참가자의 고유 코드 인 라는 변수 가 있습니다. 다음을 시도했지만 아무 일도 일어나지 않습니다 (또는 실행이 한 …

2
Pandas Groupby 값 범위
pandas에서 groupby값 증가 범위 를 호출하는 쉬운 방법이 있습니까? 예를 들어 아래 예제에서 열 B을 비닝하고 그룹화 할 수 있습니다. 예를 들어 열의 0.155처음 두 그룹 B은 '0-0.155, 0.155-0.31 ...' import numpy as np import pandas as pd df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)}) A B 0 0.383493 0.250785 1 0.572949 0.139555 2 0.652391 0.401983 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.