«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

6
Pandas의 여러 데이터 프레임 열에서 "고유 한 선택"방법은 무엇입니까?
SQL과 동등한 작업을 수행하는 방법을 찾고 있습니다. SELECT DISTINCT col1, col2 FROM dataframe_table pandas SQL 비교에는 distinct. .unique() 단일 열에서만 작동하므로 열을 연결하거나 목록 / 튜플에 넣고 그런 방식으로 비교할 수 있다고 가정합니다. 그러나 이것은 팬더가 좀 더 네이티브 방식으로해야하는 것처럼 보입니다. 나는 명백한 것을 놓치고 있습니까, 아니면 이것을 할 …
101 python  pandas 

8
Pandas는 날짜 히스토그램을 그릴 수 있습니까?
내 시리즈를 가져와 dtype =의 datetime 열로 강제 적용했습니다 datetime64[ns](일일 해상도 만 필요하지만 변경 방법은 확실하지 않음). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) 하지만 플로팅이 작동하지 않습니다. ipdb> column.plot(kind='hist') *** TypeError: ufunc add cannot use operands with types dtype('<M8[ns]') and dtype('float64') 주, …

2
'DataFrame'개체에 'sort'속성이 없습니다.
여기에 몇 가지 문제가 있습니다. 파이썬 패키지에서 numpy를 설치했지만 여전히이 오류 가 있습니다 .'DataFrame '객체에'sort '속성이 없습니다. 누구나 나에게 아이디어를 줄 수 있습니다 .. 이것은 내 코드입니다. final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = final.iloc[1:].reset_index(drop=True) final.columns.names = (None, None)

7
Pandas DataFrame에서 열을 이동하는 방법
Pandas에서 열을 이동하고 DataFrame싶지만 전체 DF를 다시 작성하지 않고 문서에서이를 수행하는 방법을 찾을 수 없었습니다. 누구든지 그것을하는 방법을 알고 있습니까? DataFrame : ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 원하는 출력 : ## x1 x2 ##0 206 nan ##1 …
101 python  pandas  dataframe 

5
위치별로 팬더 열 선택
단순히 이름이 지정된 팬더 열에 정수로 액세스하려고합니다. 를 사용하여 위치별로 행을 선택할 수 있습니다 df.ix[3]. 그러나 정수로 열을 선택하는 방법은 무엇입니까? 내 데이터 프레임 : df=pandas.DataFrame({'a':np.random.rand(5), 'b':np.random.rand(5)})
101 python  pandas  indexing 

4
DataFrame pandas에서 날짜 사이의 일 수가있는 열 추가
'B'의 날짜에서 'A'의 날짜를 빼고 차이가있는 새 열을 추가하고 싶습니다. df A B one 2014-01-01 2014-02-28 two 2014-02-03 2014-03-01 다음을 시도했지만 for 루프에 포함하려고하면 오류가 발생합니다. import datetime date1=df['A'][0] date2=df['B'][0] mdate1 = datetime.datetime.strptime(date1, "%Y-%m-%d").date() rdate1 = datetime.datetime.strptime(date2, "%Y-%m-%d").date() delta = (mdate1 - rdate1).days print delta 어떻게해야합니까?

3
pandas.read_csv를 가져 와서 빈 값을 nan 대신 빈 문자열로 읽습니다.
일부 CSV 데이터를 읽기 위해 pandas 라이브러리를 사용하고 있습니다. 내 데이터에서 특정 열에는 문자열이 포함되어 있습니다. 문자열 "nan"은 빈 문자열과 마찬가지로 가능한 값입니다. 팬더가 "nan"을 문자열로 읽도록 만들었지 만 빈 값을 NaN으로 읽지 않도록하는 방법을 알아낼 수 없습니다. 다음은 샘플 데이터 및 출력입니다. One,Two,Three a,1,one b,2,two ,3,three d,4,nan e,5,five nan,6, …
101 python  csv  pandas 

5
Pandas 데이터 프레임에서 None을 NaN으로 바꿉니다.
나는 테이블이있다 x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None python None을 pandas NaN으로 바꾸고 싶습니다. 나는 시도했다 : x.replace(to_replace=None, value=np.nan) 그러나 나는 얻었다 : TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a 'bool' …

2
Pandas : 기존 열에서 계산 된 값을 사용하여 데이터 프레임에 두 개의 새 열 만들기
pandas 라이브러리로 작업하고 df있으며 n 개의 열 (n> 0) 이있는 데이터 프레임에 두 개의 새 열을 추가하고 싶습니다 . 이러한 새 열은 데이터 프레임의 열 중 하나에 함수를 적용한 결과입니다. 적용 할 기능은 다음과 같습니다. def calculate(x): ...operate... return z, y 값만 반환하는 함수에 대한 새 열을 만드는 한 가지 …
100 python  pandas 

1
Pandas 데이터 프레임의 처음 몇 줄을 읽는 방법
미리 줄의 길이를 모르고 파일 read_csv의 첫 n줄만 읽는 데 사용하는 기본 제공 방법이 있습니까? 읽는 데 오랜 시간이 걸리는 대용량 파일이 있는데, 샘플을 얻기 위해 첫 번째 줄 (예 : 20 줄) 만 사용하고 싶을 때도 있습니다 (전체 내용을로드하고 헤드를 차지하는 것을 선호하지 않음). 총 줄 수를 알고 있다면 …
100 python  pandas  csv  dataframe 

6
Pandas 데이터 프레임을 시리즈로 변환
나는 팬더를 처음 접했습니다. 1 행 x 23 열의 팬더 데이터 프레임이 있습니다. 이것을 시리즈로 변환하고 싶습니까? 이 작업을 수행하는 가장 비단뱀적인 방법이 무엇인지 궁금합니다. 나는 시도 pd.Series(myResults)했지만 불평 ValueError: cannot copy sequence with size 23 to array axis with dimension 1합니다. 그것은 수학 용어에서 여전히 "벡터"라는 것을 깨닫기에 충분히 …

2
Python Pandas로 열 비닝
숫자 값이있는 데이터 프레임 열이 있습니다. df['percentage'].head() 46.5 44.2 100.0 42.12 빈 개수로 열을보고 싶습니다. bins = [0, 1, 5, 10, 25, 50, 100] 어떻게 결과를 bin으로 얻을 수 value counts있습니까? [0, 1] bin amount [1, 5] etc [5, 10] etc ......

6
pandas 데이터 프레임을 여러 열로 필터링하는 방법
단일 열로 데이터 프레임 (df)을 필터링하려면 남성과 여성이 포함 된 데이터를 고려하면 다음을 수행 할 수 있습니다. males = df[df[Gender]=='Male'] 질문 1-데이터가 여러 해에 걸쳐 있고 2014 년에는 남성 만보고 싶었다면 어떻게됩니까? 다른 언어에서는 다음과 같이 할 수 있습니다. if A = "Male" and if B = "2014" then (이 …
99 python  filter  pandas 

7
Pandas 데이터 프레임에서 셀을 NaN으로 설정하는 방법
데이터 프레임 열의 잘못된 값을 NaN으로 바꾸고 싶습니다. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan 하지만 마지막 줄은 실패하고 df 사본에서 작동하기 때문에 경고를 던집니다. 그렇다면 이것을 처리하는 올바른 방법은 무엇입니까? …
98 python  pandas  nan 

5
pandas read_csv 및 usecols로 열 필터링
여러 인덱스로 pandas.read_csv열을 필터링 usecols하고 사용할 때 올바르게 들어오지 않는 csv 파일이 있습니다. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f = open('foo.csv', 'w') f.write(csv) f.close() df1 = pd.read_csv('foo.csv', header=0, names=["dummy", "date", "loc", "x"], index_col=["date", "loc"], usecols=["dummy", "date", "loc", "x"], parse_dates=["date"]) print df1 # …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.