«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

8
항목의 길이가 다른 사전에서 데이터 프레임 만들기
10 개의 키-값 쌍이있는 사전이 있다고 가정 해 보겠습니다. 각 항목에는 numpy 배열이 있습니다. 그러나 배열의 길이는 모두 동일하지 않습니다. 각 열에 다른 항목이있는 데이터 프레임을 만들려면 어떻게해야합니까? 내가 시도 할 때 : pd.DataFrame(my_dict) 나는 얻다: ValueError: arrays must all be the same length 이것을 극복 할 방법이 있습니까? Pandas …
114 python  pandas 

3
팬더는 열을 색인으로 사용할 수 있습니까?
다음과 같은 스프레드 시트가 있습니다. Locality 2005 2006 2007 2008 2009 ABBOTSFORD 427000 448000 602500 600000 638500 ABERFELDIE 534000 600000 735000 710000 775000 AIREYS INLET459000 440000 430000 517500 512500 열을 행과 수동으로 바꾸고 싶지 않습니다. 다음과 같이 목록에 데이터를 읽는 팬더를 사용할 수 있습니까? data['ABBOTSFORD']=[427000,448000,602500,600000,638500] data['ABERFELDIE']=[534000,600000,735000,710000,775000] data['AIREYS INLET']=[459000,440000,430000,517500,512500]
114 python  excel  pandas 

6
y 축을 백분율로 서식 지정
다음과 같은 팬더로 만든 기존 플롯이 있습니다. df['myvar'].plot(kind='bar') y 축은 부동 소수점 형식이며 y 축을 백분율로 변경하고 싶습니다. 내가 찾은 모든 솔루션은 ax.xyz 구문 을 사용하며 플롯을 생성하는 위의 줄 아래에만 코드를 배치 할 수 있습니다 (위의 줄 에 ax = ax를 추가 할 수 없음). 위의 선을 변경하지 않고 …


11
Python Pandas를 사용하여 날짜 및 시간 열 결합
다음 열이있는 pandas 데이터 프레임이 있습니다. Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00 데이터 [ '날짜']와 데이터 [ '시간']을 결합하여 다음을 얻으려면 어떻게해야합니까? 사용하는 방법이 pd.to_datetime있습니까? Date 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 …

9
팬더 데이터 프레임 예쁜 인쇄
다음과 같이 pandas 데이터 프레임을 멋진 텍스트 기반 테이블로 어떻게 인쇄 할 수 있습니까? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | …

11
Pandas 데이터 프레임에 행 삽입
데이터 프레임이 있습니다. s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] 다음을 얻으려면 첫 번째 행 [2, 3, 4]을 추가해야합니다. A B C …

6
Pandas DataFrame에서 히트 맵 만들기
Python의 Pandas 패키지에서 생성 된 데이터 프레임이 있습니다. Pandas 패키지에서 DataFrame을 사용하여 히트 맵을 생성하려면 어떻게해야합니까? import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df A B C D aaa 2.431645 1.248688 0.267648 0.613826 bbb …




4
Pandas DataFrame의 행을 열 헤더로 변환,
내가 작업해야하는 데이터는 약간 지저분합니다. 데이터 내부에 헤더 이름이 있습니다. 기존 pandas 데이터 프레임에서 행을 선택하고 열 머리글로 변경 (이름 변경)하려면 어떻게해야합니까? 다음과 같이하고 싶습니다. header = df[df['old_header_name1'] == 'new_header_name1'] df.columns = header

5
Pandas 데이터 프레임에서 사용하는 메모리를 어떻게 해제합니까?
다음과 같이 팬더에서 연 정말 큰 CSV 파일이 있습니다 .... import pandas df = pandas.read_csv('large_txt_file.txt') 이렇게하면 메모리 사용량이 2GB만큼 증가하는데, 이는이 파일에 수백만 개의 행이 포함되어 있기 때문입니다. 이 메모리를 해제해야 할 때 문제가 발생합니다. 달렸어 .... del df 그러나 내 메모리 사용량은 떨어지지 않았습니다. 팬더 데이터 프레임에서 사용하는 메모리를 …
111 python  pandas  memory 

4
코드에서 pandas apply ()를 언제 사용해야합니까?
Pandas 메서드 사용과 관련된 Stack Overflow 질문에 대한 많은 답변을 보았습니다 apply. 나는 또한 사용자들이 " apply느리기 때문에 피해야한다 "고 언급하는 것을 보았습니다 . apply느린 성능을 설명하는 주제에 대한 많은 기사를 읽었습니다 . 또한 문서에서 apply단순히 UDF 전달을위한 편리한 기능에 대한 면책 조항을 보았습니다 (지금은 찾을 수없는 것 같습니다). 따라서 …

4
Unix 시간을 Pandas 데이터 프레임에서 읽을 수있는 날짜로 변환
유닉스 시간과 가격이 포함 된 데이터 프레임이 있습니다. 사람이 읽을 수있는 날짜로 표시되도록 인덱스 열을 변환하고 싶습니다. 그래서 예를 들어 나는이 date같은 1349633705인덱스 열의하지만 난 그게로 표시 할 것 10/07/2012(또는 적어도 10/07/2012 18:15). 어떤 맥락에서 내가 작업중인 코드와 이미 시도한 코드는 다음과 같습니다. import json import urllib2 from datetime import …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.