«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

12
NaN이 포함 된 Pandas 열을 dtype`int`로 변환
아래와 같이 .csv 파일에서 Pandas 데이터 프레임으로 데이터를 읽습니다. 열 중 하나, 즉 id열 유형을로 지정하고 싶습니다 int. 문제는 id시리즈에 누락 된 / 빈 값이 있다는 것입니다. id.csv를 읽는 동안 열을 정수 로 캐스팅하려고 하면 다음과 같은 결과가 나타납니다. df= pd.read_csv("data.csv", dtype={'id': int}) error: Integer column has NA values 또는 …
175 python  pandas  na 

4
그룹 객체에 변형 대 적용
다음 데이터 프레임을 고려하십시오. A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 다음 명령이 …
174 python  pandas 

5
판다 위치 대 iloc 대 ix 대 앳 vs iat?
최근 내 안전한 곳에서 파이썬으로 분기하기 시작했으며의 셀 현지화 / 선택에 약간 혼란 스럽습니다 Pandas. 설명서를 읽었지만 다양한 현지화 / 선택 옵션의 실제적인 의미를 이해하기 위해 고심하고 있습니다. 내가 사용해야하는 이유가 있습니까 .loc또는 .iloc가장 일반적인 옵션 이상은 .ix? 나는 이해 .loc, iloc, at, 그리고 iat어떤 보장 정확성을 제공 할 수 …

10
Seaborn 플롯을 파일로 저장하는 방법
다음 코드 ( test_seaborn.py)를 시도했습니다 . import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() 하지만이 오류가 발생합니다. Traceback (most recent call last): File "test_searborn.py", line 11, in <module> fig = sns_plot.get_figure() AttributeError: …

8
인덱스없이 팬더 DataFrame을 인쇄하는 방법
전체 데이터 프레임을 인쇄하고 싶지만 색인을 인쇄하고 싶지 않습니다. 게다가 하나의 열은 날짜 시간 유형이며 날짜가 아닌 시간을 인쇄하고 싶습니다. 데이터 프레임은 다음과 같습니다. User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123 2014-07-08 00:49:00 1041 나는 그것을 인쇄하고 싶다 User …

7
정규식으로 팬더의 행을 필터링하는 방법
열 중 하나에서 정규 표현식을 사용하여 데이터 프레임을 깨끗하게 필터링하고 싶습니다. 고안된 예 : In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat f정규식 을 사용하여 시작하는 행을 …
169 python  regex  pandas 

3
팬더 : 여러 열의 두 데이터 프레임을 병합 (결합)
두 개의 열을 사용하여 두 개의 팬더 데이터 프레임을 결합하려고합니다. new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') 그러나 다음과 같은 오류가 발생했습니다. pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' 이 작업을 수행하는 올바른 방법은 무엇입니까? 감사!


4
팬더 DataFrame에 헤더 행을 추가하는 방법
에 CSV 파일을 읽고 pandas있습니다. 이 CSV 파일은 4 개의 열과 일부 행으로 구성되지만 헤더 행이 없으므로 추가하고 싶습니다. 나는 다음을 시도했다. Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') 그러나 코드를 적용하면 다음 오류가 발생합니다. ValueError: Shape of passed values is (1, 1), indices …
166 python  csv  pandas  header 

7
열의 형식 문자열을 사용하여 수레의 팬더 DataFrame을 표시하는 방법은 무엇입니까?
print()및 IPython 사용하여 주어진 형식으로 팬더 데이터 프레임을 표시하고 싶습니다 display(). 예를 들면 다음과 같습니다. df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 어떻게 든 이것을 인쇄로 강제하고 싶습니다. cost foo $123.46 bar $234.57 baz $345.68 quux $456.79 데이터 …

5
팬더 그룹 별 그룹으로 정렬
데이터 프레임을 두 개의 열로 그룹화 한 다음 그룹 내에서 집계 결과를 정렬하려고합니다. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 market B 7 2 …

7
동일한 통합 문서의 여러 워크 시트에 대해 판다를 사용하여 pd.read_excel ()
파이썬 팬더를 사용하여 처리하는 큰 스프레드 시트 파일 (.xlsx)이 있습니다. 큰 파일에서 두 개의 탭의 데이터가 필요합니다. 탭 중 하나에는 많은 양의 데이터가 있고 다른 하나는 몇 정사각형 셀입니다. 모든 워크 시트에서 pd.read_excel () 을 사용 하면 전체 파일이로드 된 것처럼 보입니다 (관심이있는 워크 시트뿐만 아니라). 따라서이 방법을 두 번 …

6
Pandas DataFrame Group2 개의 열 및 개수 계산
다음 형식의 팬더 데이터 프레임이 있습니다. df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df : col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 x/y/z/n 3 …
165 python  pandas  dataframe 

5
여러 개의 인수로 함수를 적용하여 새 팬더 열 만들기
pandas두 개의 기존 열에 함수를 적용하여 데이터 프레임에 새 열을 만들고 싶습니다 . 이 답변에 따라 하나의 열만 인수로 필요할 때 새 열을 만들 수있었습니다. import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]}) def fx(x): return x * x print(df) df['newcolumn'] = df.A.apply(fx) print(df) 그러나 함수에 …
165 python  pandas 

4
사전 목록에 대한 Pandas DataFrame
다음과 같은 DataFrame이 있습니다. 고객 항목 1 항목 2 항목 3 사과 우유 토마토 1 개 2 물 오렌지 감자 주스 망고 칩 3 개 행당 사전 목록으로 변환하고 싶습니다. rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.