«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

8
.corr을 사용하여 두 열 간의 상관 관계 얻기
다음 pandas 데이터 프레임이 있습니다 Top15. 1 인당 인용 가능한 문서 수를 추정하는 열을 만듭니다. Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] 1 인당 인용 가능한 문서 수와 1 인당 에너지 공급 사이의 상관 관계를 알고 싶습니다. 그래서 나는 …

3
Pandas GroupBy.agg ()를 사용하여 동일한 열의 여러 집계
여러 번 호출하지 않고 f1, f2동일한 열에 두 개의 다른 집계 함수 를 적용하는 pandas 기본 제공 방법이 있습니까?df["returns"]agg() 데이터 프레임의 예 : import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

10
파이썬에서 팬더를 사용하여 모든 중복 항목 목록을 얻으려면 어떻게해야합니까?
수출 문제가있을 가능성이있는 품목 목록이 있습니다. 수동으로 비교할 수 있도록 중복 항목의 목록을 얻고 싶습니다. pandas duplicated method 를 사용하려고 하면 첫 번째 복제본 만 반환됩니다. 첫 번째가 아닌 모든 중복을 얻을 수있는 방법이 있습니까? 내 데이터 세트의 작은 하위 섹션은 다음과 같습니다. ID,ENROLLMENT_DATE,TRAINER_MANAGING,TRAINER_OPERATOR,FIRST_VISIT_DATE 1536D,12-Feb-12,"06DA1B3-Lebanon NH",,15-Feb-12 F15D,18-May-12,"06405B2-Lebanon NH",,25-Jul-12 8096,8-Aug-12,"0643D38-Hanover NH","0643D38-Hanover …

14
Pandas 데이터 프레임에 모든 열 이름을 표시하는 방법은 무엇입니까?
수백 개의 열로 구성된 데이터 프레임이 있으며 모든 열 이름을 확인해야합니다. 제가 한: In[37]: data_all2.columns 출력은 다음과 같습니다. Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) 잘린 목록 대신 모든 열을 표시하려면 어떻게합니까 ?
127 python  pandas  dataframe  show 

6
Pandas merge를 사용할 때 색인을 유지하는 방법
두 개를 병합 DataFrames하고 첫 번째 프레임의 인덱스를 병합 된 데이터 세트의 인덱스로 유지하고 싶습니다 . 그러나 병합을 수행하면 결과 DataFrame에 정수 인덱스가 있습니다. 왼쪽 데이터 프레임에서 인덱스를 유지하도록 지정하려면 어떻게해야합니까? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2, 'c': 3}, 'to_merge_on': {'a': 1, 'b': 3, 'c': 4}}) In …
126 python  pandas 

4
pandas read_csv의 datetime dtypes
여러 datetime 열이있는 csv 파일을 읽고 있습니다. 파일을 읽을 때 데이터 유형을 설정해야하지만 날짜 시간이 문제인 것 같습니다. 예를 들면 : headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) 실행하면 오류가 발생합니다. TypeError : "datetime"데이터 유형을 이해할 수 없습니다. 사실 후에 …

9
python pandas는 중복 열을 제거합니다.
데이터 프레임에서 중복 열을 제거하는 가장 쉬운 방법은 무엇입니까? 다음을 통해 중복 열이있는 텍스트 파일을 읽고 있습니다. import pandas as pd df=pd.read_table(fname) 열 이름은 다음과 같습니다. Time, Time Relative, N2, Time, Time Relative, H2, etc... 모든 시간 및 시간 관련 열에는 동일한 데이터가 포함됩니다. 내가 원하는: Time, Time Relative, N2, …
126 python  pandas 

4
Pandas의 두 열에서 튜플 열을 형성하는 방법
Pandas DataFrame이 있고 'lat'및 'long'열을 결합하여 튜플을 형성하고 싶습니다. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values Crime type 205482 non-null values …


2
Pandas로 무작위 정수의 DataFrame을 만드는 방법은 무엇입니까?
를 사용 randn하면 import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) 내가 찾고있는 것을 제공하지만 정규 분포의 요소를 사용합니다. 하지만 난 그냥 임의의 정수를 원하면 어떨까요? randint범위를 제공하여 작동하지만 배열은 randn그렇지 않습니다. 그렇다면 어떤 범위 사이의 임의의 정수로 어떻게 이것을 할 수 있습니까?

6
조건부 판다 교체
DataFrame이 있고 값을 초과하는 특정 열의 값을 0으로 바꾸고 싶습니다. 나는 이것이 이것을 달성하는 방법이라고 생각했습니다. df[df.my_channel > 20000].my_channel = 0 채널을 새 데이터 프레임에 복사하면 간단합니다. df2 = df.my_channel df2[df2 > 20000] = 0 이것은 내가 원하는 것을 정확히 수행하지만 원래 DataFrame의 일부로 채널에서 작동하지 않는 것 같습니다.

8
Pandas Groupby : 문자열 통합을 얻는 방법
다음과 같은 데이터 프레임이 있습니다. A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! 부름 In [10]: print df.groupby("A")["B"].sum() 돌아올 것이다 A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 이제 "C"열에 …
122 python  pandas 

3
각 행의 최대 값을 가진 열 이름을 찾습니다.
다음과 같은 DataFrame이 있습니다. In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 여기에서 각 행에 대해 최대 값을 가진 열 이름을 얻는 방법을 …
122 python  pandas  dataframe  max 

8
하나의 할당에서 Pandas 데이터 프레임에 여러 열을 추가하는 방법은 무엇입니까?
저는 pandas를 처음 사용하고 pandas에 여러 열을 동시에 추가하는 방법을 알아 내려고 노력하고 있습니다. 여기에 도움을 주시면 감사하겠습니다. 이상적으로는 여러 단계를 반복하는 대신 한 단계로 수행하고 싶습니다. import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]} df = pd.DataFrame(df) df[[ 'column_new_1', 'column_new_2','column_new_3']] = …
122 python  pandas  dataframe 

3
팬더 적용 함수에서 행의 인덱스 가져 오기
DataFramePandas 전체 에 적용된 함수의 행 인덱스에 액세스하려고합니다 . 다음과 같은 것이 있습니다. df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 주어진 행으로 요소에 액세스하는 함수를 정의하겠습니다. def rowFunc(row): return row['a'] + row['b'] * row['c'] 다음과 같이 적용 할 수 있습니다. …
121 python  pandas  dataframe 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.