«pandas-groupby» 태그된 질문

주어진 조건에 따라 변수를 그룹화하는 데 사용됩니다. 그리고`pandas` 라이브러리와 관련해서 만 사용됩니다.


7
pandas GroupBy를 사용하여 각 그룹 (예 : 개수, 평균 등)에 대한 통계를 얻으십니까?
데이터 프레임이 df있고 여러 열을 사용합니다 groupby. df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() 위의 방법으로 필요한 테이블 (데이터 프레임)을 거의 얻습니다. 누락 된 것은 각 그룹의 행 수를 포함하는 추가 열입니다. 즉, 나는 의미가 있지만 이러한 수단을 얻는 데 사용 된 숫자의 수를 알고 싶습니다. 예를 들어 첫 번째 그룹에는 8 개의 값이 있고 두 …

2
데이터 프레임을 피벗하는 방법
피봇이란 무엇입니까? 어떻게 피벗합니까? 이것이 피벗입니까? 긴 형식을 넓은 형식으로? 피벗 테이블에 대해 많은 질문을 보았습니다. 피벗 테이블에 대해 묻는다는 것을 모르더라도 일반적으로 사용됩니다. 피봇 팅의 모든 측면을 포괄하는 정식 질문과 답변을 작성하는 것은 사실상 불가능합니다. ...하지만 나는 그것을 갈 것입니다. 기존 질문과 답변의 문제점은 종종 기존의 많은 정답을 사용하기 …



5
키로 팬더 그룹별로 데이터 프레임에 액세스하는 방법
키별로 groupby 객체의 해당 groupby 데이터 프레임에 어떻게 액세스합니까? 다음과 같은 그룹별로 : rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) 키와 그룹을 얻기 위해 반복 할 수 있습니다. In [11]: for k, gp in gb: print 'key=' + …

9
NaN (결측) 값이있는 pandas GroupBy 열
그룹화하려는 열에 누락 된 값이 많은 DataFrame이 있습니다. import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} Pandas가 NaN 대상 값으로 행을 삭제했음을 참조하십시오. (이 행을 포함하고 싶습니다!) 많은 연산 (많은 col이 누락 …

3
Pandas GroupBy.agg ()를 사용하여 동일한 열의 여러 집계
여러 번 호출하지 않고 f1, f2동일한 열에 두 개의 다른 집계 함수 를 적용하는 pandas 기본 제공 방법이 있습니까?df["returns"]agg() 데이터 프레임의 예 : import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

10
GroupBy pandas DataFrame 및 가장 일반적인 값 선택
세 개의 문자열 열이있는 데이터 프레임이 있습니다. 세 번째 열의 유일한 값이 처음 두 가지의 모든 조합에 유효하다는 것을 알고 있습니다. 데이터를 정리하려면 처음 두 열을 기준으로 데이터 프레임별로 그룹화하고 각 조합에 대해 세 번째 열의 가장 일반적인 값을 선택해야합니다. 내 코드 : import pandas as pd from scipy import …

4
Pandas groupby를 사용하여 여러 행의 문자열 연결
Pandas의 groupedby를 기반으로 데이터 프레임의 여러 문자열을 병합하고 싶습니다. 이것은 지금까지 내 코드입니다. import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) # add column with month df["month"] …

4
pandas 데이터 프레임 그룹 별 datetime 월
csv 파일을 고려하십시오. string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 이것을 읽고 날짜 열을 datetime 형식으로 다시 형식화 할 수 있습니다. b=pd.read_csv('b.dat') b['date']=pd.to_datetime(b['date'],format='%m/%d/%y …

9
Pandas : 각 그룹에서 평균으로 결 측값 채우기
이것은 간단해야하지만 내가 찾은 가장 가까운 것은이 게시물입니다 : pandas : Filling missing values ​​within a group , 그리고 여전히 내 문제를 해결할 수 없습니다 .... 다음 데이터 프레임이 있다고 가정합니다. df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', 'B','B','B','B', 'C','C','C']}) name value 0 …

2
Pandas groupby (). sum ()의 출력에서 ​​새 열을 어떻게 생성합니까?
groupby계산 에서 새 열을 만들려고합니다 . 아래 코드에서 각 날짜 (아래 그룹 참조)에 대해 올바른 계산 된 값을 얻지 만 새 열 ( df['Data4']) 을 만들려고 하면 NaN이 표시됩니다. 따라서 Data3모든 날짜 의 합계를 사용하여 데이터 프레임에 새 열을 만들고 각 날짜 행에 적용하려고합니다. 예를 들어 2015-05-08은 2 개 행 …


2
DataFrame, Python-3에서 상위 N 개의 최소값을 찾는 방법
Field 'Age'가있는 Dataframe 아래에 DataFrame에서 최소 3 세 이상이 필요합니다. DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() 목록에서 상위 2 세, 즉 18, 23을 원하십니까? 참고 : DataFrame-DF에는 연령 중복 (예 : 18 및 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.