여러 데이터베이스 (oracle, mssql 등)가 있으므로 팬더를 db 대체물로 사용하고 있으며 SQL과 동등한 일련의 명령을 만들 수 없습니다.
일부 열이있는 DataFrame에 테이블이로드되었습니다.
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
SQL에서 매년 다른 클라이언트 수를 계산하는 방법은 다음과 같습니다.
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
결과는
201301 5000
201302 13245
팬더에서 어떻게 할 수 있습니까?
table.groupby ([ 'YEARMONTH']) [ 'CLIENTCODE']. unique ()를 수행했으며 YEARMONTH에 의해 인덱스 된 두 개의 시리즈와 모든 고유 값이 제공됩니다. 각 계열의 값을 계산하는 방법은 무엇입니까?
—
Adriano Almeida
일부의 경우,
—
sachinruk
value_counts
당신이 찾고있는 답이 될 수도 있습니다 : pandas.pydata.org/pandas-docs/stable/generated/…