다음과 같은 데이터 프레임이 있습니다.
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
부름
In [10]: print df.groupby("A")["B"].sum()
돌아올 것이다
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
이제 "C"열에 대해 "동일"을 수행하고 싶습니다. 해당 열에 문자열이 포함되어 있기 때문에 sum ()은 작동하지 않습니다 (문자열을 연결한다고 생각할 수 있지만). 내가 정말로보고 싶은 것은 각 그룹에 대한 목록 또는 문자열 세트입니다.
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
나는 이것을 할 방법을 찾으려고 노력하고 있습니다.
Series.unique () ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html )는 작동하지 않지만
df.groupby("A")["B"]
이다
pandas.core.groupby.SeriesGroupBy object
그래서 어떤 시리즈 방법이 작동하길 바랬습니다. 어떤 아이디어?
apply및lambdas 의 필요성이 제거 된 것 같습니다 . 나는 왜pandas실제로 합산 문자열에 오류를 반환하지 않는지 궁금해했습니다 .