객관식 질문을 통해 19717 명이 선택한 프로그래밍 언어의 응답을 기록하는 데이터 프레임이 있습니다. 첫 번째 열은 물론 응답자의 성별이며 나머지는 그들이 선택한 선택입니다. 따라서 Python을 선택하면 내 응답이 Python 열에 기록되고 bash가 아니며 그 반대도 마찬가지입니다.
ID Gender Python Bash R JavaScript C++
0 Male Python nan nan JavaScript nan
1 Female nan nan R JavaScript C++
2 Prefer not to say Python Bash nan nan nan
3 Male nan nan nan nan nan
내가 원하는 것은 Gender
레코드 아래의 각 범주의 인스턴스 수를 반환하는 테이블입니다 . 따라서 5000 명의 남성이 Python으로 코딩하고 3000 명의 여성이 JS로 코딩하면 다음과 같이해야합니다.
Gender Python Bash R JavaScript C++
Male 5000 1000 800 1500 1000
Female 4000 500 1500 3000 800
Prefer Not To Say 2000 ... ... ... 860
몇 가지 옵션을 시도했습니다.
df.iloc[:, [*range(0, 13)]].stack().value_counts()
Male 16138
Python 12841
SQL 6532
R 4588
Female 3212
Java 2267
C++ 2256
Javascript 2174
Bash 2037
C 1672
MATLAB 1516
Other 1148
TypeScript 389
Prefer not to say 318
None 83
Prefer to self-describe 49
dtype: int64
그리고 위에서 설명한대로 필요한 것은 아닙니다. 이것은 판다에서 할 수 있습니까?
Gender
인덱스에 대해 0을 모두 반환합니다 .