«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

10
팬더는 평균 / 평균을 얻는다
팬더에서 열의 평균 또는 평균을 얻을 수 없습니다. 데이터 프레임이 있습니다. 아래에서 시도한 것 중 어느 것도 열의 평균을 제공하지 않습니다.weight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033 1963 1.3123124 3 624870 1987 0.94212 다음은 하나가 아닌 여러 값을 반환합니다. allDF[['weight']].mean(axis=1) 이것도 …
155 python  pandas 



5
키로 팬더 그룹별로 데이터 프레임에 액세스하는 방법
키별로 groupby 객체의 해당 groupby 데이터 프레임에 어떻게 액세스합니까? 다음과 같은 그룹별로 : rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) 키와 그룹을 얻기 위해 반복 할 수 있습니다. In [11]: for k, gp in gb: print 'key=' + …

10
Pandas Series에서 요소의 인덱스 찾기
나는 이것이 매우 기본적인 질문이라는 것을 알고 있지만 어떤 이유로 든 대답을 찾을 수 없습니다. 파이썬 팬더에서 시리즈의 특정 요소 색인을 어떻게 얻을 수 있습니까? (첫 번째로 충분할 것입니다) 즉, 나는 다음과 같은 것을 원합니다 : import pandas as pd myseries = pd.Series([1,4,0,7,5], index=[0,1,2,3,4]) print myseries.find(7) # should output 3 …
154 python  pandas 

7
팬더 : 주어진 열에 대한 DataFrame 행 합계
다음과 같은 DataFrame이 있습니다. In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 나는 열을 추가 할 'e'컬럼의 합이다 'a', 'b'하고 'd'. 포럼을 …
153 python  pandas  dataframe  sum 


3
Pandas의 부울 색인 생성을위한 논리 연산자
팬더에서 부울 인덱스로 작업하고 있습니다. 문제는 진술이 왜 : a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] 반면 잘 작동합니다 a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] 오류와 함께 종료 하시겠습니까? 예: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …

8
팬더가 자동으로 날짜를 인식 할 수 있습니까?
오늘 나는 데이터 파일 (예 : 팬더)에서 데이터를 읽는 동안 팬더가 값 유형을 인식 할 수 있다는 사실에 놀랐습니다. df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) 예를 들어 다음과 같이 확인할 수 있습니다. for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) 특히 정수, 부동 소수점 및 문자열이 올바르게 인식되었습니다. 그러나 다음 …
151 python  date  types  dataframe  pandas 

3
팬더는 열 이름만으로 빈 DataFrame을 만듭니다.
동적으로 작동하는 동적 DataFrame이 있지만 DataFrame에 추가 할 데이터가 없으면 오류가 발생합니다. 따라서 열 이름만으로 빈 DataFrame을 만드는 솔루션이 필요합니다. 지금은 다음과 같은 것이 있습니다. df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. 추신 : 열 이름이 여전히 DataFrame에 나타나는 것이 중요합니다. 그러나 이것을 이와 같이 …
151 python  pandas  dataframe 

12
팬더에서 공백 값 (공백)을 NaN으로 바꾸기
공백 (임의의 양)을 포함하는 Pandas 데이터 프레임에서 모든 값을 찾고 해당 값을 NaN으로 바꾸고 싶습니다. 이것이 어떻게 개선 될 수있는 아이디어가 있습니까? 기본적으로 나는 이것을 돌리고 싶다 : A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz 2000-01-05 -0.222552 4 2000-01-06 …
150 python  pandas  dataframe 

6
팬더 DataFrame 또는 시리즈에 여러 필터를 적용하는 효율적인 방법
사용자가 Pandas DataFrame 또는 Series 객체에 여러 필터를 적용하려는 시나리오가 있습니다. 본질적으로 사용자가 런타임에 지정하는 여러 필터링 (비교 작업)을 효율적으로 연결하고 싶습니다. 필터는 추가되어야합니다 (일명 적용되는 각 필터는 결과가 좁아 야 함). 현재 사용하고 reindex()있지만 매번 새 객체를 만들고 기본 데이터를 복사합니다 (문서를 올바르게 이해하면). 따라서 큰 Series 또는 DataFrame을 …
148 python  algorithm  pandas 

14
그룹 별 총 팬더 비율
이것은 명백히 간단하지만, 새로운 초보자로서 나는 붙어 있습니다. 주, 사무실 ID 및 해당 사무실에 대한 3 개의 열이 포함 된 CSV 파일이 있습니다. 특정 주에서 사무실 당 판매 비율을 계산하려고합니다 (각 주에서 모든 백분율의 총계는 100 % 임). df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': range(1, 7) …
148 python  pandas 

4
파이썬 팬더 : 시리즈에 인수가있는 함수 적용
파이썬 팬더의 시리즈에 인수가있는 함수를 적용하고 싶습니다. x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... 이 문서 는 apply 메소드 지원에 대해 설명하지만 인수를 허용하지 않습니다. 인수를 받아들이는 다른 방법이 있습니까? 또는 간단한 해결 방법이 누락 되었습니까? 업데이트 (2017 년 10 월) : 이 질문은 원래 팬더 apply()가 위치 …
147 python  pandas  apply 

9
NaN (결측) 값이있는 pandas GroupBy 열
그룹화하려는 열에 누락 된 값이 많은 DataFrame이 있습니다. import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} Pandas가 NaN 대상 값으로 행을 삭제했음을 참조하십시오. (이 행을 포함하고 싶습니다!) 많은 연산 (많은 col이 누락 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.