«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

11
팬더 DataFrame에서 부분 문자열로 선택
나는이 DataFrame두 문자열 값을 포함하는 4 열을. 특정 열과 부분 문자열 일치를 기반으로 행을 선택하는 방법이 있는지 궁금합니다. 즉, 다음과 같은 기능을 수행하는 함수 또는 람다 함수 re.search(pattern, cell_in_question) 부울을 반환합니다. 나는 구문에 익숙 df[df['A'] == "hello world"]하지만 부분 문자열 일치 say로 동일한 작업을 수행하는 방법을 찾지 못하는 것 같습니다 …

9
DataFrame 행 섞기
다음과 같은 DataFrame이 있습니다. Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame은 csv 파일에서 읽습니다. Type1이 있는 모든 행 은 …

7
pandas GroupBy를 사용하여 각 그룹 (예 : 개수, 평균 등)에 대한 통계를 얻으십니까?
데이터 프레임이 df있고 여러 열을 사용합니다 groupby. df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() 위의 방법으로 필요한 테이블 (데이터 프레임)을 거의 얻습니다. 누락 된 것은 각 그룹의 행 수를 포함하는 추가 열입니다. 즉, 나는 의미가 있지만 이러한 수단을 얻는 데 사용 된 숫자의 수를 알고 싶습니다. 예를 들어 첫 번째 그룹에는 8 개의 값이 있고 두 …

7
SQL에서와 같이 'in'과 'not in'을 사용하여 Pandas 데이터 프레임을 필터링하는 방법
SQL IN과 동등한 것을 어떻게 달성 할 수 NOT IN있습니까? 필요한 값이있는 목록이 있습니다. 시나리오는 다음과 같습니다. df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] 이 작업을 수행하는 현재 방법은 다음과 같습니다. df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

18
Python을 사용하여 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError
30,000 개의 유사한 파일을 처리하는 프로그램을 실행 중입니다. 임의의 숫자 가이 오류를 중지하고 생성합니다 ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret = …

6
파이썬 / 팬더가 저장된 CSV에서 인덱스를 생성하지 않도록하는 방법은 무엇입니까?
파일을 약간 편집 한 후 폴더에 CSV를 저장하려고합니다. pd.to_csv('C:/Path of file.csv')csv 파일을 사용할 때마다 별도의 인덱스 열이 있습니다. 색인을 CSV로 인쇄하지 않으려 고합니다. 나는 시도했다 : pd.read_csv('C:/Path to file to edit.csv', index_col = False) 그리고 파일을 저장하려면 ... pd.to_csv('C:/Path to save edited file.csv', index_col = False) 그러나 여전히 원치 않는 …
407 python  csv  indexing  pandas 

15
여러 CSV 파일을 팬더로 가져오고 하나의 DataFrame으로 연결
디렉토리에서 팬더로 여러 CSV 파일을 읽고 하나의 큰 DataFrame으로 연결하고 싶습니다. 나는 그것을 알아낼 수 없었다. 여기 내가 지금까지 가지고있는 것입니다 : import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate …

6
정수 인덱스로 팬더 시리즈 / 데이터 프레임 행 선택
나는 이유에 궁금 df[2]동안 지원되지 않습니다 df.ix[2]하고 df[2:3]모두 작동합니다. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 파이썬 인덱싱 규칙과 일관된 df[2]방식으로 작동 할 것으로 기대 합니다 df[2:3]. 단일 정수로 …

15
변수의 값으로 팬더 DataFrame을 생성하면 "ValueError : 모든 스칼라 값을 사용하는 경우 인덱스를 전달해야합니다"가 나타납니다.
이것은 간단한 질문 일지 모르지만 어떻게 해야하는지 알 수 없습니다. 다음과 같이 두 가지 변수가 있다고 가정 해 봅시다. a = 2 b = 3 이로부터 DataFrame을 구성하고 싶습니다. df2 = pd.DataFrame({'A':a,'B':b}) 오류가 발생합니다. ValueError : 모든 스칼라 값을 사용하는 경우 인덱스를 전달해야합니다 나는 이것을 시도했다 : df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() …

12
Pandas 데이터 프레임의 두 열에 함수를 적용하는 방법
의 df열 이있는 것으로 가정하십시오 'ID', 'col_1', 'col_2'. 그리고 함수를 정의합니다. f = lambda x, y : my_function_expression. 이제 fto df의 두 열 'col_1', 'col_2'을 요소별로 적용하여 새 열 을 요소별로 계산하려고합니다 'col_3'. df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 given)' 수행하는 방법 …
368 python  pandas  dataframe 

6
시리즈의 진실 가치는 모호합니다. a.empty, a.bool (), a.item (), a.any () 또는 a.all ()을 사용하십시오.
or조건으로 결과 데이터 프레임을 필터링하는 데 문제가 있습니다. 결과 df가 var0.25보다 크고 -0.25보다 작은 모든 열 값 을 추출하기를 원합니다 . 아래의 논리는 모호한 진실 값을 제공하지만이 필터링을 두 개의 별도 작업으로 분리하면 작동합니다. 여기서 무슨 일이 일어나고 있습니까? 제안 된 위치를 잘 모르겠습니다 a.empty(), a.bool(), a.item(),a.any() or a.all(). result …

2
팬더 병합 101
팬더와 ( LEFT| RIGHT| FULL) ( INNER| OUTER) 조인 을 수행하는 방법은 무엇입니까? 병합 후 누락 된 행에 NaN을 추가하려면 어떻게합니까? 병합 후 NaN을 제거하려면 어떻게해야합니까? 인덱스를 병합 할 수 있습니까? 팬더와 크로스 조인? 여러 DataFrame을 병합하려면 어떻게합니까? merge? join? concat? update? WHO? 뭐? 왜?! ... 그리고 더. 팬더 병합 …
362 python  pandas  join  merge 

2
데이터 프레임을 피벗하는 방법
피봇이란 무엇입니까? 어떻게 피벗합니까? 이것이 피벗입니까? 긴 형식을 넓은 형식으로? 피벗 테이블에 대해 많은 질문을 보았습니다. 피벗 테이블에 대해 묻는다는 것을 모르더라도 일반적으로 사용됩니다. 피봇 팅의 모든 측면을 포괄하는 정식 질문과 답변을 작성하는 것은 사실상 불가능합니다. ...하지만 나는 그것을 갈 것입니다. 기존 질문과 답변의 문제점은 종종 기존의 많은 정답을 사용하기 …

11
데이터 프레임의 셀에서 값을 얻는 방법?
내 데이터 프레임에서 정확히 하나의 행을 추출하는 조건을 구성했습니다. d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] 이제 특정 열에서 가치를 얻고 싶습니다. val = d2['col_name'] 그러나 결과적으로 하나의 행과 하나의 열 ( 즉, 하나의 셀) 을 포함하는 데이터 프레임을 얻습니다 . 내가 필요한 것이 아닙니다. 하나의 값 (하나의 …
346 python  pandas  dataframe 

30
Python Pandas 데이터 토큰 화 오류
팬더를 사용하여 .csv 파일을 조작하려고 하는데이 오류가 발생합니다. pandas.parser.CParserError : 데이터 토큰 화 오류. C 오류 : 3 행에 2 개의 필드가 있어야합니다. 팬더 문서를 읽으려고했지만 아무것도 찾지 못했습니다. 내 코드는 간단합니다. path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) 이 문제를 어떻게 해결할 수 있습니까? csv모듈이나 다른 언어를 …
343 python  csv  pandas 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.