프로그램 작성 dataframe

20

팬더 데이터 프레임을 만들었습니다 df = DataFrame(index=['A','B','C'], columns=['x','y']) 그리고 이것을 얻었다 xy NaN NaN B NaN NaN C NaN NaN 그런 다음 행 'C'와 열 'x'와 같은 특정 셀에 값을 할당하고 싶습니다. 나는 그런 결과를 얻을 것으로 기대했다. xy NaN NaN B NaN NaN C 10 NaN 이 코드로 : …

478 python pandas dataframe

10

Pandas의 map, applymap 및 apply 메소드의 차이점

이러한 벡터화 방법을 기본 예제와 함께 사용하는시기를 알려주시겠습니까? 그 볼 mapA는 Series있는 나머지 반면, 방법 DataFrame방법. 나는 혼동있어 apply및 applymap방법하지만. 왜 DataFrame에 함수를 적용하는 두 가지 방법이 있습니까? 사용법을 보여주는 간단한 예제도 훌륭합니다!

465 python pandas dataframe vectorization

15

팬더 데이터 프레임을 NumPy 배열로 변환

팬더 데이터 프레임을 NumPy 배열로 변환하는 방법을 알고 싶습니다. 데이터 프레임 : import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, …

465 python arrays pandas numpy dataframe

5

빈 Pandas DataFrame을 만든 다음 채우시겠습니까?

나는 판다 데이터 프레임 문서에서 시작하고 있습니다 : http://pandas.pydata.org/pandas-docs/stable/dsintro.html 시계열 종류의 계산 값으로 DataFrame을 반복적으로 채우고 싶습니다. 따라서 기본적으로 열 A, B 및 타임 스탬프 행, 모두 0 또는 모든 NaN으로 DataFrame을 초기화하고 싶습니다. 그런 다음 초기 값을 추가 하고이 데이터를 검토하여 이전의 행에서 새 행을 계산합니다 row[A][t] = row[A][t-1]+1. …

461 python dataframe pandas

24

pandas DataFrame의 열에서 NaN 값을 계산하는 방법

number of을 찾고 싶은 데이터가 NaN있으므로 임계 값보다 작 으면이 열을 삭제합니다. 나는 보았지만 이것에 대한 기능을 찾지 못했습니다. 있다value_counts 있지만 대부분의 값이 고유하고 카운트 NaN만 원하기 때문에 속도가 느려집니다 .

459 python pandas dataframe

12

팬더 데이터 프레임의 열에서 모든 NaN 값을 0으로 바꾸는 방법

아래와 같이 데이터 프레임이 있습니다 itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 485 …

457 python pandas dataframe

7

팬더 데이터 프레임의 인덱스를 열로 변환하는 방법은 무엇입니까?

이것은 다소 분명해 보이지만 데이터 프레임의 인덱스를 열로 변환하는 방법을 알 수없는 것 같습니다. 예를 들면 다음과 같습니다. df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 에, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

456 python pandas dataframe

11

팬더 DataFrame에서 부분 문자열로 선택

나는이 DataFrame두 문자열 값을 포함하는 4 열을. 특정 열과 부분 문자열 일치를 기반으로 행을 선택하는 방법이 있는지 궁금합니다. 즉, 다음과 같은 기능을 수행하는 함수 또는 람다 함수 re.search(pattern, cell_in_question) 부울을 반환합니다. 나는 구문에 익숙 df[df['A'] == "hello world"]하지만 부분 문자열 일치 say로 동일한 작업을 수행하는 방법을 찾지 못하는 것 같습니다 …

448 python string pandas dataframe

9

DataFrame 행 섞기

다음과 같은 DataFrame이 있습니다. Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame은 csv 파일에서 읽습니다. Type1이 있는 모든 행 은 …

438 python pandas dataframe permutation shuffle

7

pandas GroupBy를 사용하여 각 그룹 (예 : 개수, 평균 등)에 대한 통계를 얻으십니까?

데이터 프레임이 df있고 여러 열을 사용합니다 groupby. df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() 위의 방법으로 필요한 테이블 (데이터 프레임)을 거의 얻습니다. 누락 된 것은 각 그룹의 행 수를 포함하는 추가 열입니다. 즉, 나는 의미가 있지만 이러한 수단을 얻는 데 사용 된 숫자의 수를 알고 싶습니다. 예를 들어 첫 번째 그룹에는 8 개의 값이 있고 두 …

438 python pandas dataframe group-by pandas-groupby

7

SQL에서와 같이 'in'과 'not in'을 사용하여 Pandas 데이터 프레임을 필터링하는 방법

SQL IN과 동등한 것을 어떻게 달성 할 수 NOT IN있습니까? 필요한 값이있는 목록이 있습니다. 시나리오는 다음과 같습니다. df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] 이 작업을 수행하는 현재 방법은 다음과 같습니다. df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

432 python pandas dataframe sql-function

18

Python을 사용하여 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError

30,000 개의 유사한 파일을 처리하는 프로그램을 실행 중입니다. 임의의 숫자 가이 오류를 중지하고 생성합니다 ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret = …

411 python pandas csv dataframe unicode

15

여러 CSV 파일을 팬더로 가져오고 하나의 DataFrame으로 연결

디렉토리에서 팬더로 여러 CSV 파일을 읽고 하나의 큰 DataFrame으로 연결하고 싶습니다. 나는 그것을 알아낼 수 없었다. 여기 내가 지금까지 가지고있는 것입니다 : import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate …

403 python pandas csv dataframe concatenation

16

데이터 프레임의 열 이름 변경

"newprice"라는 데이터 프레임이 있고 (아래 참조) R의 프로그램에서 열 이름을 변경하고 싶습니다. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 실제로 이것이하는 일입니다. names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") 각 열 이름이 다른 것처럼 보이기를 원하기 때문에 이것을 루프에 넣지 않았습니다. 프로그램을 R 콘솔에 …

399 r dataframe rename

6

정수 인덱스로 팬더 시리즈 / 데이터 프레임 행 선택

나는 이유에 궁금 df[2]동안 지원되지 않습니다 df.ix[2]하고 df[2:3]모두 작동합니다. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 파이썬 인덱싱 규칙과 일관된 df[2]방식으로 작동 할 것으로 기대 합니다 df[2:3]. 단일 정수로 …

395 python pandas dataframe indexing

«dataframe» 태그된 질문