«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.


10
Pandas의 map, applymap 및 apply 메소드의 차이점
이러한 벡터화 방법을 기본 예제와 함께 사용하는시기를 알려주시겠습니까? 그 볼 mapA는 Series있는 나머지 반면, 방법 DataFrame방법. 나는 혼동있어 apply및 applymap방법하지만. 왜 DataFrame에 함수를 적용하는 두 가지 방법이 있습니까? 사용법을 보여주는 간단한 예제도 훌륭합니다!


5
빈 Pandas DataFrame을 만든 다음 채우시겠습니까?
나는 판다 데이터 프레임 문서에서 시작하고 있습니다 : http://pandas.pydata.org/pandas-docs/stable/dsintro.html 시계열 종류의 계산 값으로 DataFrame을 반복적으로 채우고 싶습니다. 따라서 기본적으로 열 A, B 및 타임 스탬프 행, 모두 0 또는 모든 NaN으로 DataFrame을 초기화하고 싶습니다. 그런 다음 초기 값을 추가 하고이 데이터를 검토하여 이전의 행에서 새 행을 계산합니다 row[A][t] = row[A][t-1]+1. …
461 python  dataframe  pandas 

24
pandas DataFrame의 열에서 NaN 값을 계산하는 방법
number of을 찾고 싶은 데이터가 NaN있으므로 임계 값보다 작 으면이 열을 삭제합니다. 나는 보았지만 이것에 대한 기능을 찾지 못했습니다. 있다value_counts 있지만 대부분의 값이 고유하고 카운트 NaN만 원하기 때문에 속도가 느려집니다 .
459 python  pandas  dataframe 



11
팬더 DataFrame에서 부분 문자열로 선택
나는이 DataFrame두 문자열 값을 포함하는 4 열을. 특정 열과 부분 문자열 일치를 기반으로 행을 선택하는 방법이 있는지 궁금합니다. 즉, 다음과 같은 기능을 수행하는 함수 또는 람다 함수 re.search(pattern, cell_in_question) 부울을 반환합니다. 나는 구문에 익숙 df[df['A'] == "hello world"]하지만 부분 문자열 일치 say로 동일한 작업을 수행하는 방법을 찾지 못하는 것 같습니다 …

9
DataFrame 행 섞기
다음과 같은 DataFrame이 있습니다. Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame은 csv 파일에서 읽습니다. Type1이 있는 모든 행 은 …

7
pandas GroupBy를 사용하여 각 그룹 (예 : 개수, 평균 등)에 대한 통계를 얻으십니까?
데이터 프레임이 df있고 여러 열을 사용합니다 groupby. df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() 위의 방법으로 필요한 테이블 (데이터 프레임)을 거의 얻습니다. 누락 된 것은 각 그룹의 행 수를 포함하는 추가 열입니다. 즉, 나는 의미가 있지만 이러한 수단을 얻는 데 사용 된 숫자의 수를 알고 싶습니다. 예를 들어 첫 번째 그룹에는 8 개의 값이 있고 두 …

7
SQL에서와 같이 'in'과 'not in'을 사용하여 Pandas 데이터 프레임을 필터링하는 방법
SQL IN과 동등한 것을 어떻게 달성 할 수 NOT IN있습니까? 필요한 값이있는 목록이 있습니다. 시나리오는 다음과 같습니다. df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] 이 작업을 수행하는 현재 방법은 다음과 같습니다. df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

18
Python을 사용하여 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError
30,000 개의 유사한 파일을 처리하는 프로그램을 실행 중입니다. 임의의 숫자 가이 오류를 중지하고 생성합니다 ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret = …

15
여러 CSV 파일을 팬더로 가져오고 하나의 DataFrame으로 연결
디렉토리에서 팬더로 여러 CSV 파일을 읽고 하나의 큰 DataFrame으로 연결하고 싶습니다. 나는 그것을 알아낼 수 없었다. 여기 내가 지금까지 가지고있는 것입니다 : import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate …

16
데이터 프레임의 열 이름 변경
"newprice"라는 데이터 프레임이 있고 (아래 참조) R의 프로그램에서 열 이름을 변경하고 싶습니다. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 실제로 이것이하는 일입니다. names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") 각 열 이름이 다른 것처럼 보이기를 원하기 때문에 이것을 루프에 넣지 않았습니다. 프로그램을 R 콘솔에 …
399 r  dataframe  rename 

6
정수 인덱스로 팬더 시리즈 / 데이터 프레임 행 선택
나는 이유에 궁금 df[2]동안 지원되지 않습니다 df.ix[2]하고 df[2:3]모두 작동합니다. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 파이썬 인덱싱 규칙과 일관된 df[2]방식으로 작동 할 것으로 기대 합니다 df[2:3]. 단일 정수로 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.