«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.

14
Pandas 데이터 프레임에 모든 열 이름을 표시하는 방법은 무엇입니까?
수백 개의 열로 구성된 데이터 프레임이 있으며 모든 열 이름을 확인해야합니다. 제가 한: In[37]: data_all2.columns 출력은 다음과 같습니다. Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) 잘린 목록 대신 모든 열을 표시하려면 어떻게합니까 ?
127 python  pandas  dataframe  show 

4
pandas read_csv의 datetime dtypes
여러 datetime 열이있는 csv 파일을 읽고 있습니다. 파일을 읽을 때 데이터 유형을 설정해야하지만 날짜 시간이 문제인 것 같습니다. 예를 들면 : headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) 실행하면 오류가 발생합니다. TypeError : "datetime"데이터 유형을 이해할 수 없습니다. 사실 후에 …

4
Pandas의 두 열에서 튜플 열을 형성하는 방법
Pandas DataFrame이 있고 'lat'및 'long'열을 결합하여 튜플을 형성하고 싶습니다. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values Crime type 205482 non-null values …

10
Dataframe을 csv에 s3 Python에 직접 저장
새 CSV 파일에 업로드하려는 pandas DataFrame이 있습니다. 문제는 파일을 s3로 전송하기 전에 로컬에 저장하고 싶지 않다는 것입니다. 데이터 프레임을 s3에 직접 쓰는 to_csv와 같은 방법이 있습니까? boto3를 사용하고 있습니다. 지금까지 내가 가지고있는 것은 다음과 같습니다. import boto3 s3 = boto3.client('s3', aws_access_key_id='key', aws_secret_access_key='secret_key') read_file = s3.get_object(Bucket, Key) df = pd.read_csv(read_file['Body']) # …

2
Pandas로 무작위 정수의 DataFrame을 만드는 방법은 무엇입니까?
를 사용 randn하면 import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) 내가 찾고있는 것을 제공하지만 정규 분포의 요소를 사용합니다. 하지만 난 그냥 임의의 정수를 원하면 어떨까요? randint범위를 제공하여 작동하지만 배열은 randn그렇지 않습니다. 그렇다면 어떤 범위 사이의 임의의 정수로 어떻게 이것을 할 수 있습니까?

12
data.frame 행을 목록으로
행별로 목록으로 변환하려는 data.frame이 있습니다. 즉, 각 행은 자체 목록 요소에 해당합니다. 즉, data.frame에 행이있는 한 목록이 필요합니다. 지금까지 다음과 같은 방식으로이 문제를 다루었지만 이에 접근하는 더 좋은 방법이 있는지 궁금합니다. xy.df <- data.frame(x = runif(10), y = runif(10)) # pre-allocate a list and fill it with a loop xy.list …
123 list  r  dataframe 

8
$ 및 문자 값을 사용하여 데이터 프레임 열을 동적으로 선택
다른 열 이름의 벡터가 있고 각 열을 반복하여 data.frame에서 해당 열을 추출 할 수 있기를 원합니다. 예를 들어, 데이터 세트 mtcars와 문자형 벡터에 저장된 일부 변수 이름을 고려하십시오 cols. mtcars의 동적 하위 집합을 사용하여 변수를 선택하려고하면 cols이러한 작업의 아래에 cols <- c("mpg", "cyl", "am") col <- cols[1] col # [1] …
122 r  dataframe  r-faq 

3
각 행의 최대 값을 가진 열 이름을 찾습니다.
다음과 같은 DataFrame이 있습니다. In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 여기에서 각 행에 대해 최대 값을 가진 열 이름을 얻는 방법을 …
122 python  pandas  dataframe  max 

8
하나의 할당에서 Pandas 데이터 프레임에 여러 열을 추가하는 방법은 무엇입니까?
저는 pandas를 처음 사용하고 pandas에 여러 열을 동시에 추가하는 방법을 알아 내려고 노력하고 있습니다. 여기에 도움을 주시면 감사하겠습니다. 이상적으로는 여러 단계를 반복하는 대신 한 단계로 수행하고 싶습니다. import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]} df = pd.DataFrame(df) df[[ 'column_new_1', 'column_new_2','column_new_3']] = …
122 python  pandas  dataframe 

7
R 데이터 프레임에 행을 추가하는 방법
StackOverflow를 둘러 보았지만 R 데이터 프레임에 행을 추가하는 문제와 관련된 솔루션을 찾을 수 없습니다. 다음과 같이 빈 2 열 데이터 프레임을 초기화하고 있습니다. df = data.frame(x = numeric(), y = character()) 그런 다음 내 목표는 값 목록을 반복하고 각 반복에서 목록 끝에 값을 추가하는 것입니다. 다음 코드로 시작했습니다. for (i …
121 r  merge  append  dataframe  rows 

3
팬더 적용 함수에서 행의 인덱스 가져 오기
DataFramePandas 전체 에 적용된 함수의 행 인덱스에 액세스하려고합니다 . 다음과 같은 것이 있습니다. df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 주어진 행으로 요소에 액세스하는 함수를 정의하겠습니다. def rowFunc(row): return row['a'] + row['b'] * row['c'] 다음과 같이 적용 할 수 있습니다. …
121 python  pandas  dataframe 

14
각 그룹 내 행 수 계산
데이터 프레임이 있고 각 그룹 내의 행 수를 계산하고 싶습니다. aggregate다음과 같이 데이터를 합산 하기 위해 함수를 다시 사용합니다 . df2 <- aggregate(x ~ Year + Month, data = df1, sum) 이제 관측 값을 세고 싶지만 .NET에 대한 적절한 인수를 찾을 수없는 것 같습니다 FUN. 직관적으로 다음과 같을 것이라고 생각했습니다. …
121 r  dataframe  aggregate  r-faq 

5
data.frame 열 이름을 함수에 전달
나는 data.frame ( x) 및 a 를 받아들이는 함수를 작성하려고 column합니다. 이 함수는 x에서 일부 계산을 수행하고 나중에 다른 data.frame을 반환합니다. 열 이름을 함수에 전달하는 모범 사례 방법을 고수하고 있습니다. 두 개의 최소 예제 fun1와 fun2아래 는 예제로 x$column사용하여에서 작업을 수행 할 수있는 원하는 결과를 생성합니다 max(). 그러나 둘 다 …
119 r  dataframe  r-faq 

3
pandas에서 문자열에 목록의 하위 문자열 중 하나가 포함되어 있는지 테스트하는 방법은 무엇입니까?
df.isin()및 의 조합에 해당하는 기능이 df[col].str.contains()있습니까? 예를 들어, I has the series s = pd.Series(['cat','hat','dog','fog','pet']), I have to find all places where sof any of ['og', 'at'], I would want to get all than the 'pet'. 나는 해결책이 있지만 다소 우아하지 않습니다. searchfor = ['og', 'at'] found = [s.str.contains(x) for …

5
Pandas를 사용하여 문자열 열의 각 값에 문자열 접두사 추가
팬더 데이터 프레임의 해당 열에서 각 값의 시작 부분에 문자열을 추가하고 싶습니다 (우아하게). 나는 이미 이것을 수행하는 방법을 알아 냈고 현재 다음을 사용하고 있습니다. df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] 이것은 할 수있는 일이 지옥처럼 보입니다-다른 방법을 알고 있습니까 (그 열이 0 또는 NaN 인 행에 문자를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.