«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.

5
목록을 Pandas 데이터 프레임 열로 변환
내 목록을 한 열 팬더 데이터 프레임으로 변환해야합니다. 현재 목록 (len = 3) : ['Thanks You', 'Its fine no problem', 'Are you sure'] 필요한 Pandas DF (모양 = 3,) : 0 Thank You 1 Its fine no problem 2 Are you sure 숫자는 위의 Required Pandas DF의 인덱스를 나타냅니다.


1
복사없이 데이터 프레임을 data.table로 변환
.NET 파일로 변환하려는 대용량 데이터 프레임 (몇 GB 정도)이 data.table있습니다. 를 사용 as.data.table하면 데이터 프레임의 복사본이 생성됩니다. 즉, 사용 가능한 메모리가 데이터 크기의 두 배 이상이어야합니다. 복사본없이 변환 할 수있는 방법이 있습니까? 다음은이를 보여주는 간단한 예입니다. library(data.table) N <- 1e6 K <- 1e2 data <- as.data.frame(rep(data.frame(rnorm(N)), K)) gc(reset=TRUE) tracemem(data) data …

13
data.frame에서 누락 된 값을보고하는 우아한 방법
다음은 데이터 프레임에서 누락 된 값이있는 변수를보고하기 위해 작성한 코드입니다. 이 작업을 수행하는 더 우아한 방법, 아마도 data.frame을 반환하는 방법을 생각하고 있지만 갇혀 있습니다. for (Var in names(airquality)) { missing <- sum(is.na(airquality[,Var])) if (missing > 0) { print(c(Var,missing)) } } 편집 : 저는 수십에서 수백 개의 변수가있는 data.frame을 다루고 있으므로 …

9
Pandas DataFrame에서 잘못된 값을 None으로 바꿉니다.
NonePython의 Pandas에서 값을 대체하는 방법이 있습니까? df.replace('pre', 'post')값을 사용 하고 다른 값으로 바꿀 수 있지만 None값 으로 바꾸고 싶은 경우에는 할 수 없습니다. 시도하면 이상한 결과가 나타납니다. 그래서 여기에 예가 있습니다 : df = DataFrame(['-',3,2,5,1,-5,-1,'-',9]) df.replace('-', 0) 성공적인 결과를 반환합니다. 그러나, df.replace('-', None) 다음 결과를 반환합니다. 0 0 - // …

6
데이터 프레임의 모든 문자열 제거 / 자르기
python / pandas에서 다중 유형 데이터 프레임의 값을 정리하고 문자열을 자르고 싶습니다. 현재 두 가지 지침으로 수행하고 있습니다. import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True, inplace=True) #end df.values 이것은 매우 느립니다. 무엇을 개선 할 수 …

10
멋진 형식의 데이터 프레임을 (종이에) 인쇄하는 방법
이상적으로는 스크립트 내에서 멋진 형식의 데이터 프레임을 종이에 인쇄하고 싶습니다. (악기를 사용하여 데이터를 수집하고 R 스크립트를 사용하여 자동으로 처리하고 인쇄하려고합니다.) 지금은를 사용하여 텍스트 파일에 데이터 프레임을 쓸 수 write.table()있지만 여기에는 두 가지 문제가 있습니다. 결과 텍스트 파일의 형식이 잘못되었습니다 (열이 반드시 제목과 일치 할 필요는 없음). R 내에서 텍스트 파일을 …

3
열이 목록 인 data.frame 만들기
목록 열을 추가하는 방법을 알고 있습니다. > df <- data.frame(a=1:3) > df$b <- list(1:1, 1:2, 1:3) > df a b 1 1 1 2 2 1, 2 3 3 1, 2, 3 이것은 작동하지만 그렇지 않습니다. > df <- data.frame(a=1:3, b=list(1:1, 1:2, 1:3)) Error in data.frame(1L, 1:2, 1:3, check.names = …
80 r  list  dataframe 



5
각 변수에 대해 스택 및 반환 값 카운트?
객관식 질문을 통해 19717 명이 선택한 프로그래밍 언어의 응답을 기록하는 데이터 프레임이 있습니다. 첫 번째 열은 물론 응답자의 성별이며 나머지는 그들이 선택한 선택입니다. 따라서 Python을 선택하면 내 응답이 Python 열에 기록되고 bash가 아니며 그 반대도 마찬가지입니다. ID Gender Python Bash R JavaScript C++ 0 Male Python nan nan JavaScript nan …

4
두 열의 목록을 행별로 효율적으로 비교
다음과 같이 Pandas DataFrame이있는 경우 : import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc 그러나 약 10 만 개의 …

3
팬더에서 두 개의 지리 데이터 프레임으로 가장 가까운 거리를 얻으십시오.
여기 내 첫 번째 지오 데이트 프레임이 있습니다. !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, …


3
[:] 대 iloc [:]로 할당하면 판다에서 다른 결과가 나오는 이유는 무엇입니까?
iloc팬더에서 사용하는 다른 인덱싱 방법과 혼동됩니다 . 1-d 데이터 프레임을 2-d 데이터 프레임으로 변환하려고한다고 가정 해 봅시다. 먼저 다음 1-d 데이터 프레임이 있습니다. a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T 그리고 크기를 2 차원 데이터 프레임으로 변환하려고합니다 2x4. 다음과 같이 2 차원 데이터 프레임을 사전 설정하여 시작합니다. b_df = pd.DataFrame(columns=range(4),index=range(2)) 그런 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.