«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.

11
데이터 프레임에서 열을 어떻게 재정렬합니까?
시간, 입력, 출력, 파일 순서대로이 입력을 어떻게 변경합니까? Time In Out Files 1 2 3 4 2 3 4 5 이 출력에 (시퀀스 : 시간, 출력, 파일)? Time Out In Files 1 3 2 4 2 4 3 5 더미 R 데이터는 다음과 같습니다. table <- data.frame(Time=c(1,2), In=c(2,3), Out=c(3,4), Files=c(4,5)) …
311 r  sorting  dataframe  r-faq 

11
데이터 프레임에서 이름별로 열을 삭제하는 방법
큰 데이터 세트가 있으며 특정 열을 읽거나 다른 열을 모두 삭제하고 싶습니다. data <- read.dta("file.dta") 관심이없는 열을 선택합니다. var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] 그리고 내가하고 싶은 것보다 : for(i in 1:length(var.out)) { paste("data$", var.out[i], sep="") <- NULL } 원하지 않는 모든 열을 삭제합니다. 이것이 최적의 솔루션입니까?
304 r  dataframe  subset 

15
Python dict를 데이터 프레임으로 변환
다음과 같은 Python 사전이 있습니다. {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': 391, u'2012-06-30': …
299 python  pandas  dataframe 


11
벡터의 마지막 값에 액세스하는 방법은 무엇입니까?
하나 또는 두 수준의 데이터 프레임에 중첩 된 벡터가 있다고 가정합니다. length()함수 를 사용하지 않고 마지막 값에 액세스하는 빠르고 더러운 방법이 있습니까? PERL의 $#특별한 var가 뭔가 있습니까? 그래서 나는 다음과 같은 것을 원합니다 : dat$vec1$vec2[$#] 대신에 dat$vec1$vec2[length(dat$vec1$vec2)]
290 r  dataframe  vector 



3
Pandas에 열이 있는지 확인하는 방법
Pandas DataFrame에 열이 있는지 확인하는 방법이 있습니까? 다음과 같은 DataFrame이 있다고 가정하십시오. >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B …
274 python  pandas  dataframe 

21
팬더의 축은 무엇을 의미합니까?
데이터 프레임을 생성하는 코드는 다음과 같습니다. import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) 그런 다음 데이터 프레임을 얻었습니다. +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ 내가 commmand를 입력하면 : dff.mean(axis=1) 나는 얻었다 : 0 1.074821 dtype: float64 팬더의 참조에 …

6
R의 data.frame에서 전체 열을 제거하십시오.
누구나 R의 data.frame에서 전체 열을 제거하는 방법을 알고 있습니까? 예를 들어이 data.frame이 주어지면 : > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon 두 번째 열을 제거하고 싶습니다.
267 r  dataframe 

10
팬더에서 데이터 프레임의 열 조각을 가져 오는 방법
CSV 파일에서 일부 기계 학습 데이터를로드합니다. 처음 2 개의 열은 관측치이고 나머지 열은 피처입니다. 현재 다음을 수행합니다. data = pandas.read_csv('mydata.csv') 그것은 다음과 같은 것을 제공합니다 : data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 나는 두 dataframes이 dataframe 슬라이스 싶습니다 하나의 열을 포함 a하고 b하나가 열을 포함하는 c, d하고 e. 같은 것을 …


20
Pandas 데이터 프레임의 열 정규화
각 열의 값 범위가 다른 팬더에 데이터 프레임이 있습니다. 예를 들면 : df : A B C 1000 10 0.5 765 5 0.35 800 7 0.09 각 값이 0과 1 사이 인이 데이터 프레임의 열을 어떻게 정규화 할 수 있는지 아십니까? 내 원하는 출력은 다음과 같습니다. A B C 1 …


9
목록에서 여러 데이터 프레임을 동시에 병합
병합하려는 많은 data.frames 목록이 있습니다. 여기서 문제는 각 data.frame이 행과 열 수의 관점에서 다르지만 모두 핵심 변수 ( 아래에서 호출 "var1"하고 "var2"코드)를 공유한다는 것 입니다. data.frames 가 열 측면에서 동일 rbind하다면 plyr의 rbind.fill 이 작업을 수행 할 수는 있지만이 데이터의 경우는 아닙니다. 이 merge명령은 2 data.frame에서만 작동 하기 때문에 아이디어를 …
258 r  list  merge  dataframe  r-faq 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.