«data.table» 태그된 질문

R data.table 패키지는 빠른 인 메모리 데이터 분석을 위해 구축 된 data.frame의 확장입니다. Shiny (DT)와 함께 DataTables 패키지에 dt 태그를 사용하십시오.

8
data.table의 열 클래스 변환
data.table 사용에 문제가 있습니다. 열 클래스를 어떻게 변환합니까? 다음은 간단한 예입니다. data.frame을 사용하면 변환하는 데 문제가 없습니다. data.table을 사용하면 방법을 모르겠습니다. df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- as.numeric(df[, "value"]) library(data.table) dt <- data.table(ID=c(rep("A", 5), rep("B",5)), …
118 r  data.table 

2
data.table에 키를 설정하는 목적은 무엇입니까?
data.table을 사용하고 있으며 키를 설정해야하는 많은 기능이 있습니다 (예 :) X[Y]. 따라서 데이터 테이블에서 키를 올바르게 설정하기 위해 키가 수행하는 작업을 이해하고 싶습니다. 내가 읽은 한 출처는 ?setkey. setkey()a를 정렬하고 정렬 된 것으로 data.table표시합니다. 정렬 된 열이 핵심입니다. 키는 순서에 관계없이 모든 열이 될 수 있습니다. 열은 항상 오름차순으로 정렬됩니다. …
113 r  data.table 

8
R 데이터 프레임에서`Inf` 값 정리
R Inf에는 데이터 프레임을 변환 할 때 일부 값 을 생성하는 작업이 있습니다. 이러한 Inf가치를 NA가치 로 바꾸고 싶습니다 . 내가 가진 코드는 대용량 데이터의 경우 느립니다. 더 빠른 방법이 있습니까? 다음 데이터 프레임이 있다고 가정합니다. dat <- data.frame(a=c(1, Inf), b=c(Inf, 3), d=c("a","b")) 다음은 단일 경우에서 작동합니다. dat[,1][is.infinite(dat[,1])] = NA …
101 r  dataframe  data.table 

5
R에서 data.frame을 병합 / 결합하는 가장 빠른 방법은 무엇입니까?
예 (대부분의 대표적인 예인지 확실하지 않음) : N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) 이것이 내가 지금까지 얻은 것입니다. d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( dt1[dt2,list(x,y1,y2=dt2$y2)] ) …

6
그룹 별 최고 가치 얻기
다음은 샘플 데이터 프레임입니다. d <- data.frame( x = runif(90), grp = gl(3, 30) ) 의 각 값에 대해 d상위 5 개 값이있는 행 을 포함 하는 하위 집합을 원합니다 .xgrp base-R을 사용하면 내 접근 방식은 다음과 같습니다. ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads …
93 r  data.table  dplyr 

4
data.table의 dplyr, 실제로 data.table을 사용하고 있습니까?
datatable 위에 dplyr 구문을 사용하면 dplyr 구문을 사용 하면서 datatable의 모든 속도 이점을 얻을 수 있습니까? 즉, dplyr 구문으로 쿼리하면 데이터 테이블을 잘못 사용합니까? 아니면 순수한 데이터 테이블 구문을 사용하여 모든 기능을 활용해야합니까? 조언에 미리 감사드립니다. 코드 예 : library(data.table) library(dplyr) diamondsDT <- data.table(ggplot2::diamonds) setkey(diamondsDT, cut) diamondsDT %>% filter(cut != …
91 r  data.table  dplyr 

5
변수 이름이 문자형 벡터에 저장 될 때 data.table 선택 / 할당
data.table변수 이름이 문자형 벡터에 저장된 경우에서 변수 를 어떻게 참조 합니까? 예를 들어, 이것은 다음에서 작동합니다 data.frame. df <- data.frame(col1 = 1:3) colname <- "col1" df[colname] <- 4:6 df # col1 # 1 4 # 2 5 # 3 6 :=표기법을 사용하거나 사용하지 않고 data.table에 대해 동일한 작업을 어떻게 수행 …
91 r  data.table 


5
data.table 열에서 텍스트 문자열 분할
CSV 파일의 데이터를 a로 읽은 data.table다음 한 열의 텍스트를 여러 새 열로 분할 하는 스크립트가 있습니다. 현재이 작업을 수행하기 위해 lapply및 strsplit함수를 사용 하고 있습니다. 예를 들면 다음과 같습니다. library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) # split PREFIX into new columns dt$PX = as.character(lapply(strsplit(as.character(dt$PREFIX), …
87 r  data.table 

7
data.table의 지정된 모든 열에 동일한 함수를 적용하는 방법
특정 열에서 동일한 작업을 수행하려는 data.table이 있습니다. 이 열의 이름은 문자형 벡터로 제공됩니다. 이 특정 예에서는이 모든 열에 -1을 곱하고 싶습니다. 관련 열을 지정하는 일부 장난감 데이터 및 벡터 : library(data.table) dt <- data.table(a = 1:3, b = 1:3, d = 1:3) cols <- c("a", "b") 지금은 문자 벡터를 반복하면서 …
85 r  data.table 

12
dplyr 행의 하위 집합에서 여러 열을 변경 / 바꾸기
dplyr 기반 워크 플로를 시도하는 중입니다 (대부분 data.table을 사용하는 대신). 이에 상응하는 dplyr 솔루션을 찾을 수없는 문제가 발생했습니다. . 일반적으로 단일 조건에 따라 여러 열을 조건부로 업데이트 / 교체해야하는 시나리오에 직면합니다. 다음은 내 data.table 솔루션과 함께 몇 가지 예제 코드입니다. library(data.table) # Create some sample data set.seed(1) dt <- data.table(site …
85 r  data.table  dplyr 

10
선택한 열에 대한 테이블의 NA 값을 바꾸는 방법
NA 값 대체에 대한 많은 게시물이 있습니다. 다음 표 / 프레임의 NA를 다음으로 대체 할 수 있다는 것을 알고 있습니다. x[is.na(x)]<-0 그러나 특정 열로만 제한하려면 어떻게해야합니까? 예를 하나 보여 드리겠습니다. 먼저 데이터 세트부터 시작하겠습니다. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, replace=T), c=sample(c(1:5,NA), 10, replace=T)) 다음을 제공합니다. a b …

8
R 데이터에서 이전 행의 값을 사용합니다.
한 열의 현재 값과 다른 열의 이전 값에서 계산 된 data.table에 새 열을 만들고 싶습니다. 이전 행에 액세스 할 수 있습니까? 예 : > DT <- data.table(A=1:5, B=1:5*10, C=1:5*100) > DT A B C 1: 1 10 100 2: 2 20 200 3: 3 30 300 4: 4 40 400 …
81 r  data.table 

1
복사없이 데이터 프레임을 data.table로 변환
.NET 파일로 변환하려는 대용량 데이터 프레임 (몇 GB 정도)이 data.table있습니다. 를 사용 as.data.table하면 데이터 프레임의 복사본이 생성됩니다. 즉, 사용 가능한 메모리가 데이터 크기의 두 배 이상이어야합니다. 복사본없이 변환 할 수있는 방법이 있습니까? 다음은이를 보여주는 간단한 예입니다. library(data.table) N <- 1e6 K <- 1e2 data <- as.data.frame(rep(data.frame(rnorm(N)), K)) gc(reset=TRUE) tracemem(data) data …

5
그룹없이 NA 값을 선형 보간하는 data.table
그룹없이 data.table에 NA 값을 채우고 싶었습니다. 시간과 거리를 나타내는이 data.table 추출을 고려하십시오. library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, NA, 31161.47, NA, NA, NA, NA, 31182.97)) DT<- data.table(df) DT data.table에서 NA 값을 …
18 r  data.table 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.