«dplyr» 태그된 질문

group_by, summary, filter 및 select와 같은 dplyr 패키지의 함수와 관련된 질문에이 태그를 사용하십시오.

5
여러 열 집합 수집
응답자가 질문을 1-3 번 반복하는 온라인 설문 조사의 데이터가 있습니다. 설문 조사 소프트웨어 (Qualtrics)는이 데이터를 여러 열에 기록합니다. 즉, 설문 조사의 Q3.2 Q3.2.1.에는 Q3.2.2., 및 Q3.2.3.다음 열이 있습니다 . df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. = rnorm(10, 0, 1), Q3.2.2. = rnorm(10, 0, 1), …
108 r  reshape  dplyr  qualtrics  tidyr 

6
dplyr을 사용하여 여러 열의 합계
내 질문에는 데이터 프레임의 여러 열에 걸쳐 값을 합산하고을 사용 하여이 합계에 해당하는 새 열을 만드는 것이 포함됩니다 dplyr. 열의 데이터 항목은 binary (0,1)입니다. 의 summarise_each또는 mutate_each함수의 행 방식 아날로그를 생각하고 dplyr있습니다. 다음은 데이터 프레임의 최소 예입니다. library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), x2=c(1,1,NA,1,1,0,NA,NA,0,1), x3=c(0,1,0,1,1,0,NA,NA,0,1), x4=c(1,0,NA,1,0,0,NA,0,0,1), x5=c(1,1,NA,1,1,1,NA,1,0,1)) > df x1 x2 x3 x4 …
98 r  dplyr 

6
dplyr을 사용하여 data.frame의 전체 케이스 필터링 (케이스 별 삭제)
dplyr을 사용하여 완전한 케이스에 대해 data.frame을 필터링 할 수 있습니까? complete.cases물론 모든 변수 목록이 작동합니다. 그러나 그것은 a) 변수가 많을 때 장황하고 b) 변수 이름을 알 수없는 경우 불가능합니다 (예 : data.frame을 처리하는 함수에서). library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.% filter(complete.cases(x1,x2))
97 r  dplyr  magrittr 

4
dplyr 요약 : 출력에서 ​​길이가 0 인 그룹을 유지하려면 ".drop = FALSE"와 동일합니다.
summarisewith plyr의 ddply함수를 사용하면 기본적으로 빈 카테고리가 삭제됩니다. 을 추가하여이 동작을 변경할 수 있습니다 .drop = FALSE. 그러나 .NET summarise과 함께 사용할 때는 작동하지 않습니다 dplyr. 결과에서 빈 범주를 유지하는 다른 방법이 있습니까? 다음은 가짜 데이터가있는 예입니다. library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add an extra level to df$b …
97 r  dplyr  plyr  tidyr 

8
R dplyr : 여러 열 삭제
해당 데이터 프레임에 삭제하려는 데이터 프레임과 열 목록이 있습니다. 하자의 사용 iris예를 들어 데이터 집합을. 나는 드롭하고 싶습니다 Sepal.Length과 Sepal.Width만 나머지 열을 사용합니다. 패키지를 사용 select하거나 패키지 select_에서 어떻게 수행 dplyr합니까? 지금까지 시도한 내용은 다음과 같습니다. drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% select(-drop.cols) -drop.cols 오류 : 단항 연산자에 대한 잘못된 …
96 r  dplyr 

6
dplyr :“n () 오류 : 함수를 직접 호출하면 안됩니다.”
dplyr 패키지의 예제 중 하나를 재현하려고하는데이 오류 메시지가 나타납니다. 각 조합의 빈도로 생성 된 새 열 n이 표시 될 것으로 예상합니다. 내가 무엇을 놓치고 있습니까? 패키지가로드되었는지 세 번 확인했습니다. library(dplyr) # summarise peels off a single layer of grouping by_vs_am <- group_by(mtcars, vs, am) by_vs <- summarise(by_vs_am, n = n()) …

1
dplyr 메시지`summarise ()`재 그룹화 출력을 'x'로 해석하는 방법 (`.groups` 인수로 재정의)?
dplyr 개발 버전 0.8.99.9003으로 업데이트 한 후 group_by 및 summarise ()를 실행할 때 새 메시지 (게시물 제목 참조)를 받기 시작했습니다. 다음은 출력을 다시 만드는 예입니다. library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% convert(chr(year,week)) %>% mutate(total_rodents = rowSums(select_if(., is.numeric))) …
94 r  dplyr  summarize 

6
그룹 별 최고 가치 얻기
다음은 샘플 데이터 프레임입니다. d <- data.frame( x = runif(90), grp = gl(3, 30) ) 의 각 값에 대해 d상위 5 개 값이있는 행 을 포함 하는 하위 집합을 원합니다 .xgrp base-R을 사용하면 내 접근 방식은 다음과 같습니다. ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads …
93 r  data.table  dplyr 

5
R 파이프 연산자 %> % 사용시 조건부 평가
파이프 연산자를 사용하는 경우 %>%같은 패키지 dplyr, ggvis, dycharts, 등, 어떻게해야 내가 조건부 단계를합니까? 예를 들면 다음과 같습니다. step_1 %>% step_2 %>% if(condition) step_3 이러한 접근 방식은 작동하지 않는 것 같습니다. step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 먼 길이 있습니다. if(condition) { step_1 %>% …
93 r  dplyr  ggvis  magrittr 

4
data.table의 dplyr, 실제로 data.table을 사용하고 있습니까?
datatable 위에 dplyr 구문을 사용하면 dplyr 구문을 사용 하면서 datatable의 모든 속도 이점을 얻을 수 있습니까? 즉, dplyr 구문으로 쿼리하면 데이터 테이블을 잘못 사용합니까? 아니면 순수한 데이터 테이블 구문을 사용하여 모든 기능을 활용해야합니까? 조언에 미리 감사드립니다. 코드 예 : library(data.table) library(dplyr) diamondsDT <- data.table(ggplot2::diamonds) setkey(diamondsDT, cut) diamondsDT %>% filter(cut != …
91 r  data.table  dplyr 

2
dplyr에서 조인 할 때 x 및 y에 대한 열 이름을 지정하는 방법은 무엇입니까?
dplyr을 사용하여 결합하려는 두 개의 데이터 프레임이 있습니다. 하나는 이름을 포함하는 데이터 프레임입니다. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) 다른 데이터 프레임에는 성별을 식별하는 Kantrowitz 이름 말뭉치의 정리 된 버전이 포함되어 있습니다. 다음은 최소한의 예입니다. kantrowitz <- structure(list(name = c("john", "bill", "madison", "abby", "thomas"), …
89 r  join  left-join  dplyr 

3
dplyr 조건부 값으로 변경
4 개의 열이있는 큰 데이터 프레임 ( "myfile")에서 처음 4 개의 열을 기준으로 조건부 값이있는 다섯 번째 열을 추가해야합니다. 주로 큰 데이터 세트의 속도 때문에 dplyr및로 답변을 선호합니다 mutate. 내 데이터 프레임은 다음과 같습니다. V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 3 1 …
87 r  dplyr  mutate 

12
dplyr 행의 하위 집합에서 여러 열을 변경 / 바꾸기
dplyr 기반 워크 플로를 시도하는 중입니다 (대부분 data.table을 사용하는 대신). 이에 상응하는 dplyr 솔루션을 찾을 수없는 문제가 발생했습니다. . 일반적으로 단일 조건에 따라 여러 열을 조건부로 업데이트 / 교체해야하는 시나리오에 직면합니다. 다음은 내 data.table 솔루션과 함께 몇 가지 예제 코드입니다. library(data.table) # Create some sample data set.seed(1) dt <- data.table(site …
85 r  data.table  dplyr 

4
dplyr을 사용하여 그룹 별 행 수 계산
mtcars데이터 세트를 사용하고 있습니다. 특정 데이터 조합에 대한 레코드 수를 찾고 싶습니다. count(*)SQL 의 group by 절 과 매우 유사한 것 입니다. ddply()에서 plyr 나를 위해 노력하고 있습니다 library(plyr) ddply(mtcars, .(cyl,gear),nrow) 출력 있음 cyl gear V1 1 4 3 1 2 4 4 8 3 4 5 2 4 6 …
83 r  dplyr  count  plyr 

4
문자열 일치를 기반으로 열 선택-dplyr :: select
많은 열이있는 데이터 프레임 ( "데이터")이 있습니다. 일부 열에는 특정 문자열 ( "search_string")이 포함되어 있습니다. dplyr::select()문자열이 포함 된 열만 포함하는 하위 집합을 제공 하려면 어떻게 해야합니까? 나는 시도했다 : # columns as boolean vector select(data, grepl("search_string",colnames(data))) # columns as vector of column names names select(data, colnames(data)[grepl("search_string",colnames(data))]) 둘 다 작동하지 않습니다. …
83 r  regex  dplyr 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.