돌연변이가 조건부 (특정 열 값의 값에 따라) 일 때 돌연변이를 사용할 수 있습니까?
이 예는 내가 의미하는 바를 보여줍니다.
structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4,
2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, 5, 3), d = c(6, 2, 4,
5, 3, 7, 2, 6), e = c(1, 2, 4, 5, 6, 7, 6, 3), f = c(2, 3, 4,
2, 2, 7, 5, 2)), .Names = c("a", "b", "c", "d", "e", "f"), row.names = c(NA,
8L), class = "data.frame")
a b c d e f
1 1 1 6 6 1 2
2 3 3 3 2 2 3
3 4 4 6 4 4 4
4 6 2 5 5 5 2
5 3 6 3 3 6 2
6 2 7 6 7 7 7
7 5 2 5 2 6 5
8 1 6 3 6 3 2
dplyr 패키지를 사용하여 내 문제에 대한 해결책을 찾고 싶었습니다 (그리고 그래야 작동하는 코드가 아니라는 것을 알고 있지만 목적이 명확하다고 생각합니다) g :
library(dplyr)
df <- mutate(df,
if (a == 2 | a == 5 | a == 7 | (a == 1 & b == 4)){g = 2},
if (a == 0 | a == 1 | a == 4 | a == 3 | c == 4) {g = 3})
내가 찾고있는 코드의 결과는이 특정 예제 에서이 결과를 가져야합니다.
a b c d e f g
1 1 1 6 6 1 2 3
2 3 3 3 2 2 3 3
3 4 4 6 4 4 4 3
4 6 2 5 5 5 2 NA
5 3 6 3 3 6 2 NA
6 2 7 6 7 7 7 2
7 5 2 5 2 6 5 2
8 1 6 3 6 3 2 3
dplyr 에서이 작업을 수행하는 방법에 대한 아이디어가 있습니까? 이 데이터 프레임은 단지 예일뿐입니다. 처리중인 데이터 프레임이 훨씬 큽니다. 속도 때문에 dplyr을 사용하려고했지만이 문제를 처리하는 다른 더 좋은 방법이 있습니까?
dplyr::case_when()
보다 명확합니다ifelse
.