나는 이와 같은 data.frame을 가지고있다-
set.seed(123)
df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10)
> df
x y z
1 0 1 1
2 1 0 2
3 0 1 3
4 1 1 4
5 1 0 5
6 0 1 6
7 1 0 7
8 1 0 8
9 1 0 9
10 0 1 10
처음 두 열을 기준으로 중복 행을 제거하고 싶습니다. 예상 출력-
df[!duplicated(df[,1:2]),]
x y z
1 0 1 1
2 1 0 2
4 1 1 4
구체적으로 dplyr
패키지를 사용하는 솔루션을 찾고 있습니다.
df %>% group_by(x, y) %>% do(head(.,1))