다른 값을 기준으로 한 벡터를 정렬하는 방법


112

벡터 y의 값 순서를 기준으로 정렬하려는 벡터 x가 있습니다. 두 벡터의 길이가 동일하지 않습니다.

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

예상되는 결과는 다음과 같습니다.

[1] 4 4 4 2 2 1 3 3 3

답변:


70

여기 하나의 라이너가 있습니다 ...

y[sort(order(y)[x])]

이것은 다음과 같이 분류됩니다.

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders

1
그것은 매우 간결하지만 거기에서 무슨 일이 일어나고 있는지 파악하는 데 어려움을 겪고 있습니다. 좀 더 자세히 설명해 주시겠습니까?
Matt Parker

3
이것은 예쁘고 R의 내장 기능을 잘 이해하고 있음을 보여줍니다. +1
Godeke 09-10-15

6
일반적으로 y가 1 : length (y)의 순열이 아닌 경우에도이 작업을 수행 할 수 있습니다. 이 경우이 솔루션은 작동하지 않지만 아래 gd047의 솔루션 인 x [order (match (x, y))]는 작동합니다.
Rahul Savani 2012

5
나는 이것이 왜 40 개의 업 보트를 가지고 있는지에 대해 당황스러워합니다. x및 에 대한 많은 간단한 변형에 대해 실패합니다 y. x <- c(1,4,2); y <- c(1,2,4)예를 들어.
thelatemail 2015 년

1
@thelatemail 동의합니다. 광기를 멈추고이 답변에 반대 투표하십시오!
Ian Fellows

184

이건 어때

x[order(match(x,y))]

29
이것은 더 일반적이기 때문에 허용되는 대답 IMHO보다 낫습니다.
fmark

2
나는 이것이 기본 GNU-R에 있어야한다고 말할 수 있습니다.
파국적 실패

이 대답은 x와 y 모두에 문자 벡터를 사용할 때 잘 작동했습니다. 수락 된 답변에서와 같이 분해 / 약간 정교함을 추가하면 좋을 것입니다
mavericks

4

x정렬 된 요소 로 변환 할 수 있습니다 .

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

분명히 숫자를 요인으로 변경하면 코드 다운 스트림이 x. 그러나 다음에 무슨 일이 일어날 지에 대한 맥락을 알려주지 않았기 때문에 나는 이것을 옵션으로 제안 할 것이라고 생각했습니다.


1
정수가 아닌 경우에도 작동하므로 이것이 최선의 대답이어야합니다. 또는 약간 변경된 x정렬 벡터 에 없는 값이있을 때도 작동합니다 y.x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
rawr

2

어때? :

rep(y,table(x)[as.character(y)])

(Ian의 것이 아마도 여전히 더 좋습니다)


2

숫자 나 문자에 관계없이 "y"로 주문해야하는 경우 :

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

단계별 :

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

1

[ 편집 : 분명히 Ian은 올바른 접근 방식을 가지고 있지만 후세를 위해이 부분을 남겨 둘 것입니다.]

y 벡터를 인덱싱하여 루프없이이를 수행 할 수 있습니다. 증가하는 숫자 값을 y에 추가하고 병합합니다.

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

0
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

z의 결과 : 4444 2 1 3 3 3

중요한 단계 :

  1. for (i in y)-관심있는 요소를 반복합니다.

  2. z <-c (z, ...)-각 하위 표현식을 차례로 연결합니다.

  3. rep (i, sum (x == i))-i (현재 관심 요소) sum (x == i) 번 (x에서 i를 찾은 횟수)을 반복합니다.


0

또한 당신은 사용 sqldf하고 그것을 할 join에 기능 sql다음을 추천했습니다 :

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.