값이 복제되는 벡터의 고유 값을 나열하려면 어떻게해야합니까? 다음 SQL 문과 유사합니다.
SELECT DISTINCT product_code
FROM data
값이 복제되는 벡터의 고유 값을 나열하려면 어떻게해야합니까? 다음 SQL 문과 유사합니다.
SELECT DISTINCT product_code
FROM data
답변:
의미합니까 unique
:
R> x = c(1,1,2,3,4,4,4)
R> x
[1] 1 1 2 3 4 4 4
R> unique(x)
[1] 1 2 3 4
데이터가 실제로 a factor
이면 levels()
함수를 사용할 수 있습니다.
levels( data$product_code )
요인이 아니지만 그래야하는 경우 factor()
함수 를 사용하여 먼저 요인으로 변환 할 수 있습니다.
levels( factor( data$product_code ) )
위에서 언급 한 또 다른 옵션은 unique()
기능입니다.
unique( data$product_code )
둘 사이의 주요 차이점 (에 적용될 때 factor
)은 levels
코딩되었지만 발생하지 않는 모든 수준을 포함하여 수준 순서로 문자형 벡터를 반환 한다는 것입니다. 발생하지 않는 수준은 생략 된 상태로 값이 처음 나타나는 순서대로 unique
a factor
를 반환합니다 ( levels
반환 된 요소 에 여전히 포함되어 있음 ).