특히이 변수에 특수 문자가있는 경우 변수에서 첫 번째 요소를 제거하려면 어떻게해야합니까? 예를 들어, 다음 열이 있습니다.
Date
01/01/2009
01/01/2010
01/01/2011
01/01/2012
다음과 같은 새 열이 필요합니다.
Date
2009
2010
2011
2012
특히이 변수에 특수 문자가있는 경우 변수에서 첫 번째 요소를 제거하려면 어떻게해야합니까? 예를 들어, 다음 열이 있습니다.
Date
01/01/2009
01/01/2010
01/01/2011
01/01/2012
다음과 같은 새 열이 필요합니다.
Date
2009
2010
2011
2012
gsub(".*/","",df$Date)
substr(as.character(....), 7, 10)
lubridate::year
데이터가 @akrun에서 제안한 '날짜'형식이면 트릭을 수행해야합니다.
Date
사용하고 일부 format
또는 다른 함수를 사용하여 일부를 추출하는 것입니다. 예 : x <- as.Date("01/01/2009", format = "%m/%d/%Y"); lubridate::year(x)
.
답변:
모든 날짜의 너비가 같으면 날짜를 벡터에 넣고 하위 문자열을 사용할 수 있습니다.
Date
a <- c("01/01/2009", "01/01/2010" , "01/01/2011")
substring(a,7,10) #This takes string and only keeps the characters beginning in position 7 to position 10
산출
[1] "2009" "2010" "2011"
as.numeric(substring(a,7,10))
주석에서 논의했듯이 항목을 Date
형식 으로 변환 하고 연도를 추출하면 다음과 같이 수행 할 수 있습니다 .
format(as.Date(df1$Date, format="%d/%m/%Y"),"%Y")
format()
의 문서, 아무것도 당신이 한 것으로 두 번째 인수에 대해 말했다있다. 이것을 어떻게 이해해야합니까?
?format
: "형식은 일반 함수 입니다. 여기에 설명 된 방법 외에도 날짜에 대한 방법이 있습니다 ( format.Date 참조 )". From ?format.Date
: "## 클래스 ' Date'format (x, ...)에 대한 S3 메서드 [여기서 ...는] as.character 및 as.Date 메서드의 형식을 포함 하여 다른 메서드에서 또는 다른 메서드로 전달할 추가 인수 입니다. ". 의 첫 번째 예를 참조하십시오 ?format.Date
.
library(lubridate)
a=mdy(b)
year(a)
https://cran.r-project.org/web/packages/lubridate/vignettes/lubridate.html http://vita.had.co.nz/papers/lubridate.pdf
date
package를 사용한다면 이것은 상당히 쉽게 할 수 있습니다.
library(date)
Date <- c("01/01/2009", "01/01/2010", "01/01/2011", "01/01/2012")
Date <- as.date(Date)
Date
# [1] 1Jan2009 1Jan2010 1Jan2011 1Jan2012
date.mdy(Date)$year
# [1] 2009 2010 2011 2012
## be aware that these are now integers and thus different methods may be invoked:
str(date.mdy(Date)$year)
# int [1:4] 2009 2010 2011 2012
summary(Date)
# First Last
# "1Jan2009" "1Jan2012"
summary(date.mdy(Date)$year)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 2009 2010 2010 2010 2011 2012
이것은 특정 답변보다 더 많은 조언이지만 내 제안은 날짜를 문자열로 유지하는 대신 날짜를 날짜 변수로 즉시 변환하는 것입니다. 이렇게하면 매우 번거로운 해결 방법을 사용하지 않고 날짜 (및 시간) 기능을 사용할 수 있습니다.
지적했듯이 윤활유 패키지에는 좋은 추출 기능이 있습니다.
일부 프로젝트의 경우 시작부터 날짜를 연결하는 것이 도움이된다는 사실을 발견했습니다. 시작할 연도, 월, 일 (월) 및 일 (주) 변수를 만듭니다. 추출 코드가 요약 / 표 / 그래프 코드와 분리되어 있고 변경해야하는 경우 여러 지점에서 이러한 변경 사항을 롤아웃 할 필요가 없기 때문에 요약, 표 및 그래프를 단순화 할 수 있습니다.
format
하고 '연도'추출에 사용