답변:
기본 R에는 아무것도 모르지만 substr
and를 사용 하여이 작업을 수행하는 것은 간단합니다 nchar
.
x <- "some text in a string"
substrRight <- function(x, n){
substr(x, nchar(x)-n+1, nchar(x))
}
substrRight(x, 6)
[1] "string"
substrRight(x, 8)
[1] "a string"
@mdsumner가 지적한 것처럼 벡터화됩니다. 치다:
x <- c("some text in a string", "I really need to learn how to count")
substrRight(x, 6)
[1] "string" " count"
nchar(x)
지역 변수에 할당하여 두 번 호출하는 것을 피하는 것이 더 효율적 입니까?
stringr
패키지 사용이 마음에 들지 않으면 str_sub
음수를 사용하여 역으로 계산할 수 있으므로 편리합니다.
x <- "some text in a string"
str_sub(x,-6,-1)
[1] "string"
또는 Max가이 답변에 대한 의견에서 지적한 것처럼,
str_sub(x, start= -6)
[1] "string"
stringr
사용하여 다시 만들어 졌다고 생각 stringi
하므로 NA와 함께 작동해야합니다.
패키지의 stri_sub
기능을 사용하십시오 stringi
. 끝에서 부분 문자열을 얻으려면 음수를 사용하십시오. 아래 예를보십시오.
stri_sub("abcde",1,3)
[1] "abc"
stri_sub("abcde",1,1)
[1] "a"
stri_sub("abcde",-3,-1)
[1] "cde"
github에서이 패키지를 설치할 수 있습니다 : https://github.com/Rexamine/stringi
CRAN에서 사용 가능합니다. 간단히 입력하십시오.
install.packages("stringi")
이 패키지를 설치합니다.
또 다른 합리적인 방법은 정규 표현식을 사용하는 것입니다 sub
.
sub('.*(?=.$)', '', string, perl=T)
따라서 "한 문자 뒤에 모든 것을 제거하십시오". 끝에서 더 많은 문자를 얻으려면 lookahead 어설 션에 많은 점을 추가하십시오.
sub('.*(?=.{2}$)', '', string, perl=T)
어디 .{2}
수단 ..
그렇게하는 의미, 또는 "두 글자", "모든 것을 제거는 두 문자 다음에".
sub('.*(?=.{3}$)', '', string, perl=T)
변수를 사용하여 잡을 문자 수를 설정할 수 있지만 paste
변수 값을 정규식 문자열에 입력해야합니다.
n = 3
sub(paste('.+(?=.{', n, '})', sep=''), '', string, perl=T)
regmatches(x, regexpr(".{6}$", x))
업데이트 : mdsumner 에서 언급했듯이 substr이기 때문에 원래 코드는 이미 벡터화되었습니다. 더 조심해야 했어요.
그리고 벡터화 된 버전을 원한다면 ( Andrie 의 코드를 기반으로 )
substrRight <- function(x, n){
sapply(x, function(xx)
substr(xx, (nchar(xx)-n+1), nchar(xx))
)
}
> substrRight(c("12345","ABCDE"),2)
12345 ABCDE
"45" "DE"
내가 변경 한 것을 참고 (nchar(x)-n)
하는 (nchar(x)-n+1)
얻을 n
문자.
(nchar(x)-n)
~ (nchar(x)-n+1)
" 을 의미한다고 생각합니다
대안으로 substr
문자열을 단일 문자 목록으로 분할하고 다음을 처리합니다.
N <- 2
sapply(strsplit(x, ""), function(x, n) paste(tail(x, n), collapse = ""), N)
누군가가 비슷한 솔루션을 사용하여 채굴을했지만 다음과 같이 생각하기가 더 쉽다는 것을 알았습니다.
> text<-"some text in a string" # we want to have only the last word "string" with 6 letter
> n<-5 #as the last character will be counted with nchar(), here we discount 1
> substr(x=text,start=nchar(text)-n,stop=nchar(text))
마지막 문자를 원하는대로 가져옵니다.
문자열의 마지막 문자를 얻기 위해 다음 코드를 사용했습니다.
substr(output, nchar(stringOfInterest), nchar(stringOfInterest))
nchar (stringOfInterest)를 사용하여 마지막 몇자를 얻는 방법을 알아낼 수 있습니다.
@Andrie 솔루션을 약간 수정하면 보완 기능도 제공합니다.
substrR <- function(x, n) {
if(n > 0) substr(x, (nchar(x)-n+1), nchar(x)) else substr(x, 1, (nchar(x)+n))
}
x <- "moSvmC20F.5.rda"
substrR(x,-4)
[1] "moSvmC20F.5"
그것이 내가 찾던 것이 었습니다. 그리고 왼쪽으로 초대합니다.
substrL <- function(x, n){
if(n > 0) substr(x, 1, n) else substr(x, -n+1, nchar(x))
}
substrL(substrR(x,-4),-2)
[1] "SvmC20F.5"