C ++에서 std :: string에서 공백 제거


222

C ++에서 문자열에서 공백을 제거하는 선호되는 방법은 무엇입니까? 모든 문자를 반복하고 새 문자열을 만들 수 있지만 더 좋은 방법이 있습니까?

답변:


257

가장 좋은 방법은 알고리즘 remove_if과 isspace 를 사용하는 것입니다 .

remove_if(str.begin(), str.end(), isspace);

이제 알고리즘 자체는 컨테이너를 변경할 수 없으므로 (값만 수정) 실제로 값을 섞고 이제 끝 위치를 가리키는 포인터를 반환합니다. 따라서 컨테이너의 길이를 실제로 수정하려면 string :: erase를 호출해야합니다.

str.erase(remove_if(str.begin(), str.end(), isspace), str.end());

또한 remove_if는 최대 하나의 데이터 사본을 작성합니다. 다음은 샘플 구현입니다.

template<typename T, typename P>
T remove_if(T beg, T end, P pred)
{
    T dest = beg;
    for (T itr = beg;itr != end; ++itr)
        if (!pred(*itr))
            *(dest++) = *itr;
    return dest;
}

54
'isspace'에는 과부하가 있으므로 :: isspace (로케일을 사용하지 않는 C 구현)를 사용하거나 암호화 된 템플리트 인스턴스화 오류가 발생하도록 일반 코드를 규정해야합니다.
Bklyn

4
모두-위의 방법에주의하십시오 (동일한 문제가있을 수 있지만 템플릿 버전이 아닌 두 개의 단일 행). 나는 그것이 항상 정확하지 않다는 것을 깨닫지 않고 프로젝트에서 사용했습니다. 예를 들어, 문자열 "1 + 1"을 전달하면 "1 + 11"이 반환됩니다. 아래의 @rupello 방법으로 전환 했는데이 경우에는 정상적으로 작동했습니다. 행복한 코딩!
JoeB

6
@Joe 대답은 erase나중에 전화해야한다는 것을 명시 적으로 언급합니다 . 올바른 결과를 반환합니다.
콘래드 루돌프

31
-1 isspace원래 7 비트 ASCII를 제외한 모든 문자 세트 에이 UB를 사용 합니다. C99 §7.4 / 1. 그것은 놀라게하지 않습니다 이 아주 나쁜 조언 존재에도 불구하고, 지금까지 71 투표의 조정 upvoted 됐어요 저를.
건배와 hth. -Alf

16
반복적으로,이 답변의 코드는 isspace모든 비 ASCII 문자에 대해 음의 값 (EOF와 다른)을로 전달합니다 ( 실제로 기본 부호 있음 선택) char. 따라서 정의되지 않은 동작이 있습니다. 나는 그 사실을 소음 속에서 익사시키려는 의도적 인 시도를 의심하기 때문에 그것을 반복하고 있습니다.
건배와 hth. - 알프

100
std::string::iterator end_pos = std::remove(str.begin(), str.end(), ' ');
str.erase(end_pos, str.end());

31
정식 지우기 / 제거 관용구에 대한 나의 투표. 하나의 라이너로 만들 수 있습니다 : str.erase (std :: remove (str.begin (), str.end (), ''), str.end ());
Bklyn

11
참고 : <algorithm>이 기능을 사용 하려면 포함해야합니다 .
Tara

37

에서 gamedev

string.erase(std::remove_if(string.begin(), string.end(), std::isspace), string.end());

22
std :: isspace의 로케일로드 과부하로 인해 표준 준수 구현에서는 컴파일되지 않습니다. :: isspace를 사용하거나 std :: bind2nd로 읽을 수없는 가공을 수행해야합니다. 일반 코드가 아름답 지 않습니까?
Bklyn

또한 임의의 문자가 음수이면 (예 : 문자가 서명 될 때 UTF8 문자) 사용 ::isspace은 UB입니다.
Martin Bonner는 Monica

30

Boost String Algo를 사용할 수 있습니까? http://www.boost.org/doc/libs/1_35_0/doc/html/string_algo/usage.html#id1290573

erase_all(str, " "); 

3
remove_if(str.begin(), str.end(), isspace);Matt Price가 언급 한 것보다 느립니다 . 이유를 모르겠습니다. 실제로 STL 대안이있는 모든 부스트 항목은 해당 gcc보다 느립니다 (내가 테스트 한 모든 것). 그들 중 일부는 엄청나게 느립니다! (정렬되지 않은 맵 삽입에서 최대 5 번) 공유 환경의 CPU 캐시 또는 이와 유사한 것 때문일 수 있습니다.
Etherealone



12

안녕하세요, 그런 식으로 할 수 있습니다. 이 기능은 모든 공백을 삭제합니다.

string delSpaces(string &str) 
{
   str.erase(std::remove(str.begin(), str.end(), ' '), str.end());
   return str;
}

불필요한 공간을 모두 삭제하는 다른 기능을 만들었습니다.

string delUnnecessary(string &str)
{
    int size = str.length();
    for(int j = 0; j<=size; j++)
    {
        for(int i = 0; i <=j; i++)
        {
            if(str[i] == ' ' && str[i+1] == ' ')
            {
                str.erase(str.begin() + i);
            }
            else if(str[0]== ' ')
            {
                str.erase(str.begin());
            }
            else if(str[i] == '\0' && str[i-1]== ' ')
            {
                str.erase(str.end() - 1);
            }
        }
    }
    return str;
}

8
string replaceinString(std::string str, std::string tofind, std::string toreplace)
{
        size_t position = 0;
        for ( position = str.find(tofind); position != std::string::npos; position = str.find(tofind,position) )
        {
                str.replace(position ,1, toreplace);
        }
        return(str);
}

그걸 써:

string replace = replaceinString(thisstring, " ", "%20");
string replace2 = replaceinString(thisstring, " ", "-");
string replace3 = replaceinString(thisstring, " ", "+");

7

쉬운 매크로로이 작업을 수행하려면 다음을 수행하십시오.

#define REMOVE_SPACES(x) x.erase(std::remove(x.begin(), x.end(), ' '), x.end())

이것은 #include <string>물론 당신이 한 것으로 가정합니다 .

다음과 같이 호출하십시오.

std::string sName = " Example Name ";
REMOVE_SPACES(sName);
printf("%s",sName.c_str()); // requires #include <stdio.h>

5
왜 매크로를 사용 하시겠습니까?
dani

1
일반적인 작업을위한 키보드 입력이 줄었습니다.
Volomike

3
call-site는 문자열에 대한 lvalue-reference를 사용하는 함수 를 호출 하는 것만 큼 짧습니다 . 매크로는 인수와 상호 작용하는 놀라운 동작 (부작용과 함께 esp)을 가질 수 있지만, 오류와 관련이 있으면 컴파일러 메시지에 이름이 표시되지 않고 구현이 수행합니다.
Chris Uzdavinis

2

나는 아래의 해결 방법을 오랫동안 사용했지만 복잡성은 확실하지 않습니다.

s.erase(std::unique(s.begin(),s.end(),[](char s,char f){return (f==' '||s==' ');}),s.end());

당신은 문자를 제거 싶어 할 때 ' '예를 들어 및 일부 - 사용

s.erase(std::unique(s.begin(),s.end(),[](char s,char f){return ((f==' '||s==' ')||(f=='-'||s=='-'));}),s.end());

마찬가지로 ||제거하려는 문자 수가 1이 아닌 경우

그러나 다른 사람들이 언급했듯이 지우기 제거 관용구도 좋습니다.


1
string removeSpaces(string word) {
    string newWord;
    for (int i = 0; i < word.length(); i++) {
        if (word[i] != ' ') {
            newWord += word[i];
        }
    }

    return newWord;
}

이 코드는 기본적으로 문자열을 가져와 그 안에있는 모든 문자를 반복합니다. 그런 다음 해당 문자열이 공백인지 확인합니다. 그렇지 않으면 문자가 새 문자열에 추가됩니다.


1
   #include <algorithm>
   using namespace std;

   int main() {
       .
       .
       s.erase( remove( s.begin(), s.end(), ' ' ), s.end() );
       .
       .
   }

출처:

포럼 에서 가져온 참조 .


1
이것은 실제로이 답변 보다 더 많은 것을 추가 하지는 않습니다. 답변의 질을 높이고이 질문에 대한 가치를 더하기 위해 추가 할 수있는 추가 설명이나 세부 사항이 있습니까?
Das_Geek

한 문장에서 같은 일을하기 때문에 더 간단 하다고 생각합니다 .
John

2
큰! 그런 다음 그 추론을 답에 직접 설명 으로 넣으십시오 . 원래의 질문은 11 세 이상 이며, 근거가 없으면 다른 인정되고 찬성 된 답변과 비교할 때 귀하의 답변이 소음으로 보일 수 있습니다. 그 설명을하면 답이 지워지지 않습니다.
Das_Geek

즉 것이 좋은 그러나 나는 어떻게 넣어해야 얻을 수없는 것을 ... 내 대답에 내 대답은보다 나은 것을 이 답변 . ? 내 답변을 편집 할 수 있다면 큰 즐거움이 될 것입니다.
John

2
불행히도, 자신의 콘텐츠를 추가 하기 위해 답변편집 하면 편집 지침에 위배 되며 나중에 편집이 거부되거나 롤백 될 수 있습니다. 이 의견의 첫 번째 링크를 사용하여 답변을 직접 편집 할 수 있습니다. 귀하의 답변이 다른 답변보다 낫다고 생각하고 이에 대한 타당성을 제공하는 것은 전적으로 허용됩니다. 커뮤니티는 upvoting 또는 downvoting으로 당신이 옳은지를 결정합니다.
Das_Geek

0

C ++ 20에서는 자유 함수 std :: erase를 사용할 수 있습니다.

std::string str = " Hello World  !";
std::erase(str, ' ');

전체 예 :

#include<string>
#include<iostream>

int main() {
    std::string str = " Hello World  !";
    std::erase(str, ' ');
    std::cout << "|" << str <<"|";
}

인쇄 | 시작 부분의 공간도 제거됩니다.

참고 : 공백으로 간주 될 수있는 다른 모든 문자가 아닌 공백 만 제거합니다 ( https://en.cppreference.com/w/cpp/string/byte/isspace 참조)


0

탭 및 줄 바꿈과 같은 모든 공백 문자를 제거합니다 (C ++ 11).

string str = " \n AB cd \t efg\v\n";
str = regex_replace(str,regex("\\s"),"");

왜 10 년 전에 @ Matt-Price의 대답에 비해이 접근법을 추천 하시겠습니까?
Jeremy Caney

모든 솔루션을 여기에 제시하십시오. 어쩌면 누군가이 솔루션이 필요할 것입니다.
AnselmRu

나는 그것에 대해 논쟁하지 않습니다. 나는 사람들이 차이점과 그들이 더 적합한 시나리오를 설명함으로써 다른 접근법을 더 쉽게 평가할 수있게한다고 말하고있다.
Jeremy Caney

1
아마도이 솔루션은 가장 경제적 이지 않지만 공백 ''뿐만 아니라 모든 공백 문자 '\ s'를 제거 할 수 있습니다 .
AnselmRu

0
  string str = "2C F4 32 3C B9 DE";
  str.erase(remove(str.begin(),str.end(),' '),str.end());
  cout << str << endl;

출력 : 2CF4323CB9DE


-1
string removespace(string str)
{    
    int m = str.length();
    int i=0;
    while(i<m)
    {
        while(str[i] == 32)
        str.erase(i,1);
        i++;
    }    
}

3
일반적으로 코드 답변에 간단한 설명을 추가하는 것이 좋습니다.
arcyqwerty 19

1
@test – length()a size_t가 아닌 a를 반환 합니다 int. erase()소요 size_type아닌 int. 인덱스가 항상 증가하기 때문에 두 개의 연속 공백이 있으면 함수가 실패 할 수 있습니다. 하나의 공백이 제거되면 루프는 문자열의 경계를 넘어 읽습니다. 이 답변은 많은 도움이 필요하므로 삭제해야합니다.
jww

-3

나는 그것이 내가 생각할 수있는 최고의 솔루션이라는 것을 두려워합니다. 그러나 reserve ()를 사용하여 필요한 최소 메모리를 미리 할당하여 속도를 높일 수 있습니다. 아마도 더 짧아 지지만 같은 양의 메모리를 차지하는 새로운 문자열이 생길 수 있지만 재 할당은 피할 수 있습니다.

편집 : 상황에 따라 주변의 캐릭터를 방해하는 것보다 오버 헤드가 덜 발생할 수 있습니다.

다른 접근 방식을 시도하고 자신에게 가장 적합한 것을 확인해야합니다. 성능 문제가 전혀 없을 수 있습니다.


remove_if는 각 값의 사본을 하나만 만듭니다. 따라서 실제로 수행해야 할 작업에 비해 많은 오버 헤드가 없습니다.
매트 가격
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.