대시를 제외한 문자열에서 영숫자가 아닌 문자를 모두 제거하려면 어떻게합니까?


606

대시 및 공백 문자를 제외한 문자열에서 영숫자가 아닌 문자를 모두 제거하려면 어떻게합니까?

답변:


870

[^a-zA-Z0-9 -]빈 문자열로 교체하십시오 .

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");

79
그것을 언급 할 가치는 -문자 클래스의 끝에서, 또는 범위에 사용되는 것을 방지하기 위해 백 슬래시로 이스케이프해야합니다.
피터 Boughton

6
@Dan은 정규식에서 전역 플래그를 설정합니다. 빠른 Google은 고전적인 ASP 정규식에서 전역 플래그를 설정하는 방법을 알려줍니다. 그렇지 않으면 replaceAll대신 대신 함수를 찾으십시오 replace.
Amarghosh

20
다음은 정규식 컴파일 버전입니다. return Regex.Replace(str, "[^a-zA-Z0-9_.]+", "", RegexOptions.Compiled); 동일한 기본 질문
Paige Watson

13
@MGOwen은 ""를 사용할 때마다 문자열이 변경 불가능하여 새 객체를 생성하기 때문입니다. string.empty를 사용하면 더 빠르고 효율적으로 빈 문자열을 나타내는 데 필요한 단일 인스턴스를 재사용합니다.
Brian Scott

17
@BrianScott 나는 이것이 오래되었다는 것을 알고 있지만 검색에서 발견되었으므로 이것이 관련이 있다고 생각합니다. 이것은 실제로 실행중인 .NET 버전에 따라 다릅니다. > 2.0 사용 ""string.Empty동일. stackoverflow.com/questions/151472/…
Jared

348

RegEx를 사용할 수 있었지만 우아한 솔루션을 제공 할 수는 있지만 성능 문제가 발생할 수 있습니다. 여기에 하나의 해결책이 있습니다.

char[] arr = str.ToCharArray();

arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c) 
                                  || char.IsWhiteSpace(c) 
                                  || c == '-')));
str = new string(arr);

컴팩트 프레임 워크 (FindAll이없는)를 사용하는 경우

FindAll을 1로 교체

char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || 
                             char.IsWhiteSpace(c) || 
                             c == '-')).ToArray(); 

str = new string(arr);

ShawnFeatherly의 댓글 1


41
내 테스트 에서이 기술은 훨씬 빨랐습니다. 정확하게 말하자면, Regex Replace 기술보다 3 배나 빠릅니다.
Dan

12
소형 프레임 워크에는 FindAll이 없으므로 FindAll을char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-')).ToArray();
ShawnFeatherly로

2
누구든지 이것을 테스트 했습니까? 그것은 전혀 작동하지 않았습니다. -그러나 이것은 나를 위해했다 : string str2 = new string (str.Where (c => (char.IsLetterOrDigit (c))). ToArray ());
KevinDeus

48

당신은 시도 할 수 있습니다:

string s1 = Regex.Replace(s, "[^A-Za-z0-9 -]", "");

s당신의 줄은 어디에 있습니까 ?


1
OP는 대시 밑줄을 요구했습니다
Sean B

39

System.Linq 사용

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());

@Michael 비슷하지만 적어도 3 줄이 아닌 1 줄입니다. 나는 그것이 다른 대답으로 만들기에 충분하다고 말하고 싶습니다.
Dymas

1
@Dymas 이제는 허용되지만 공백이 다르기 때문에 동의 하지 않습니다 . 이 답변이 작성된 후 기능적으로 동등한 부분 (var 이름 만 다름)이 편집되었습니다.
Michael-Clay Shirky의 위치

1
@ZainAli, 당신이 사소한 편집을하고 핑을하면, 나는 downvote를 되돌릴 것입니다. 표절에 대한 일체의 사과에 대해 사과드립니다.
Michael-Clay Shirky의 위치

22

정규식은 [^\w\s\-]*다음과 같습니다.

\s텍스트에 탭이있을 수 있으므로 공백 ( ) 대신 사용하는 것이 좋습니다 .


1
탭을 제거하지 않으려면
매트 엘렌

... 줄 바꿈 및 기타 모든 문자는 "공백"으로 간주됩니다.
피터 Boughton

6
이 솔루션은 영어 이외의 국제 문자도 지원하므로 위의 솔루션보다 훨씬 우수합니다. <!-language : c #-> string s = "Mötley Crue 日本人 : の 氏 名 및 간지 愛 및 Hiragana あ い"; 문자열 r = Regex.Replace (s, "[^ \\ w \\ s-] *", ""); 위의 내용은 다음과 같습니다. Mötley Crue 日本人 の 氏 名 및 Kanji 愛 및 Hiragana あ い
danglund

1
사용 @ 문자열에 \ 변환을 탈출 : @ "[^ \ \의 승 -] *"
야쿱 Pawlinski

1
그것은, 어 ... 밑줄을 제거하지 않습니까? 그것은 생성 전반에 걸쳐 정규식 구현에 의해 "단어"문자로 간주되지만 영숫자, 대시 또는 공백이 아닙니다 ... (?)
Code Jockey

14

이 질문에 대한 답변을 바탕으로 정적 클래스를 만들고 추가했습니다. 일부 사람들에게는 유용 할 것이라고 생각했습니다.

public static class RegexConvert
{
    public static string ToAlphaNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z0-9]");
        return rgx.Replace(input, "");
    }

    public static string ToAlphaOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z]");
        return rgx.Replace(input, "");
    }

    public static string ToNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^0-9]");
        return rgx.Replace(input, "");
    }
}

그런 다음 방법을 다음과 같이 사용할 수 있습니다.

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();

2
제공하는 예제의 경우 각 방법의 결과를 제공하는 경우에도 유용합니다.
c-chavez

7

빠른 것을 원하십니까?

public static class StringExtensions 
{
    public static string ToAlphaNumeric(this string self, params char[] allowedCharacters)
    {
        return new string(Array.FindAll(self.ToCharArray(), c => char.IsLetterOrDigit(c) || allowedCharacters.Contains(c)));
    }
}

이를 통해 허용하려는 문자를 지정할 수 있습니다.


5

다음은 내가 찾고있는 비 정규 힙 할당 친화적 인 빠른 솔루션입니다.

안전하지 않은 에디션.

public static unsafe void ToAlphaNumeric(ref string input)
{
    fixed (char* p = input)
    {
        int offset = 0;
        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsLetterOrDigit(p[i]))
            {
                p[offset] = input[i];
                offset++;
            }
        }
        ((int*)p)[-1] = offset; // Changes the length of the string
        p[offset] = '\0';
    }
}

그리고 안전하지 않은 것을 사용하지 않거나 문자열 길이 해킹을 믿지 않는 사람들을 위해.

public static string ToAlphaNumeric(string input)
{
    int j = 0;
    char[] newCharArr = new char[input.Length];

    for (int i = 0; i < input.Length; i++)
    {
        if (char.IsLetterOrDigit(input[i]))
        {
            newCharArr[j] = input[i];
            j++;
        }
    }

    Array.Resize(ref newCharArr, j);

    return new string(newCharArr);
}

4

내 원래 문제였던 Control 문자 를 제거하여 다른 해결책을 만들었습니다 .

모든 "특별하지만 좋은"문자를 목록에 넣는 것보다 낫다

char[] arr = str.Where(c => !char.IsControl(c)).ToArray();    
str = new string(arr);

더 간단하므로 더 나은 것 같아요!


2

@ata answer를 영감으로 사용하는 확장 방법이 있습니다.

"hello-world123, 456".MakeAlphaNumeric(new char[]{'-'});// yields "hello-world123456"

또는 하이픈 이외의 추가 문자가 필요한 경우 ...

"hello-world123, 456!?".MakeAlphaNumeric(new char[]{'-','!'});// yields "hello-world123456!"


public static class StringExtensions
{   
    public static string MakeAlphaNumeric(this string input, params char[] exceptions)
    {
        var charArray = input.ToCharArray();
        var alphaNumeric = Array.FindAll<char>(charArray, (c => char.IsLetterOrDigit(c)|| exceptions?.Contains(c) == true));
        return new string(alphaNumeric);
    }
}

1

여기에 답변 중 하나의 변형을 사용합니다. SEO를 친숙하고 소문자로 만들기 위해 공백을 "-"로 바꾸고 싶습니다. 또한 내 서비스 계층에서 system.web을 참조하지 않습니다.

private string MakeUrlString(string input)
{
    var array = input.ToCharArray();

    array = Array.FindAll<char>(array, c => char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-');

    var newString = new string(array).Replace(" ", "-").ToLower();
    return newString;
}

0

아주 간결한 버전입니다

myString = myString.replace(/[^A-Za-z0-9 -]/g, "");

-1

정규식에는 훨씬 쉬운 방법이 있습니다.

private string FixString(string str)
{
    return string.IsNullOrEmpty(str) ? str : Regex.Replace(str, "[\\D]", "");
}

1
숫자가 아닌 문자 만 대체
frostymarvelous
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.