답변:
사용하십시오 [^A-Za-z0-9]
.
참고 : 일반적으로 영숫자로 간주되지 않으므로 공백을 제거했습니다.
[^a-zA-Z]
문자 범위 AZ / az에 속하지 않는 문자를 대체 한다는 점에 유의해야합니다 . 그 말 특수 문자 좋아 é
, ß
등 또는 키릴 문자 등은 제거됩니다.
이러한 문자를 교체하지 않으려면 사전 정의 된 문자 클래스를 대신 사용하십시오.
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
추신 : \p{Alnum}
이 효과를 얻지 못하면와 동일하게 작동합니다 [A-Za-z0-9]
.
[^\\p{IsAlphabetic}\\p{IsDigit}]
잘 작동합니다.
{IsDigit}
는 효과가 없으며 {Digit}
Android에서 시도 하고 있기 때문 입니다. 그리고 안드로이드는 UNICODE_CHARACTER_CLASS
기본적으로 켜져 있습니다. 정리해 주셔서 감사합니다.
이 간단한 정규식을 시도해 볼 수도 있습니다.
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
.
파일 이름을 만들기 위해이 방법을 만들었습니다.
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
캐럿^
이 대괄호 안에 첫 번째 문자로 표시 되면 패턴이 무시됩니다. 이 패턴은 a 또는 b 또는 c를 제외한 모든 문자와 일치합니다.
키워드를 두 가지 기능으로 보았습니다.
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
또한 패턴과 관련하여 :
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
따라서 패턴에 포함되지 않은 모든 문자를 대체합니다.
예를 들어 독일어 움라우트와 같이 ASCII 문자 집합에 속하지 않는 영숫자 문자를 허용하려면 다음 솔루션을 사용하는 것이 좋습니다.
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
UNICODE_CHARACTER_CLASS 플래그를 사용하면 성능 패널티가 부과 될 수 있습니다 (이 플래그의 javadoc 참조).
간단한 방법 :
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
출력 : ChlamydiasppIgGIgMIgAAbs8006
Github : https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
Guava의 CharMatcher 는 간결한 솔루션을 제공합니다.
output = CharMatcher.javaLetterOrDigit().retainFrom(input);