당신은 올바른 길을 가고 있습니다. 이제 다음과 같이 원하는 그룹을 추출하기 만하면됩니다.
final Pattern pattern = Pattern.compile("<tag>(.+?)</tag>", Pattern.DOTALL);
final Matcher matcher = pattern.matcher("<tag>String I want to extract</tag>");
matcher.find();
System.out.println(matcher.group(1));
여러 히트를 추출하려면 다음을 시도하십시오.
public static void main(String[] args) {
final String str = "<tag>apple</tag><b>hello</b><tag>orange</tag><tag>pear</tag>";
System.out.println(Arrays.toString(getTagValues(str).toArray()));
}
private static final Pattern TAG_REGEX = Pattern.compile("<tag>(.+?)</tag>", Pattern.DOTALL);
private static List<String> getTagValues(final String str) {
final List<String> tagValues = new ArrayList<String>();
final Matcher matcher = TAG_REGEX.matcher(str);
while (matcher.find()) {
tagValues.add(matcher.group(1));
}
return tagValues;
}
그러나 정규 표현식이 여기에서 최선의 답이 아니라는 데 동의합니다. 관심있는 요소를 찾기 위해 XPath를 사용하겠습니다. 자세한 내용 은 Java XPath API 를 참조하십시오.
[]
정규식에서 메타 문자 인 대괄호 를 이스케이프해야합니다 .