캡처 및 그룹화
캡처 그룹 은 캡처 속성 이 (pattern)
있는 그룹 을 만듭니다 .
자주 보거나 사용할 수있는 관련 항목은 속성 을 캡처 하지 않고 그룹(?:pattern)
을 생성하는 이므로 비 캡처 그룹이라고 합니다.
그룹은 일반적으로 패턴의 시퀀스를 반복해야 할 때 (\.\w+)+
또는 ^(0*1|1*0)$
( ^
, then 0*1
또는 1*0
, then $
) 대 ^0*1|1*0$
( ^0*1
또는 1*0$
) 와 같이 대체가 적용될 위치를 지정 해야 할 때 사용됩니다 .
그룹화와는 별도로 캡처 링 그룹은 캡처 링 그룹 내부의 패턴과 일치하는 텍스트도 기록합니다 (pattern)
. 귀하의 예제를 사용하여 (.*):
, .*
일치 ABC
와 :
경기가 :
있기 때문에, 그리고 .*
그룹을 캡처 안에 (.*)
텍스트가 ABC
캡처 그룹 1에 대한 기록됩니다.
그룹 번호
전체 패턴은 그룹 번호 0으로 정의 됩니다.
패턴의 모든 캡처 그룹은 1부터 인덱싱을 시작합니다. 인덱스는 캡처 그룹의 여는 괄호 순서로 정의됩니다 . 예를 들어, 다음은 아래 패턴의 5 개 캡처 그룹 모두 입니다.
(group)(?:non-capturing-group)(g(?:ro|u)p( (nested)inside)(another)group)(?=assertion)
| | | | | | || | |
1-----1 | | 4------4 |5-------5 |
| 3---------------3 |
2-----------------------------------------2
그룹 번호는 \n
패턴의 역 참조 및 $n
대체 문자열에 사용됩니다.
다른 정규식 버전 (PCRE, Perl)에서는 하위 루틴 호출 에도 사용할 수 있습니다 .
를 사용하여 특정 그룹과 일치하는 텍스트에 액세스 할 수 있습니다 Matcher.group(int group)
. 그룹 번호는 위에 명시된 규칙으로 식별 할 수 있습니다.
일부 정규식 버전 (PCRE, Perl)에는 다른 분기의 교대 그룹 을 캡처 하는 데 동일한 번호 를 사용할 수 있는 분기 재설정 기능이 있습니다 .
그룹 이름
Java 7에서 명명 된 캡처 링 그룹을 정의하고 (?<name>pattern)
와 일치하는 콘텐츠에 액세스 할 수 있습니다 Matcher.group(String name)
. 정규식은 더 길지만 정규식과 일치 시키거나 추출하려는 내용을 나타 내기 때문에 코드가 더 의미가 있습니다.
그룹 이름은 \k<name>
패턴의 역 참조 및 ${name}
대체 문자열에 사용됩니다.
명명 된 캡처 링 그룹은 여전히 동일한 번호 매기기 체계로 번호가 지정되므로을 통해 액세스 할 수도 있습니다 Matcher.group(int group)
.
내부적으로 Java의 구현은 이름에서 그룹 번호로 매핑됩니다. 따라서 2 개의 다른 캡처 그룹에 동일한 이름을 사용할 수 없습니다.