연결 문자는 두 문자를 연결하는 데 사용됩니다.
Java에서 연결 문자는 Character.getType (int codePoint) / Character.getType (char ch) 가 Character.CONNECTOR_PUNCTUATION 과 동일한 값을 리턴하는 문자 입니다.
Java에서 문자 정보는 연결 문자를 일반 카테고리 Pc ( Connector_Punctuation 의 별명)에 지정하여 연결 문자를 식별하는 유니 코드 표준을 기반으로합니다 .
다음 코드 스 니펫
for (int i = Character.MIN_CODE_POINT; i <= Character.MAX_CODE_POINT; i++) {
if (Character.getType(i) == Character.CONNECTOR_PUNCTUATION
&& Character.isJavaIdentifierStart(i)) {
System.out.println("character: " + String.valueOf(Character.toChars(i))
+ ", codepoint: " + i + ", hexcode: " + Integer.toHexString(i));
}
}
jdk1.6.0_45에서 식별자를 시작하는 데 사용할 수있는 연결 문자를 인쇄합니다.
character: _, codepoint: 95, hexcode: 5f
character: ‿, codepoint: 8255, hexcode: 203f
character: ⁀, codepoint: 8256, hexcode: 2040
character: ⁔, codepoint: 8276, hexcode: 2054
character: ・, codepoint: 12539, hexcode: 30fb
character: ︳, codepoint: 65075, hexcode: fe33
character: ︴, codepoint: 65076, hexcode: fe34
character: ﹍, codepoint: 65101, hexcode: fe4d
character: ﹎, codepoint: 65102, hexcode: fe4e
character: ﹏, codepoint: 65103, hexcode: fe4f
character: _, codepoint: 65343, hexcode: ff3f
character: ・, codepoint: 65381, hexcode: ff65
다음은 jdk1.6.0_45에서 컴파일됩니다.
int _, ‿, ⁀, ⁔, ・, ︳, ︴, ﹍, ﹎, ﹏, _, ・ = 0;
분명히, 위의 선언은 다음 두 개의 연결 문자 (역 호환성 ... oops !!!)에 대해 jdk1.7.0_80 및 jdk1.8.0_51에서 컴파일하지 못합니다.
character: ・, codepoint: 12539, hexcode: 30fb
character: ・, codepoint: 65381, hexcode: ff65
어쨌든 세부 사항은 제외 하고 시험은 기본 라틴 문자 세트에만 중점을 둡니다 .
또한 Java의 법적 식별자의 경우 사양이 여기 에 제공 됩니다 . 자세한 내용을 보려면 Character 클래스 API를 사용하십시오.