Java의 "인코딩에 매핑 할 수없는 문자"경고


112

현재 컴파일 할 때 다음 경고를 표시하는 Java 프로젝트에서 작업 중입니다.

/src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8
    [javac]         String copyright = "� 2003-2008 My Company. All rights reserved.";

날짜 전에 어떻게 문자를 렌더링할지 모르겠지만 저작권 기호 여야하며 경고에 다이아몬드의 물음표로 표시되어야합니다.

문자가 출력 아티팩트에 올바르게 나타나지만 경고는 성가신 것이며 언젠가는 인코딩을 잘못 저장하는 텍스트 편집기가이 클래스를 포함하는 파일을 건드릴 수 있습니다.

이 문자를 "저작권"문자열에 삽입하여 컴파일러가 만족하고 기호가 잠재적 인 재 인코딩 문제없이 파일에 보존되도록하려면 어떻게해야합니까?


실제로 저작권 문자를 구성하는 바이트 무엇을 알고에 관심이있을 수, 즉 hexdump AppDBCore.java어떻게 든 그것을 의심 \u00a9하는 대신 때문에 시스템 설정의 당신을 위해 부분적으로 작동하는 무언가이다. 위의 물음표는 유니 코드에서 값을 알 수 없거나 나타낼
jar

답변:


56

"\ uxxxx"이스케이프 형식을 사용하십시오.

Wikipedia 에 따르면 저작권 기호는 유니 코드 U + 00A9이므로 행은 다음과 같아야합니다.

String copyright = "\u00a9 2003-2008 My Company. All rights reserved.";

13
\ uNNNN 문자에주의하십시오. 어휘 분석을 수행하기 전에 구문 분석됩니다. 예를 들어이 주석 / * c : \ unit * /을 코드에 넣으면 "nit"가 올바른 16 진수가 아니기 때문에 더 이상 컴파일되지 않습니다.
Peter Štibraný

3
물론. (이것은 유니 코드 이스케이프가 특정 컨텍스트에서만 적용되는 C #에서 더 잘 처리됩니다.하지만 위험한 \ x 이스케이프 시퀀스도 있습니다. 끔찍합니다.)
Jon Skeet

5
이것은 치료법보다 반창고처럼 들립니다. 진짜 문제는 소스 파일이 ISO-8859-1 또는 windows-1252와 같은 단일 바이트 인코딩 일 때 UTF-8로 된 소스 파일을 기대하도록 javac에 지시하는 것 같습니다.
Alan Moore

6
@Alan M : 내 경험상 소스 파일을 ASCII로 유지하여 문제가 없는지 확인하는 것이 소스가 컴파일 될 수있는 모든 곳 에서 올바른 인코딩을 사용하는지 확인하는 것보다 훨씬 쉽습니다 (Ant, Eclipse, IDEA 등).
Jon Skeet

6
@Jon, 그것은 Java의 근본적인 결함입니다. 자바 소스 유닛이 UTF-8, ISO 8859-1, CP1252, MacRoman 등으로 인코딩된다는 사실은이를 필요로하는 소스 유닛 외부의 메타 데이터에서 처리됩니다. 이것은 당신이 당신의 개미 파일이나 이클립스 설정 등을 고쳐야한다는 것을 기억하도록 강요합니다. 당신이 올바르게 지적했듯이 이것은 정보가 깨지기 쉽고 쉽게 잃어 버리기 때문에 절대적으로 최악의 방법입니다. 메타 데이터 (인코딩 메타 데이터)와 데이터 (읽기 : 소스 코드)를 한 곳에 함께 보관하는 언어는이 경우 훨씬 더 강력합니다. 유일한 건전한 접근 방식입니다.
tchrist 2011

91

시도해보십시오 : javac -encoding ISO-8859-1 file_name.java


1
이 솔루션이 마음에 듭니다. 내 ant build.xml에 compilerarg로 "-encoding UTF-8"을 추가했지만 여전히 "warning : unmaappable character for encoding ASCII"가 표시됩니다. "-encoding jjjj"로 수정하면 컴파일되지 않고 "error : unsupported encoding : jjjj"라고 불평하므로 UTF-8을 인식하고 있지만 여전히 .java 파일이 ascii로 취급되는 것 같습니다. 한숨.
dfrankow 2010

1
같은 문제인 ant javac 작업의 "인코딩"매개 변수를 시도했습니다. 매개 변수를 인식하지만 어떻게 든 무시합니다.
dfrankow

20
@dfrankow : 파일 <compilerarg line="-encoding utf-8"/>의 해당 <javac>호출 아래 에 추가 해야 Build.xml합니다. 이것은 나쁜 방법이지만 선택의 여지가 없습니다. 상단의 긴 댓글을 참조하십시오.
tchrist 2011

나는 개미 스크립트에 compilearg를 추가했을 때도 같은 문제가 발생했습니다. 잘 작동했습니다 .Windows comandline에서 이것을 빌드했습니다. 이상한 thig는 내가 일식에서 빌드했다는 것입니다. 컴파일러를 사용하지 않고 warked, 그 일식 thakes care처럼 보입니다. 인코딩 권리의.
simonC

이것은 나를 도왔습니다 :) MAC OSX
Arun Abraham

44

Maven을 사용하는 <encoding>경우 컴파일러 플러그인의 구성에서 명시 적으로 설정하십시오.

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-compiler-plugin</artifactId>
            <version>2.3.2</version>
            <configuration>
                <encoding>UTF-8</encoding>
            </configuration>
        </plugin>

사람들이 maven을 사용하여 프로젝트를 빌드하는 경우 올바른 접근 방식입니다. 공유해 주셔서 감사합니다.
Shamik

2
javadoc 플러그인은 매핑 할 수없는 문자에 대해서도 불평합니다. project.build.sourceEncoding속성 을 설정하는 것이 좋습니다 .
Emmanuel Bourg 2014 년

이미 project.build.sourceEncoding 속성을 사용하고 있었지만 어떻게 든 컴파일러 인코딩 속성에 제대로 매핑되지 않았습니다. 명시 적으로 설정하여 트릭을 수행했습니다.
Federico Bonelli 2014 년

32

이것은 나를 위해 도움이되었습니다.

JAVA_TOOL_OPTIONS라는 환경 변수를 지정하기 만하면됩니다. 이 변수를 -Dfile.encoding = UTF8로 설정하면 JVM이 시작될 때마다이 정보를 선택합니다.

출처 : http://whatiscomingtomyhead.wordpress.com/2012/01/02/get-rid-of-unmappable-character-for-encoding-cp1252-once-and-for-all/


와우 작동합니다. bashrc에 이것을 추가하고 문제를 해결했습니다.
cowboi-peng

빌드하기 위해 입력 한 명령 줄에서 훌륭하게 javac MyJavaFile.java -encoding utf-8 -cp .;lib\*작동했습니다 . 그런 다음 실행할 때 추가 인코딩 부분을 추가 할 필요가 없었습니다.
Azurespot

23

이 줄을 Java conf 위의 yor 파일 .gradle에 넣으십시오.

apply plugin: 'java'
compileJava {options.encoding = "UTF-8"}   

당신의 인코딩을 설정할 수 있습니다 compileTestJava및 위해 javadoc
프랭크 Neblung에게

8

대부분의 경우이 컴파일 오류는 유니 코드 (UTF-8 인코딩) 파일 컴파일시 발생합니다.

javac -encoding UTF-8 HelloWorld.java

또한이 컴파일 옵션을 IDE에 추가 ​​할 수 있습니다. 예 : Intellij idea
(File> settings> Java Compiler) add as additional command line parameter

여기에 이미지 설명 입력

-encoding : encoding EUC-JP 및 UTF-8과 같은 소스 파일 인코딩 이름을 설정합니다. -encoding을 지정하지 않으면 플랫폼 기본 변환기가 사용됩니다. ( DOC )


8

Gradle 단계

Gradle을 사용하는 경우 Java 플러그인을 적용하는 줄을 찾을 수 있습니다.

apply plugin: 'java'

그런 다음 컴파일 작업의 인코딩을 UTF-8로 설정합니다.

compileJava {options.encoding = "UTF-8"}   

단위 테스트가 있다면 UTF-8로도 컴파일하고 싶을 것입니다.

compileTestJava {options.encoding = "UTF-8"}

전체 Gradle 예제

이것은 전체적인 gradle 코드가 다음과 같이 보일 것임을 의미합니다.

apply plugin: 'java'
compileJava {options.encoding = "UTF-8"}
compileTestJava {options.encoding = "UTF-8"}

2

이것은 나를 위해 일했습니다-

    <?xml version="1.0" encoding="utf-8" ?>
<project name="test" default="compile">
    <target name="compile">
        <javac srcdir="src" destdir="classes" 
                           encoding="iso-8859-1" debug="true" />
    </target>
</project>

1

eclipse를 사용하는 경우 (Eclipse는 utf8 문자를 작성하더라도 utf8 코드를 넣을 수 있습니다. 프로그래밍 할 때 일반 utf8 문자가 표시되지만 배경은 utf8 코드가됩니다);

  1. 프로젝트 선택
  2. 마우스 오른쪽 버튼을 클릭하고 속성을 선택합니다.
  3. 선택 자원 에 대한 자원 패널 (2 후에 열 우측 메뉴 상단)
  4. Resource Panel , Text File Encoding 에서 볼 수 있으며 원하는 다른 항목을 선택할 수 있습니다.

추신 : 코드의 정적 값이면 괜찮을 것입니다. 예를 들어 String test = "İİİİİııııııççççç";


1
"프로그래밍 할 때 [a] utf8 문자가 표시되지만 배경은 utf8 코드가됩니다."에 대한 설명은 의미가 없습니다. 또한 위의 질문에 대한 응답으로 내 긴 댓글을 참조하십시오.
tchrist

ISO-8859-1로 변경했지만 "UTF8 인코딩을위한 매핑 할 수없는 문자"에 대한 컴파일 오류가 계속 발생합니다.
pacoverflow

1

Java 오류 메시지에보고 된 문자 색인이 잘못된 동일한 문제가 발생했습니다. 보고 된 위치가 16 진수 022 대신 16 진수 094 (인용문 대신 취소되지만 따옴표로 표시됨) 직전에 큰 따옴표 문자로 범위를 좁혔습니다. 16 진수 022 변형으로 바꾸 자마자 모두 괜찮 았습니다.


1

명령 프롬프트에서 Maven Build를 사용하는 경우 다음 명령도 사용할 수 있습니다.

                    mvn -Dproject.build.sourceEncoding=UTF-8

1

이것이 왜 일부 시스템에서 발생하고 다른 시스템에서는 발생하지 않는지 (동일한 소스, 빌드 매개 변수 등을 사용하여) 궁금한 경우 환경 변수를 확인하십시오LANG . 때 경고 / 오류가 발생 LANG=C.UTF-8하지만 때가 아닙니다 LANG=en_US.UTF-8.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.