메모장에서 유니 코드 텍스트를 편집하려면 어떻게해야합니까?


26

때로는 유니 코드 문자가 포함 된 영어 텍스트를 편집합니다. 어떤 이유로 든 내 PC에서 Notepad ++는 유니 코드 문자 를 ??? 로 변환 하여 텍스트를 손상시키고 모든 데이터를 잃습니다. 유니 코드 문자를 유지하면서 이러한 텍스트를 편집하는 방법을 찾고 있습니다. 내가 사용하고 Consolas를 내 글꼴로. 글꼴에 해당 문자가 모두없는 경우 Windows의 클립 보드를 통해 메모장 ++에서 텍스트를 복사 할 때 왜 데이터를 잃어야합니까?


유니 코드를 지원하지 않는 플러그인을 사용하고 있습니까?
Ivo Flipse

이 상자에 물음표가 있으면 실제로 글리프가없는 글꼴의 글리프이며 데이터가 손실 되지 않습니다 .
Joey

상자가 아니라 평범한 '?' 캐릭터. 확인했습니다.
Robinicks

1
글꼴을 변경해야 할 수도 있습니다. 참조 superuser.com/questions/16831/...
RamyenHead

답변:


15

파일이 실제로 유니 코드로 인코딩 된 경우 Notepad ++는 파일을 자동으로 감지해야합니다. Consolas 글꼴은 나를 위해 잘 작동합니다. 다음 두 가지 메뉴 옵션 중 하나를 시도 할 수 있습니다.

  • 인코딩 -> UTF-8로 인코딩
  • 인코딩 -> UTF-8로 변환

나는 첫 번째 것이 당신이 원하는 것을 할 것이라고 확신합니다.


형식 메뉴가 없습니다.
Val

1
후세를 들어, 인코딩 메뉴를 필요로 포맷하지
켄 벨로우즈에게

15

빈 / 새 문서를 "ANSI"로 설정하고 유니 코드 문자를 붙여 넣으면 이 질문에 설명 된 문제가 발생 합니다.

비어 있거나 새로운 문서와 함께 사용될 때 자동 감지 기능은 없습니다. 적어도 메모장 ++ 버전에서는 테스트하지 않았습니다 (v5.4.5). 메뉴 → 설정기본 설정 → 탭 새 문서 / 저장 디렉토리 열기 에서 설정 하지 않는 한 새 문서의 메모장 ++에서 "ANSI"가 기본값입니다 .

해결책

해결책은 붙여 넣기 전에 인코딩을 UTF-8 로 설정하는 것입니다 . 메뉴 형식UTF-8로 인코딩 :

메뉴 명령 "UTF-8 형식 / 인코딩"을 실행하려고합니다.

Firefox에서 Wikipedia 페이지 러시아어를 보여주는 새로운 메모장 ++ 문서 러시아어 (русский язык, russkiy yazyk)에 텍스트를 복사했습니다 .

인코딩이 "ANSI"에서 변경 되지 않은 경우 결과는 다음과 같습니다.

기본 "ANSI"에서 인코딩을 변경하지 않고 유니 코드 문자열 "Russian (русский язык, russkiy yazyk")을 새 메모장 ++ 문서에 붙여 넣은 결과입니다.

인코딩 변경되면 결과는 다음과 같습니다.

인코딩을 기본 "ANSI"에서 "UTF-8"로 변경 한 후 유니 코드 문자열 "Russian (русский язык, russkiy yazyk")을 새 메모장 ++ 문서에 붙여 넣은 결과입니다.

아래 그림에서 볼 수 있듯이 ( 키릴 부분은 강조 표시됨) 메모장 ++은 실제로 유니 코드 문자를 ASCII 63 (16 진수 3F) 물음표로 변환합니다. 그렇기 때문에 클립 보드를 통해 텍스트를 복사 할 때 유니 코드 문자가 손실됩니다 ( "ANSI" 모드) ( 글꼴 문제 가 아니라 정보가 손실 됨).

해당 문서의 16 진보기 스크린 샷

테스트 결과 : Notepad ++ v5.4.5 (UNICODE).


5

좋은 소식과 나쁜 소식이 있습니다.

좋은 소식 : Notepad ++는 유니 코드 (적어도 내가 수집 할 수있는 것)를 지원합니다.

나쁜 소식 : 분명히 유니 코드 지원은 Windows XP에서만 가능합니다.

나는 실제로 내 앞에 Windows 컴퓨터가 없습니다. 내가 기억하는 것에서 어딘가에 서식 메뉴 아래에 인코딩 메뉴가 있습니다. 유니 코드 인코딩은 실제로 가장 일반적으로 UTF-8입니다.

다음은 메모장 ++에서 유니 코드 지원에 대한 '예쁜'사진입니다.

여기에 이미지 설명을 입력하십시오


3

유니 코드는 Windows 7에서 완벽하게 작동합니다. 발생하는 유일한 문제는 변경된 문자를 다시 입력해야한다는 것입니다. 나 한테 일어난 일이야 나는 스칸디나비아 문자로 쓰고 있습니다.-> E4, ö-> F6. 그것들을 모두 대체하는 것은 엉덩이의 고통이지만 그만한 가치가 있습니다.

ANSI-> UTF-8에서 페이지를 인코딩하면 일부 문자 문제가 발생합니다.

먼저 UTF-8로 새 페이지를 만든 다음 정보를 복사 / 붙여 넣기를 제안합니다. 그때 아무런 문제가 없을 것입니다.


1

이것은 나를 위해 일했습니다 :

내 PC의 스타일 구성 기에서 글꼴을 Courier New 로 변경했습니다 (Windows 7은 영어 / 미국 문자 세트, 루마니아어는 비 유니 코드 세트). Courier New & Tahoma 글꼴 + UTF-8 인코딩으로 작동합니다.


0

최상위 메뉴에서을 선택한 Encoding다음 Encode in UTF-8또는 Encode in UTF-8 Without BOM을 선택하면 유니 코드 인코딩으로 텍스트를 편집 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.