로케일을 무엇으로 설정해야하며 그 의미는 무엇입니까?


19

이 질문은 Chromium 브라우저에서 "파일로 인쇄"에 대한 기본 용지 크기 설정을 허용하지 않고 채팅시 @Gilles와의 대화를 허용 함으로써 질문에 자극을 받았습니다 . @don_crissti가 지적하고 나에게 확인한 것처럼 로케일을 변경하면 (적어도 LC_PAPER) 선택한 용지 크기가 달라집니다.

나는 무엇을 선택할지에 대해 많은 생각을하지 않았으며 en_US.UTF-8, 합리적인 기본 선택처럼 보였기 때문에 항상 함께 갔다 .

그러나 채팅에서 @Gilles 당 ( http://chat.stackexchange.com/transcript/message/17017095#17017095 에서 시작하는 대화 참조 ) 추출물 :

Gilles : LC_PAPER의 기본값은 $ LANG입니다.

Gilles : LANG = en_US.UTF-8이 있어야합니다. 그것은 나쁜 생각입니다. LC_COLLATE를 설정하고 거의 항상 나쁜 것입니다.

Gilles : LC_COLLATE는 올바른 데이터 정렬을 설명하지 않습니다. 너무 제한적입니다 (문자별로 이동). LANG을 제거하고 대신 LC_CTYPE 및 LC_PAPER를 설정하십시오.

Gilles : 영어 이외의 언어로 메시지를 보내려는 경우 LC_MESSAGES

분명히 여기에 내가 알지 못하는 문제가 있으며 다른 많은 사람들도 마찬가지입니다. 로케일을 설정할 때 고려해야 할 사항은 무엇이며 어떻게 설정해야합니까? 나는 항상 dpkg-reconfigure locales데비안에서 뛰었고, 그것에 대해 두 번 생각하지 않았습니다.

구체적인 질문 : 로케일을 en_IN.UTF-8로 설정해야합니까? 그렇게하는 데 단점이 있습니까?

참조 : 합니까 LC_COLLATE 문자 범위에 영향을 (해야)?

답변:


29

로캘 설정은 문화와 관련된 사용자 기본 설정입니다.

로캘 이름

내가 아는 모든 현재 유닉스 변형 (그러나 골동품은 아님)에서 로케일 이름은 동일한 패턴을 따릅니다.

  • ISO 639-1 소문자 두 자리 언어 코드, 또는 ISO 639-2 언어가 두 개의 문자 코드가없는 경우 세 문자 언어 코드입니다. 예를 들어 en영어, de독일어, ja일본어, uk우크라이나어, ber베르베르 어 등은…
  • 모든 언어는 아니지만 많은 언어의 경우 밑줄 _뒤에 ISO 3166 대문자 2 자리 국가 코드가 옵니다 . 따라서 : en_US미국 영어, en_UK영국 영어, fr_CA캐나다 (퀘벡) 프랑스어, de_DE독일 de_AT독일어, 오스트리아 독일어, ja_JP일본어 (일본) 등
  • 선택적으로, 점 .a의 이름 다음 인코딩 문자UTF-8, ISO-8859-1, KOI8-U, GB2312, Big5(나는이 얼마나 널리 모른다), 케이스와 문장 부호가 이름을 인코딩에서 무시됩니다 적어도 GNU libc와 함께 등. 예를 들어, zh_CN.UTF-8UTF-8로 인코딩 된 중국어 (간체) 중국어, zh_CNGB2312로 인코딩 된 중국어 (Mandarin Chinese zh_TW), Big5에서는 대만 (번체) 중국어 인코딩입니다.
  • 선택적으로 at 기호 @다음에 변형 이름이옵니다. 변형의 의미는 로케일에 따라 다릅니다. 예를 들어, 많은 유럽 국가에는 @euro통화 기호가 €이고 인코딩이이 문자 (ISO 8859-15 또는 ISO 8859-16)를 포함 하는 로케일 변형이 있는데, 오래된 통화 부호가있는 비공식 변형과는 다릅니다. 예를 들어 en_IE(English, Ireland)는 latin1 (ISO 8859-1) 인코딩과 £를 통화 기호로 en_IE@euro사용하고 latin9 (ISO 8859-15) 인코딩과 €를 통화 기호로 사용합니다.

또한 모든 유닉스 계열 시스템에는 두 개의 로케일 이름이 있습니다 : CPOSIX. 이 이름은 동의어이며 컴퓨터의 의미, 즉 컴퓨터 프로그램에서 구문 분석 한 데이터에 적합한 기본 설정입니다.

로케일 설정

다음 로케일 범주는 POSIX에 의해 정의됩니다 .

  • LC_CTYPE: 터미널 응용 프로그램에서 사용하는 문자 집합 : 분류 데이터 (문자, 문장 부호, 공백, 유효하지 않은 문자 등) 및 대 / 소문자 변환. 텍스트 유틸리티는 일반적으로 LC_CTYPE문자 경계를 결정합니다.
  • LC_COLLATE: 데이터 정렬 (즉, 정렬) 순서 이 설정은 여러 가지 이유로 매우 제한적으로 사용됩니다.
    • 대부분의 언어에는 정렬 대상 (예 : 사전 단어와 고유 이름이 같은 순서를 사용하지 않을 수 있음)에 따라 복잡한 규칙이 있으며로 표현할 수 없습니다 LC_COLLATE.
    • 로케일 설정을 사용하는 소프트웨어가 적절한 정렬 순서를 수행하는 응용 프로그램은 거의 없습니다. 예를 들어, 워드 프로세서는 파일 자체에 파일의 언어와 인코딩을 저장하고 (그렇지 않으면 파일이 다른 로케일 설정을 가진 시스템에서 올바르게 처리되지 않음) 환경에서 지정한 로케일 설정을 신경 쓰지 않습니다.
    • LC_COLLATE정렬 순서 A <a <B <…를 유발하기 때문에 불쾌한 부작용이있을 수 있습니다. "A와 Z 사이에"는 소문자 a부터 y까지를 포함합니다. 특히 매우 일반적인 정규 표현식 [A-Z]일부 응용 프로그램을 중단합니다 .
  • LC_MESSAGES: 정보 및 오류 메시지의 언어.
  • LC_NUMERIC: 숫자 형식 : 10 진수 및 천 단위 구분 기호.
    많은 응용 프로그램 .이 소수점 구분 기호로 하드 코딩 됩니다. 이것은 LC_NUMERIC매우 유용하지 않으며 잠재적으로 위험합니다.
    • 설정 한 경우에도 기본 형식이 자주 표시됩니다.
    • 한 응용 프로그램에서 로캘 종속 출력을 생성하고 다른 응용 프로그램 .이 소수점 또는 ,필드 구분 기호가 될 것으로 예상되는 상황에 처할 수 있습니다.
  • LC_MONETARY:과 LC_NUMERIC같지만 현지 통화 금액입니다.
    이것을 사용하는 응용 프로그램은 거의 없습니다.
  • LC_TIME: 날짜 및 시간 형식 : 요일 및 월 이름, 12 또는 24 시간제, 날짜 순서, 문장 부호 등

내장되지 않은 Linux에서 찾을 수있는 GNU libc는 추가 로캘 범주를 정의합니다.

  • LC_PAPER: 기본 용지 크기 (높이 및 너비로 정의).
  • LC_NAME, LC_ADDRESS, LC_TELEPHONE, LC_MEASUREMENT, LC_IDENTIFICATION: 나는이를 사용하는 모든 응용 프로그램을 알고하지 않습니다.

환경 변수

로캘 설정을 사용하는 응용 프로그램은 환경 변수에 따라 결정됩니다.

  • 그런 다음 LANG다른 설정으로 재정의되지 않는 한 환경 변수 의 값 이 사용됩니다. 경우 LANG설정되지 않은, 기본 로케일입니다 C.
  • LC_xxx이름은 환경 변수로 사용할 수 있습니다.
  • LC_ALL설정 하면 다른 모든 값은 무시됩니다. 이것은 주로 LC_ALL=C실행 위치에 관계없이 동일한 출력을 생성해야하는 실행 응용 프로그램 을 설정 하는 데 유용 합니다.
  • 또한 GNU libc LANGUAGE 폴백을 정의 하는 데 사용합니다 LC_MESSAGES(예 : LANGUAGE=fr_BE:fr_FR:en벨기에 프랑스어를 선호하거나 프랑스어 프랑스어를 사용할 수없는 경우 또는 영어를 사용할 수없는 경우).

로케일 설치

로케일 데이터가 클 수 있으므로 일부 배포판에서는 사용 가능한 형태로 제공하지 않고 추가 설치 단계가 필요합니다.

  • 데비안에서 로켈을 설치하려면 dpkg-reconfigure locales대화 상자의 목록에서 실행 하고 선택하거나 편집 /etc/locale.gen한 다음 실행하십시오 locale-gen.
  • Ubuntu에서 로캘을 설치하려면 로캘 locale-gen이름을 인수로 사용하십시오.

자신의 로캘을 정의 할 수 있습니다 .

추천

유용한 설정은 다음과 같습니다.

  • LC_CTYPE텍스트 파일을 인코딩 할 언어 및 인코딩으로 설정 하십시오. 터미널이 해당 인코딩을 사용하는지 확인하십시오.
    대부분의 언어에서는 인코딩 만 중요합니다. 몇 가지 예외가 있습니다. 예를 들어 대문자 iI대부분의 언어이지만 İ터키어 ( tr_TR)입니다.
  • LC_MESSAGES메시지를 보려는 언어로 설정 하십시오.
  • 설정 LC_PAPERen_US당신이 우리 문자가 기본 용지 크기 및 단지 다른 것 (예를 들어 대해 되길 원한다면 en_GB당신이 A4를 원하는 경우).
  • 선택적으로 LC_TIME원하는 시간 형식으로 설정 하십시오.

같이, 상기 피 설정을 설명 LC_COLLATE하고 LC_NUMERIC. 를 사용하는 LANG경우이 두 범주를로 설정하여 명시 적으로 재정의하십시오 C.


Gilles 안녕, 자세한 답변 주셔서 감사합니다. 데비안의 기본 설정을 무시하기에 좋은 곳은 어디입니까? A4 용지 크기가 필요하기 때문에 기본값 인을 (를) 재정의해야한다고 생각합니다 LC_PAPER. 재부팅하지 않고 시스템 전체에서 이것을 업데이트 할 수 있습니까?
Faheem Mitha

1
@FaheemMitha 환경 변수를 설정하는 가장 좋은 배포 / 쉘 불가지론 적 방법은 무엇입니까? 데비안에서 시스템 전체로 설정하려면 /etc/default/locale. 이 파일은 로그인 할 때 적용됩니다. export LC_PAPER=…쉘에서 수행 하여 해당 쉘에서 실행 된 명령에 영향을 줄 수 있습니다 .
Gilles 'SO- 악마 그만해'
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.