문자 집합간에 텍스트 파일을 변환하는 가장 빠르고 쉬운 도구 또는 방법은 무엇입니까?
특히 UTF-8에서 ISO-8859-15로 또는 그 반대로 변환해야합니다.
좋아하는 스크립트 언어의 한 줄짜리 도구, 명령 줄 도구 또는 OS, 웹 사이트 등의 기타 유틸리티
지금까지 최고의 솔루션 :
Linux / UNIX / OS X / cygwin에서 :
Troels Arvin 이 제안한 Gnu iconv 는 필터로 사용 하는 것이 가장 좋습니다 . 보편적으로 사용 가능한 것 같습니다. 예:
$ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt
Cheekysoft 가 제안한 Gnu recode ( 수동 )는 하나 또는 여러 개의 파일을 그 자리에서 변환 합니다 . 예:
$ recode UTF8..ISO-8859-15 in.txt
이것은 짧은 별칭을 사용합니다.
$ recode utf8..l9 in.txt
Recode는 또한 다른 줄 끝 유형과 인코딩 간을 변환하는 데 사용할 수있는 표면 을 지원합니다 .
줄 바꾸기를 LF (Unix)에서 CR-LF (DOS)로 변환합니다.
$ recode ../CR-LF in.txt
Base64 인코딩 파일 :
$ recode ../Base64 in.txt
그것들을 결합 할 수도 있습니다.
Unix 줄 끝이있는 Base64 인코딩 UTF8 파일을 Dos 줄 끝이있는 Base64 인코딩 Latin 1 파일로 변환하십시오.
$ recode utf8/Base64..l1/CR-LF/Base64 file.txt
Powershell이 설치된 Windows ( Jay Bazuzi ) :
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(ISO-8859-15는 지원하지 않습니다. 지원되는 문자 세트는 유니 코드, utf7, utf8, utf32, ascii, bigendianunicode, default 및 oem입니다.)
편집하다
ISO-8859-1 지원을 의미합니까? "문자열"을 사용하면 예를 들어 반대로
gc -en string in.txt | Out-File -en utf8 out.txt
참고 : 가능한 열거 값은 "알 수 없음, 문자열, 유니 코드, 바이트, BigEndianUnicode, UTF8, UTF7, Ascii"입니다.
- CsCvt- Kalytta의 문자 세트 변환기 는 Windows를위한 또 다른 훌륭한 명령 행 기반 변환 도구입니다.
recode
파일 이름을 전달하지 않으면 필터 역할 을 할 것입니다. 예 :recode utf8..l9 < in.txt > out.txt
enca
하는 경우 입력 인코딩을 지정할 필요가 없습니다. 언어를 지정하는 것만으로도 충분 enca -L ru -x utf8 FILE.TXT
합니다.
iconv -f UTF-32 -t UTF-8 input.csv > output.csv
약 7 억 줄만 저장되고 1/3 만 저장됩니다. 전체 버전을 사용하면 iconv -f UTF-32 -t UTF-8 file.csv
2 백만 개 이상의 모든 행이 성공적으로 변환되었습니다.
gc -en Ascii readme.html | Out-File -en UTF8 readme.html
했지만 파일을 utf-8로 변환하지만 비어 있습니다! 메모장 ++은 파일이 Ansi 형식이지만 유효한 문자 세트가 아니라는 것을 이해하면서 읽는다고 말합니다. uk.answers.yahoo.com/question/index?qid=20100927014115AAiRExF