Excel 2016에서 저장된 러시아어 UTF-8 탭으로 구분 된 CSV 파일이 텍스트 편집기에서 가비지입니다


1

Excel 2016에는 UTF-8 쉼표로 구분 된 CSV 파일로 내보내는 옵션이 있습니다. 필드 사이에 쉼표를 원하지 않습니다. 탭이 필요합니다.

파일을 탭으로 구분 된 txt 파일로 저장합니다. 다른 이름으로 저장 대화 상자에서 "도구", "웹 옵션", "인코딩"으로 이동하여 UTF-8을 선택하십시오. 그런 다음 Sublime Text 3-파일을 조작하기 위해 파이썬 스크립트를 작성하는 데 사용하는 IDE로 메모장을 엽니 다 (메모장에서 열 수 없습니다).

번역과 함께 약 200,000 개의 러시아어 문장이있는 큰 파일입니다. 다른 텍스트는 괜찮아 보이지만 러시아 문자는 모두 ???? ????. 완전히 쓸모없는.

쉼표로 구분 된 CSV는 완벽하게 작동합니다. 탭으로 구분 된 UTF-8 CSV 파일을 Excel에 성공적으로 저장하는 방법이 있습니까?


내 생각에 그 웹 옵션은 실제 웹 형식에만 적용되거나 탭 구분으로 저장하는 데 사용하는 모든 방법이 순수한 ASCII 인코딩으로 돌아갑니다. 각 형식을 저장 / 내보내기 위해 어떤 단계를 사용하고 있습니까?
세스

글쎄, 나는 밤새 웹을 둘러보고 있었다. 웹 옵션은 지난 10여 년 동안 표준 솔루션 인 것으로 보입니다.
Deersfeet

???가있는 파일에 사용 된 인코딩을 확인 했습니까? 그 안에? 파일을 열 수 없으면 누락 된 러시아어 문자를 어떻게 확인 했습니까? Sublime을 통해 쉼표를 탭으로 바꾸는 것을 고려 했습니까?
세스

@Seth : 문제는이 외국어 CSV의 필드 인 문장에 쉼표가 포함되어 있다는 것입니다.
Deersfeet

답변:


0

불행히도 Deersfeet도 확인했듯이 Office 2016 에서이 기능이 손상 된 것으로 확인 되었으므로이 웹 옵션 기능에 대해 들어 본 적이 없었습니다.이 기능을 테스트하고 있으며이 문제를 재현 할 수 있습니다.

해결 방법으로, 항상 내 내보내기 설정을 훨씬 더 많이 제어하고 싶기 때문에 항상 사용했던 방법을 사용할 수 있습니다.

  • MS Access를 열고 Excel에서 데이터를 가져옵니다.
  • Access에서 데이터를 내 보냅니다. Access에는 플랫 텍스트 파일 (캡슐, 구분 기호, 줄 끝 등)로 내보내는 훨씬 더 고급 설정이 있습니다.

특정 질문에 대한 답변

Is there just no way to successfully save a tab-delimited UTF-8 CSV file in Excel?

MS가 이것을 고칠 때까지는 아닙니다.
버그 보고서를 열 수는 있지만 MS가 커뮤니티 피드백에 신경 쓰지 않는 것처럼 그렇게하는 것에 좌절했습니다 ...


이 답변에 감사드립니다. OpenOffice Calc를 사용하기 시작했습니다. 셀 너비가 텍스트에 맞게 설정되어 있기 때문에 Calc가 성가시다. 모든 데이터를 미리보기 유형 너비로 한 번에보고 싶습니다. 지금해야 할 일입니다. 나는 당신의 접근 아이디어를 시도 할 것입니다.
Deersfeet

0

나는 당신이 찾고있는 가장 가까운 것이 "파일 형식 : 유니 코드 텍스트 "라고 생각합니다. 텍스트 파일을 탭으로 구분하고 utf-8이 아닌 유니 코드이지만 러시아어 문자를 지원합니다.


유니 코드는 인코딩이 아니며 표준입니다. UTF-8은 유니 코드 표준을 따르는 인코딩입니다. "유형으로 저장 : 유니 코드 텍스트"옵션은 BOM 헤더와 함께 유니 코드 호환 인코딩 UCS-2 Little Endian을 사용하여 텍스트 파일을 작성합니다.
Wouter

1
@Wouter :이 설명을 해주셔서 감사합니다. 엔디안이 어떻게 숭고한 텍스트로 엉망인지 궁금합니다. 그리고 UTF-8이 아니라는 것을 알면 상황이 더 명확 해집니다.
Deersfeet
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.