FF FE
BOM 과 함께 .csv 파일을 받았습니다 .
$ head -n1 dotan.csv | hd
00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.|
awk
구문 분석하는 데 사용하면 null 바이트가 많아 바이트 순서로 인한 것 같습니다. 일반적인 도구가 작동하도록이 파일에서 바이트 순서를 바꾸려면 (CLI 사용) 어떻게해야합니까?
이 파일은 오직 ASCII 문자 (BOM 제외) grep
라고 생각 하지만 이진 파일이라고 생각할 수는 없습니다 .
$ grep -P '^[\x00-\x7f]' dotan.csv
Binary file dotan.csv matches
VIM에서 동일한 문자열을 검색하면 모든 문자 일치를 보여줍니다 !
iconv
ASCII로 변환하는 데 사용하면 \ x00 값이 제거되지 않습니다. 실제로 UTF-8 대신 null 바이트처럼 보이기 때문에 문제가 더 악화됩니다!
$ iconv -f UTF-8 -t ASCII dotan.csv > fixed.txt
iconv: illegal input sequence at position 0
$ iconv -f UTF-8 -t ASCII//IGNORE dotan.csv > fixed.txt
$ head -n1 fixed.txt | hd
00000000 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 70 00 |A.d. .g.r.o.u.p.|
일반적인 도구가 작동하도록이 파일에서 바이트 순서를 바꾸려면 (CLI 사용) 어떻게해야합니까?
Windows 또는 Mac에서 만든 CSV 파일?
—
cuonglm
파일의 일부를 줄 수 있습니까?
—
cuonglm