너비가 0 인 공간이 흩어져있는 매우 큰 파일이 있습니다. 를 사용하여 열고 편집하는 데 시간이 너무 오래 걸리므로를 사용 vi
하여 캐릭터의 모든 인스턴스를 삭제하고 싶습니다 sed
. 문제는 캐릭터와 일치하는 방법을 알 수 없다는 것입니다! \u200B
,을 사용해 보았습니다 \x{200b}
. 어떤 아이디어?
도움이된다면 CentOS 5를 실행하고 있습니다.
sed 사본이 파일이 인코딩 된 유니 코드 인코딩을 지원합니까? sed로 제대로 할 수있는 방법이 없다면, 파이썬 스크립트 나 그와 비슷한 것을 사용하는 것이 좋습니다.
—
JanC
@ JanCan-실제로, 나는 파이썬과 함께 갔다. 파일은 utf8로 인코딩되어 있으며 어떤 것이라도 처리 할 수있을 정도로 표준적인 것 같습니다. 누군가에게 유용 할 수 있도록 아래에 파이썬 스크립트를 추가했습니다.
—
thetaiko