URL에 % 인코딩 된 UTF-8 텍스트가 많은 html 파일이 있습니다.
예를 들어 "% D1 % 80 % D0 % B5 % D1 % 81 % D1 % 83 % D1 % 80 % D1 % 81 % D1 % 8B"는 "ресурсы"(러시아의 "리소스")를 나타냅니다.
작업은 그러한 모든 하위 문자열을 읽을 수있는 UTF-8 텍스트로 바꾸는 것입니다.
작업을 단순화하기 위해 %
파일에 다른 부호 사용법 이 없다고 생각할 수 있습니다 . 문자 숫자는 대문자와 소문자 일 수 있습니다.
나는이 우아하게 수행 할 수 있습니다 의심 sed
, perl
, awk
또는 뭔가하지만 방법을 모르겠어요.
이 웹 응용 프로그램 은 붙여 넣은 텍스트로 트릭을 수행하는 것 같습니다.