«text-processing» 태그된 질문

프로그램, 스크립트 등에 의한 텍스트 조작 또는 검사

8
파일에서 문자열을 바꾸려면 어떻게해야합니까?
특정 검색 기준에 따라 파일에서 문자열을 바꾸는 것은 매우 일반적인 작업입니다. 내가 어떻게 할 수있는 현재 디렉토리의 모든 파일에서 문자열 foo을 바꾸 bar시겠습니까? 하위 디렉토리에 대해서도 동일하게 반복합니까? 파일 이름이 다른 문자열과 일치하는 경우에만 바꾸시겠습니까? 문자열이 특정 상황에서 발견 된 경우에만 교체 하시겠습니까? 문자열이 특정 줄 번호에 있으면 바꾸시겠습니까? 여러 …
752 text-processing  awk  sed  perl 

4
에코보다 printf가 더 좋은 이유는 무엇입니까?
나는 그것 printf보다 낫다고 들었습니다 echo. RHEL 5.8의 일부 프로그램에 텍스트를 공급하는 데는 효과 가 없었지만 사용 printf했기 때문에 사용해야했던 경험에서 인스턴스를 하나만 기억할 수 있습니다 . 그러나 분명히 다른 차이점이 있으며, 하나를 사용할 때와 다른 것을 사용할 때 특정 사례가 있는지뿐만 아니라 그 차이점을 묻고 싶습니다.echoprintf

10
파일에 여러 줄을 추가하는 방법
파일이 존재하지 않으면 파일을 찾아 bash 스크립트를 작성하여 파일에 추가하십시오. Host localhost ForwardAgent yes 그래서 "line then new line 'tab' then text"민감한 형식이라고 생각합니다. 나는 당신이 이것을 할 수 있다는 것을 알고 있습니다 : cat temp.txt >> data.txt 그러나 두 줄 이후로 이상하게 보입니다. 이 형식으로 추가하는 방법이 있습니까? echo …

8
grep에서 일치하는 지정된 그룹 만 출력 할 수 있습니까?
파일이 있다고 가정 해보십시오. # file: 'test.txt' foobar bash 1 bash foobar happy foobar "foobar"뒤에 나오는 단어 만 알고 싶기 때문에이 정규식을 사용할 수 있습니다. "foobar \(\w\+\)" 괄호는 내가 foobar 바로 뒤에있는 단어에 특별한 관심이 있음을 나타냅니다. 내가 할 때 grep "foobar \(\w\+\)" test.txt, 차라리 그냥 "는 foobar 후 단어"보다, …

4
왜 쉘 루프를 사용하여 텍스트를 처리하는 것이 좋지 않은 것으로 간주됩니까?
POSIX 쉘에서 일반적으로 좋지 않은 것으로 간주되는 텍스트를 처리하기 위해 while 루프 를 사용 합니까? 으로 스테판 Chazelas가 지적 , 쉘 루프를 사용하지 않는 이유 중 일부입니다 개념 , 신뢰성 , 가독성 , 성능 및 보안을 . 이 답변 은 신뢰성 과 가독성 측면을 설명합니다 . while IFS= read -r …

18
du 출력을 크기별로 어떻게 정렬합니까?
du -sh /dir/*크기별로 어떻게 정렬 합니까? 나는 사용을 말한 사이트를 읽었 | sort -n지만 분명히 맞지 않습니다. 여기에 잘못된 예가 있습니다. [~]# du -sh /var/* | sort -n 0 /var/mail 1.2M /var/www 1.8M /var/tmp 1.9G /var/named 2.9M /var/run 4.1G /var/log 8.0K /var/account 8.0K /var/crash 8.0K /var/cvs 8.0K /var/games 8.0K /var/local …



6
특정 열 크기로 텍스트를 줄 바꿈하려면 어떻게해야합니까?
cat test.txt | pr -w 80줄을 80 자로 줄 바꿈 하는 것과 같은 것을 사용할 수 있지만 인쇄 된 줄의 맨 위와 맨 아래에 많은 공간이 있고 일부 시스템에서는 제대로 작동하지 않습니다. 긴 줄이있는 텍스트 파일을 특정 너비로 ​​줄 바꿈하는 가장 좋은 방법은 무엇입니까? 단어를 어기는 것을 막을 수 있다면 …

14
큰 (70GB) 한 줄의 텍스트 파일에서 문자열 교체
거대한 (70GB), 한 줄 의 텍스트 파일이 있고 문자열 (토큰)을 바꾸고 싶습니다. 토큰 <unk>을 다른 더미 토큰 ( 장갑 문제 ) 으로 바꾸고 싶습니다 . 나는 시도했다 sed: sed 's/<unk>/<raw_unk>/g' < corpus.txt > corpus.txt.new 그러나 출력 파일 corpus.txt.new에는 0 바이트가 있습니다! 나는 또한 perl을 사용해 보았습니다. perl -pe 's/<unk>/<raw_unk>/g' < …

9
텍스트 파일에서 중복 줄을 제거하는 방법?
내 거대한 (최대 2 GiB) 텍스트 파일에는 모든 줄의 약 100 정확한 사본이 포함되어 있습니다 (제 경우에는 CSV와 같은 데이터 테이블이므로 쓸모가 없습니다). 내가 필요로하는 것은 원래 순서를 유지하면서 모든 반복을 제거하는 것이 좋습니다 (바람직하게는 성능을 크게 향상시키기 위해 희생 될 수 있음). 결과적으로 각 라인은 고유해야합니다. 100 개의 동일한 …

6
bash를 사용하여 변수에서 특정 문자를 제거하십시오.
변수 (내 경우에는 개발 키트 버전) 를 구문 분석하여 dot ( .)을 무료 로 만들고 싶습니다 . 인 경우 version='2.3.3'원하는 출력은 233입니다. 나는 아래와 같이 시도했지만 그것을 .주는 다른 캐릭터로 교체 해야 합니다 2_3_3. 경우 잘했을 것이다 tr . ''일 것이다. 1 VERSION='2.3.3' 2 echo "2.3.3" | tr . _

4
일치하는 패턴 뒤에 줄의 일부만 반환
따라서 파일을 열어서 일치하는 줄을 얻는 데 cat사용 grep하면 처리 할 특정 로그 세트로 작업 할 때만 가능합니다. 라인을 패턴과 일치시키는 방법이 필요하지만, 일치 후 라인의 일부만 반환합니다. 경기 전후의 부분은 지속적으로 다릅니다. 내가 사용하여 연주 한 sed나 awk,하지만 경기 전 부분을 삭제하거나 경기 후 일부를 반환하거나 라인을 필터링하는 방법을 …

13
디코딩 URL 인코딩 (백분율 인코딩)
URL 인코딩을 해독하고 싶습니다.이 작업을 수행하기위한 기본 제공 도구가 sed있습니까? 아니면 누구나이 작업을 수행 할 코드를 제공 할 수 있습니까? unix.stackexchange.com 및 인터넷을 통해 조금 검색 했지만 URL 인코딩을 디코딩하는 명령 줄 도구를 찾을 수 없었습니다. 내가하고 싶은 일은 단순히 txt파일을 편집하여 간단히 편집하는 것입니다. %21 된다 ! %23 된다 …

15
바이트 수를 인간 KiB MiB 등으로 변환하는 표준 도구입니다. 뒤처럼, ls1
숫자 값을 1.00과 1023.99 사이로 유지하면서 바이트 수의 정수를 가능한 가장 큰 단위 크기의 사람이 읽을 수있는 카운트로 변환 하는 표준 도구 가 있습니까? 나는 내 자신의 bash / awk 스크립트를 가지고 있지만 많은 / 대부분의 배포판에서 찾을 수 있는 표준 도구를 찾고 있습니다 ... 더 일반적으로 사용 가능한 것이 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.