«text-processing» 태그된 질문

프로그램, 스크립트 등에 의한 텍스트 조작 또는 검사

3
쉘 명령을 사용하여 파일에서 열 또는 여러 열을 제거하는 방법은 무엇입니까?
내 파일 ARCHIVE B1_NAME B2_NAME B3_NAME ELEMENT INFO_NAM WERT PROCID -------- -------- -------- -------- -------- -------- ---- ------ 15MinAvg AIRSS 33-GIS DMDMGIS1 I MvAvr15m 1123 CP 15MinAvg AIRSS 33-GIS DMDMGIS1 P MvAvr15m 2344 CP 15MinAvg AIRSS 33-GIS DMDMGIS1 Q MvAvr15m 4545 CP 15MinAvg AIRSS 33-GIS DMDMGIS2 I MvAvr15m 6576 CP …

5
줄 순서를 유지하면서 중복 줄 제거
[root@server]# awk '!seen[$0]++' out.txt > cleaned awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error Aborted [root@server]# ""서버 "는 8GB RAM + 16GB SWAP, x> 300GB 여유 공간, amd64, 데스크탑 CPU입니다. 과학적 리눅스 6.6. LOAD를 만들기 위해 실행되는 다른 것은 없습니다. 몇 초 후에 Awk가 중단됩니다. out.txt는 ~ 1.6GB입니다. GNU Awk 3.1.7. …

9
파일의 특정 섹션 필터링 또는 파이프
시작 및 종료 태그로 구분 된 일부 섹션이있는 입력 파일이 있습니다. 예를 들면 다음과 같습니다. line A line B @@inline-code-start line X line Y line Z @@inline-code-end line C line D X, Y, Z 줄이 일부 명령 ( nl예 :)을 통해 필터링되도록이 파일에 변환을 적용하고 싶지만 나머지 줄은 변경되지 않고 …

3
sed match pattern N 회
파일을 2 단어 씩 청크로 나눕니다. $cat tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. word. /&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. \{2\}/&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 마지막 명령이 이전 명령과 동일한 결과를 줄 것으로 기대했습니다. 뭐가 …

5
sed를 사용한 대소 문자 일치 패턴 교체
여러 파일에 소스 코드가 분산되어 있습니다. abcdef교체해야 할 패턴 이 pqrstuvxyz있습니다. 패턴은 Abcdef(문장) 일 수 있으며로 교체해야합니다 Pqrstuvxyz. 패턴은 AbCdEf(케이스 전환) 일 수 있으며로 교체해야합니다 PqRsTuVxYz. 즉, 소스 패턴의 대소 문자를 일치시키고 적절한 대상 패턴을 적용해야합니다. 이 sed도구 나 다른 도구를 사용하여 어떻게이 작업을 수행 할 수 있습니까?

2
이 xargs 명령이 작동하지 않는 이유는 무엇입니까?
모든 .sh 확장자를 삭제하고 싶었습니다. ls *.sh | xargs -I {} mv {} `basename {} .sh` 그러나 작동하지 않으면 basename변경되지 않은 파일 이름을 반환 하는 것처럼 작동 합니다. 왜 그런 식으로 작동합니까? 예를 들어 다음과 같이 작동합니다. ls *.sh | xargs -I {} echo `basename {}.jpg .jpg`; 편집 : 솔루션 …


3
tail -f, 로그가 3 초 동안 유휴 상태 인 후 줄 바꿈을 삽입 하시겠습니까?
를 할 때 tail -f error.log3 초 동안 파일에 아무것도 적용되지 않은 후 프로그래밍 방식으로 줄 바꿈을 삽입하는 방법은 무엇입니까? (한 줄 바꿈을 추가 한 후에는 다른 줄의 텍스트를 로그 파일에 추가 할 때까지 다른 줄 바꿈을 추가하지 않아야합니다.) 예를 들어,이 행은 error.log에 적용됩니다. foo bar boo [[wait 4 seconds]] …

7
모든 파일 줄이 다른 파일에서 발생하는지 확인
나는 2 개의 파일을 가지고 있습니다 : file1은 약 10 000 줄이고 file2는 몇 백 줄입니다. file2의 모든 줄이 file1에서 발생하는지 확인하고 싶습니다. 즉 : ∀ line ℓ ∈ file2 : ℓ ∈ file1 이 기호의 의미 또는 "file2의 모든 행이 file1에서 발생하는지 확인"의 의미를 모르는 경우 다음 중 하나를 …

7
-v를 grep하고 매치 후에 다음 줄을 제외시키는 방법은 무엇입니까?
grep 정규식과 일치하는 각 줄에 대해 두 줄을 필터링하는 방법은 무엇입니까? 이것은 내 최소한의 테스트입니다. SomeTestAAAA EndTest SomeTestABCD EndTest SomeTestDEFG EndTest SomeTestAABC EndTest SomeTestACDF EndTest 그리고 분명히 나는 grep -vA 1 SomeTestAA작동하지 않는 것을 시도 했습니다. 원하는 출력은 다음과 같습니다 SomeTestABCD EndTest SomeTestDEFG EndTest SomeTestACDF EndTest


4
각 줄의 일부를 별도의 파일로 출력
다음과 같은 파일이 있습니다. a AGTACTTCCAGGAACGGTGCACTCTCC b ATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCAT c ATATTAAATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCATCCACTCCACAC d ATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGA e TTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATAAGTTTAATATCTGATATGTCCTCTATCTGA a.seqsequence를 포함 하는 파일을 만들고 싶습니다 AGTACTTCCAGGAACGGTGCACTCTCC. 마찬가지로을 b.seq포함 ATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCAT합니다. 즉, Column1은 확장명을 가진 출력 파일 이름으로 사용 된 .seq다음 해당 column2 시퀀스가 ​​있어야합니다. 펄 스크립트를 작성 하여이 작업을 수행 할 수 있지만 명령 줄에있는 것이 …

2
iconv 잘못된 입력 순서-왜?
텍스트 파일을 ASCII 파일로 변환하려고 할 때 오류 메시지가 나타납니다 iconv: illegal input sequence at position. 내가 사용하는 명령은 iconv -f UTF-8 -t ascii//TRANSLIT file 문제가되는 캐릭터는 æ입니다. 텍스트 파일 자체가 여기에 있습니다 . 왜 잘못된 순서라고 말합니까? 입력 문자는 올바른 UTF-8 문자 (U + 00E6)입니다.

2
grep -v와 같은 파이썬은 무엇입니까?
나는 좋아한다 grep -v. 나는 항상 그것을 사용합니다. 그러나 나는 또한 파이썬에서 텍스트 처리를하고 있으며, 한 가지 중요한 점이 부족합니다. 일반적 grep -v으로 텍스트에서 불필요한 것을 제거하는 데 사용 합니다. 예를 들어 $ grep -v '[a-z]' # (I manually review this output to confirm that I don't want those lines) …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.