«text-processing» 태그된 질문

프로그램, 스크립트 등에 의한 텍스트 조작 또는 검사

5
여러 줄의 텍스트 파일을 행으로 정렬
이 형식의 텍스트 파일이 있습니다. #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 이 파일을 한 KEY줄씩 정렬하고 그 결과와 함께 다음 4 줄을 유지하려면 정렬 된 결과는 다음과 같아야합니다. #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY2 VAL21 VAL22 …


3
파일을 최대 문자 수 (바이트 아님)로 자르는 방법
(UTF-8로 인코딩 된) 텍스트 파일을 주어진 문자 수로 자르려면 어떻게해야합니까? 나는 줄 길이에 신경 쓰지 않으며 컷은 단어 중간에있을 수 있습니다. cut 라인에서 작동하는 것처럼 보이지만 전체 파일을 원합니다. head -c 문자가 아닌 바이트를 사용합니다.

6
목록을 특정 문자에 맞추는 방법?
텍스트 줄을 임의의 문자에 가로로 맞추는 데 사용할 수있는 명령 또는 명령 집합이 있습니까? 예를 들어, 전자 메일 주소 목록을 사용하면 모든 '@'문자가 세로로 정렬 된 텍스트 파일이 출력됩니다. 성공하기 위해서는 대부분의 줄의 시작 부분에 가변 수의 빈 공간을 추가해야한다고 생각합니다. 읽기에 더 많은 노력이 필요하기 때문에 별도의 열을 원하지 …


3
정렬 된 텍스트 파일에서 이진 검색
수십억 줄의 가변 길이를 가진 큰 정렬 파일이 있습니다. 새로운 줄이 주어지면 정렬 된 파일에 포함 된 경우 어떤 바이트 번호를 얻게되는지 알고 싶습니다. 예 a\n c\n d\n f\n g\n 입력 'foo'가 주어지면 출력 9를 얻습니다. 전체 파일을 간단히 살펴보면 쉽게 수행 할 수 있지만 수십억 줄의 가변 길이가 있으면 …

3
sed 또는 awk 스트림에 머리글 및 / 또는 바닥 글을 추가하는 방법은 무엇입니까?
나는 sed와 awk를 통과하는 많은 출력을 가지고 있습니다. 출력에 시작 접두사를 붙이고 대답에 접미사를 END로 붙이려면 어떻게해야합니까? 예를 들어 All this code on all these lines and all these 어떻게 얻을 수 있습니까? START All this code on all these lines and all these END ? 나의 시도는 : awk …


4
sed를 사용하여 연속 스트리밍 출력을 조작하는 방법은 무엇입니까?
비 기술적 인 청중을위한 프레젠테이션을하고 있습니다. bash에서 실행중인 프로그램이있어 연속적인 값 스트림을 출력하며 그중 일부가 중요합니다. 관객이 자신의 빈도를 알 수 있도록 표시되는 중요한 결과를 강조하고 싶습니다. 문제는 sed실행중인 스트림에서 작동 할 수 없다는 것 입니다. 다음과 같이 결과를 파일에 넣으면 정상적으로 작동합니다. cat output.txt | sed "s/some text/some text …

9
파일의 모든 행을 쌍으로 확장하는 "고양이"명령 줄 도구
다음과 같은 파일 (sample.txt라고 함)이 있다고 가정합니다. Row1,10 Row2,20 Row3,30 Row4,40 본질적으로 네 행 모두의 페어 단위 조합 인이 파일의 스트림에서 작업 할 수 있기를 원합니다 (따라서 총 16 개로 끝나야합니다). 예를 들어, 출력이 다음과 같은 스트리밍 (즉, 효율적인) 명령을 찾고 있습니다. Row1,10 Row1,10 Row1,10 Row2,20 Row1,10 Row3,30 Row1,10 Row4,40 …


5
문자열 대체를위한 비선형 도구?
최근에 다른 특정 문자 뒤에 나오는 줄 바꿈 문자를 제거하는 방법에 대한 질문을 했습니다. 유닉스 텍스트 프로세싱 툴은 매우 강력하지만 거의 모든 텍스트 라인을 처리하는데, 이는 입력이 사용 가능한 메모리에 맞을 때 가장 좋습니다. 그러나 줄 바꿈이 포함되지 않은 거대한 파일에서 텍스트 시퀀스를 바꾸려면 어떻게해야합니까? 예를 들어 교체 <foobar>로 \n<foobar>입력 …

3
줄 바꿈 기호로 구분하여 파일을 여러 개의 작은 파일로 분할
줄 바꿈 기호로 파일을 나누는 유틸리티가 있습니까? 예를 들어 파일에 다음 줄이 포함 된 경우 aa bbb cccc 3 파일로 나누려면 원하는 출력은 다음과 같습니다. aa, bbb그리고 cccc(3 개의 다른 파일로) 이미 split명령을 확인했는데 파일 크기로만 파일을 자르고 원하는 것은 아닙니다. 유틸리티를 직접 작성하지 않은 경우 사용할 표준 도구가 있습니까?

2
텍스트 파일에서 특정 심볼의 모든 인스턴스를 제거하는 방법은 무엇입니까?
큰 따옴표로 묶인 필드가있는 CSV 파일 (대략 GiB의 절반, 일반적인 텍스트 편집기를 사용할 수 없음)이 "abc","def"있지만 따옴표 가없는 파일이 필요합니다 (파일 일관성을 손상시키지 않을 것이라고 확신합니다- 쉼표는 그 안에 값 안에 사용되지 않습니다). 장소에 공백을 넣지 않고 모든 따옴표를 제거하는 방법은 무엇입니까?


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.