«csv» 태그된 질문

데이터를 포함하는 파일은 쉼표 (따라서 쉼표로 구분 된 값)로 열을 구분하기 위해 테이블에 정렬됩니다. 행은 개행 문자로 구분됩니다 (단, 개행 문자를 포함하기 위해 필드를 인용 할 수 있으므로 모든 개행 문자는 행 구분 기호가 아닙니다).이 태그는 행당 하나의 레코드가 더 단순하거나 인용 부호가없는 완전한 CSV 데이터에 사용합니다 (csv-simple 사용) 그런 종류의 데이터).



6
다른 파일에서 찾은 행에 따라 파일에서 행을 제거하십시오.
file1.txt 파일은 다음과 같은 줄을 포함합니다 : /api/purchase/<hash>/index.html 예를 들면 다음과 같습니다. /api/purchase/12ab09f46/index.html file2.csv 파일은 다음과 같은 줄을 포함합니다 : <hash>,timestamp,ip_address 예를 들면 다음과 같습니다. 12ab09f46,20150812235200,22.231.113.64 a77b3ff22,20150812235959,194.66.82.11 file1.txt에 해시 값이있는 모든 줄을 제거하여 file2.csv를 필터링하고 싶습니다. 말하자면 : cat file1.txt | extract <hash> | sed '/<hash>/d' file2.csv 또는 이와 같은 …

2
큰 CSV 파일 재 인덱싱
이 유용한 스레드 에서 답변을 겪었 지만 문제는 다른 것으로 보입니다 (적어도 sed~). 다음과 같은 행이있는 큰 CSV 파일 (200 + GB)이 있습니다. <alphanumerical_identifier>,<number> <alphanumerical_identifier>전체 파일에서 고유 한 위치 입니다. 나는 별도의 파일 생성하고자하는 인덱스에 의해 첫 번째 열을 대체 , 즉 <index>,<number> 우리가 얻을 수 있도록 : 1, <number> …
11 files  sed  awk  csv 

3
공백없이 'ps'명령 출력 형식
ps실행중인 모든 프로세스의 특정 속성과 일부 속성을 가져 오는 다음 명령이 있습니다. ps --no-headers -exo "uname,ppid,pid,etime,%cpu,%mem,args" 파싱 ​​할 수 있도록 CSV 형식으로 지정하고 싶습니다. 참고 구문 분석을 쉽게하기 위해 끝에 인수를 넣었습니다. ,다른 열에 의지가 있다고 생각하지 않습니다 . 틀린 경우 수정하십시오. 공백을 어떻게 제거합니까?
11 csv  ps 

5
쉼표로 밑줄 바꾸기 및 CSV에서 큰 따옴표 제거
CSV 파일이 있습니다 input.csv "1_1_0_0_76" "1_1_0_0_77" "1_1_0_0_78" "1_1_0_0_79" "1_1_0_0_80" "1_1_0_0_81" "1_1_0_0_82" "1_1_0_0_83" "1_1_0_0_84" "1_1_0_0_85" ............. 등등. 이 CSV 파일을로 변환해야합니다 result.csv 1,1,0,0,76 1,1,0,0,77 1,1,0,0,78 1,1,0,0,79 1,1,0,0,80 1,1,0,0,81 1,1,0,0,82 1,1,0,0,83 1,1,0,0,84 1,1,0,0,85

4
큰 따옴표 안에있는 쉼표 만 제거하십시오.
텍스트 파일에서 ,(쉼표)와 "(따옴표) 를 제거하고 싶습니다 ( 큰 따옴표에 쉼표로 구분 된 숫자가 포함 된 경우에만). 56,72,"12,34,54",x,y,"foo,a,b,bar" 예상 출력 56,72,123454,x,y,"foo,a,b,bar" 참고 : 위의 줄을 예제로 보여줍니다. 내 텍스트 파일에는 위와 같은 많은 줄이 포함되어 있으며 큰 따옴표 안에 쉼표로 구분 된 숫자는 달라야합니다. 그건, 56,72,"12,34,54",x,y,"foo,a,b,bar" 56,92,"12,34",x,y,"foo,a,b,bar" 56,72,"12,34,54,78,76,54,67",x,y,"foo,a,b,bar" 56,72,x,y,"foo,a,b,bar","12,34,54" 56,72,x,y,"foo,a,b,bar","12,34,54","45,57,84,92","bar,foo" …

5
bash에서 구분 된 텍스트 파일을 명령 인수로 구문 분석
텍스트 파일이 다음과 같이 분할되어 있습니다. field1,field2,field3 xield1,xield2,xield3 dield1,dield2,dield3 gield1,gield2,gield3 이 각 열은 프로그램의 매개 변수가되며 각 줄마다 프로그램을 호출하고 싶습니다. 나는 루프를 원했다. for $i in file command $field2 -x $field3 -PN -$field1 >> output done bash에서 이와 같은 것을 달성하는 가장 좋은 방법은 무엇입니까?

1
awk가 예기치 않게 문자열에서 점을 제거합니다
.csv파일 에 열 (2 위)을 추가하고 싶고 해당 열의 값이 문자열이되고 인용되기를 원합니다. 다음 명령은 따옴표없이 열을 추가합니다. awk -F"," 'BEGIN { OFS = "," } {$2="2.4.0"; print}' test.csv > output.csv 다음 방법은 따옴표를 포함하지만 어떤 이유로 든 .값에서 마지막 (점)을 제거합니다. awk -F"," 'BEGIN { OFS = "," } …
9 awk  csv 

1
n 번째 열에 m 번째 열이 포함 된 행을 얻는 방법
다음과 같은 도메인 및 웹 메일이 포함 된 CSV 파일이 있습니다. site1.com,mail.site1.com site2.com,testmail.com site3.com,mx.site3.com site4.com,smtp.site4.com site5.com,foomail.com site6.com,barmail.com site7.com,webmail.site7.com site8.com,01mx.site8.com site9.com,foobarmail.com site10.com,mx-smtp222.site10.com 웹 메일 열에 동일한 행의 도메인 열이 포함 된 행을 가져 오려고합니다. 위의 예에서 출력은 다음과 같아야합니다. site1.com,mail.site1.com site3.com,mx.site3.com site4.com,smtp.site4.com site7.com,webmail.site7.com site8.com,01mx.site8.com site10.com,mx-smtp222.site10.com

7
정확한 수의 구분자를 포함하는 행만 유지하십시오.
10 개의 필드가 쉼표로 구분 된 거대한 csv 파일이 있습니다. 불행히도 일부 행의 형식이 잘못되어 정확히 10 개의 쉼표를 포함하지 않습니다 (파일을 R로 읽으려고 할 때 문제가 발생합니다). 정확히 10 개의 쉼표가 포함 된 행만 필터링하려면 어떻게해야합니까?
9 csv  filter 

3
AWK를 사용하여 특정 열에서 특정 값을 가진 행 선택
큰 csv 파일이 있는데 다음과 같습니다. 1,2,3,4,5,6,-99 1,2,3,4,5,6,-99 1,2,3,4,5,6,-99 1,2,3,4,5,6,25178 1,2,3,4,5,6,27986 1,2,3,4,5,6,-99 7 번째 열이 -99와 같은 줄만 선택하고 싶으므로 출력은 다음과 같습니다. 1,2,3,4,5,6,-99 1,2,3,4,5,6,-99 1,2,3,4,5,6,-99 1,2,3,4,5,6,-99 나는 다음을 시도했다. awk -F, '$7 == -99' input.txt > output.txt awk -F, '{ if ($7 == -99) print $1,$2,$3,$4,$5,$6,$7 }' input.txt > …
6 linux  shell  awk  csv 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.