길거나 짧은 검색어를 찾는 것이 더 빠릅니까? 아니면 속도에 전혀 영향을 줍니까? 다시 말해, 검색어를 최대한 정확하게 작성해야합니까?
100,000 개가 넘는 파일이 있으며 각 파일에는 20 행에서 5000 행이 넘는 데이터 행이 있습니다. 일반적으로 grep은 하나의 검색어 인스턴스 만 찾는 데 사용됩니다.
검색어가 SEARCHTERM
이고 다음과 같은 행에 있다고 가정 해 보겠습니다 .
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
"SEARCH"또는 "SEARCHTERM"을 찾는 것이 더 빠릅니까? 이 경우 다른 관련없는 라인에서 일치하는 항목을 찾더라도 신경 쓰지 않는다고 가정 해 봅시다.
이것이 내가 현재하는 방법입니다.
grep NAD+DP 123* | grep SEARCHTERM
그러나 여전히 느립니다. 거친 파일 이름을 아는 경우에도 데이터를 찾는 데 약 3-5 분이 걸리며 범위는 약 10 000 파일로 제한됩니다.
그렇다면 더 길거나 짧은 검색어가 도움이 되겠습니까? 내가 아는 한 grep은 특정 길이의 단어의 "블록"을 찾습니다.