답변:
이 기능은 기본 Google 검색에서는 사용할 수 없으며 Google 로드맵에는 없습니다. Google 비디오를 보고이 주제에 대해 자세히 알아볼 수 있습니다. Google 은 정규 표현식으로 검색하는 기능을 구현합니까?
그러나 한 가지 예외가 있습니다. Google 코드 검색 은 정규식을 지원합니다. 물론이 주제 검색 엔진의 검색 대상은 소스 코드로만 축소됩니다.
일부 Google 검색 키워드는 정규식을 부분적으로 대체 할 수 있습니다. 예를 들어 "search TERM"의 두 단어 변형을 검색하려는 경우 와일드 카드 연산자를 사용할 수 있습니다.
search *
검색 결과 및 다른 단어 하나를 찾습니다. 나는 종종 기본 영어 문법 규칙이나 동의어 (예 : "as easy as *" ) 를 확인하는 데 사용합니다 .
SymbolHound 에는 Stackoverflow와 같은 프로그래밍 관련 사이트를 색인하는 기호 포함 웹 검색 외에 현재 중단 된 Google 코드 검색 옵션과 유사한 오픈 소스 코드 저장소 검색이 있습니다.
다음과 같은 목적으로 소프트웨어를 작성할 수 있습니다.
에서 :의이 사건을 연구하자 site:gog.com
스페인어 음성 해설이있는 모든 게임을 찾을 수 있습니다.
정규식은 다음과 같습니다.
Audio[^:]*:[^.,]*Spanish
예를 들어 다음과 일치해야합니다.
Audio lanuage: English, German, Spanish, French.
일치하지 않습니다.
Audio language: only-English. Text language: Spanish.
1 단계. 소프트웨어가 Google에서이를 검색하도록합니다.
site:gog.com audio Spanish inurl:game
inurl:game
게임 설명 페이지에서만 검색한다는 의미입니다.
2 단계. 300 개의 결과 링크를 가져 와서 각 링크로 크롤링하십시오.
3 단계. 주어진 정규 표현식으로 결과를 필터링합니다.
Audio[^:]*:[^.,]*Spanish
이것은 쉽게 구축 할 수 있어야합니다. 사실 나는 왜 그런 식으로 이미 만들어진 것을 찾을 수 없는지 이해하지 못합니다.
검색 엔진은 정규 표현식으로 데이터를 스캔 할 수있는 리소스를 제공 할 수 없기 때문에이 더러운 작업은 사용자의 책임이며 컴퓨터는 검색 엔진이 이미 제공 한 작업을 수행해야합니다.
참고로 검색 연산자에 대한 Google의 도움말은 여기에 있습니다 .
흥미롭게도 "-"는 여전히 단어 제외를위한 연산자이지만 "+"를 연산자로 제거하여 과거에 주어진 검색어를 요구했습니다. "+는 연산자가 아닌 검색 가능한 문자로 +가 필요했기 때문에 Google+가 시작될 때 + 연산자가 종료되었습니다."( https://support.google.com/websearch/answer/2466433 )
자세한 Google 검색으로 시작하여 검색 할 대상 텍스트를 컬링 할 수 있습니다. 그런 다음 상위 50 개 결과를 여러 탭으로 열고 mingyi의 "Fastest Search"Firefox 애드온 을 사용하여 정규식을 사용하여 결과를 검색하십시오.
Google은 이제 RegEx 사용을 지원하고 문서화합니다. 참조 링크는 다음과 같습니다.
http://www.google.com/support/enterprise/static/postini/docs/admin/en/admin_ee_cu/cm_regex.html