에있는 목록에 따르면 http://www.useragentstring.com/pages/useragentstring.php?typ=Browser 다양한 브라우저에서 9000을 통해 사용자 에이전트 문자열 :
- 0 개의 브라우저의 사용자 에이전트 문자열에 "bot"이라는 단어가 포함되어 있습니다.
- 브라우저의 2 개의 사용자 에이전트 문자열에 "crawl"이라는 단어가 포함되어 있습니다.
- 0 개의 브라우저의 사용자 에이전트 문자열에 "spider"라는 단어가 포함되어 있습니다.
"크롤링"이 포함 된 2는 다음과 같습니다. "Mozilla / 4.0 (호환 가능; MSIE 5.01; Windows NT 5.0; YComp 5.0.2.6; MSIECrawler)"및 "Mozilla / 4.0 (호환 가능; MSIE 5.01; Windows NT 5.0; MSIECrawler) ) "나는 그것들을 고려하지 않는 것이 안전하다고 생각합니다.)
http://www.useragentstring.com/pages/useragentstring.php?typ= 봇으로 나열된 442 개의 사용자 에이전트 문자열이있는 크롤러 목록에 따르면 :
- 208 개의 사용자 에이전트 문자열에 "bot"이라는 단어가 포함되어 있습니다.
- 봇의 63 개의 사용자 에이전트 문자열에 "크롤링"이라는 단어가 포함되어 있습니다.
- 봇의 37 사용자 에이전트 문자열에는 "스파이더"라는 단어가 포함됩니다
- 282 사용자 에이전트 봇 문자열에는 "bot", "crawl"또는 "spider"가 포함됩니다.
내 결론 : "bot", "crawl"및 "spider"라는 단어로 사용자 에이전트 문자열로 봇을 필터링하는 것이 안전합니다. 방탄은 아니지만 아무것도 아닌 것보다 확실히 낫습니다.
참고 : 키워드를 검색 할 때 대소 문자를 구분하지 않는 검색을 사용했습니다.
bot
,crawl
,spider
, 심지어을search
.