훌륭한 질문이며 Baidu 스파이더가 악명 높고 서버의 리소스를 za 수 있기 때문에 많은 웹 마스터가 관심을 가질 수 있습니다 ...
바이두의 웹 검색 뉴스 바와 같이, 크롤링 지연 알림 설정을 지원하지 않습니다 거미 바이 진술로 대신하고, 등록하고 바이두 웹 마스터 도구 플랫폼 사이트를 확인하도록 요구 여기 의 사이트에서. Baidu에서 직접 크롤링 빈도를 제어 할 수있는 유일한 옵션 인 것 같습니다.
문제는 다른 스팸 봇 (상장 바이두의 사용자 에이전트를 사용한다는 것입니다 여기에 자신의 자주 묻는 질문의에 표시된대로, 귀하의 사이트를 거미에 2 번 아래)를 여기에 바이와 느린 크롤링 속도를 요구하는 모든 것을 해결할 수 있도록 4 번에서.
따라서 Baidu의 웹 마스터 도구를 사용하기로 결정한 경우 Bots vs Browsers Database 와 같은 리소스를 사용하거나 역방향 DNS 조회를 사용하여 사용자 에이전트와 연관된 것으로 알려진 IP를 사용자 에이전트와 비교하는 것이 좋습니다.
다른 옵션은 모든 Baidu 사용자 에이전트를 차단하여 Baidu의 잠재적 트래픽을 희생하거나 Apache의 mod_qos 와 같은 과도한 요청을 제한하는 것입니다 .
- 위치 / 자원 (URL) 또는 가상 호스트에 대한 최대 동시 요청 수입니다.
- URL에 허용 된 초당 최대 요청 수 또는 초당 다운로드 된 최대 바이트 수와 같은 대역폭 제한
- 초당 요청 이벤트 수를 제한합니다 (특별 요청 조건).
- 또한 제한없이 또는 웹 서버에 액세스 할 수있는 매우 중요한 사람 (VIP)을 "감지"할 수 있습니다.
- 무단 작업을 거부하는 일반 요청 라인 및 헤더 필터 본문 데이터 제한 및 필터링 요청 (mod_parp 필요)
- TCP 연결 수준에 대한 제한 (예 : 단일 IP 소스 주소 또는 동적 연결 유지 제어에서 허용되는 최대 연결 수).
- 서버에 사용 가능한 TCP 연결이 부족한 경우 알려진 IP 주소를 선호합니다.
Baidu 웹 마스터 도구에 대한보고 된 경험을 찾지 못했습니다.로드 속도가 느리고 번역 문제가 있습니다 (영어 버전 없음). 도움이 될 수 있지만 물론 의견 기반입니다.