URL 매개 변수“? chocaid = 397”은 어디에서 왔습니까?


9

Google 웹 마스터 도구에서 첫 페이지 색인이 두 번인 것으로 나타났습니다.

  • example.com/
  • example.com/?chocaid=397

link type을 사용 하여이 문제를 해결할 수 있다는 것을 알고 canonical있지만 궁금합니다.이 매개 변수는 어디에서 왔습니까?

이 매개 변수 / 값으로 https://duckduckgo.com/?q=chocaid%3D397 페이지로 색인이 생성 된 다양한 사이트가 있습니다 .

이 사이트들 사이의 유사점을 찾았습니다. 그러나 결정적인 것을 찾을 수 없었습니다. 종종 첫 페이지이지만 모든 경우에 해당되는 것은 아닙니다. 일부는 NSFW이지만 전부는 아닙니다. 한 도메인의 URL에이 매개 변수가 있으면 같은 도메인의 다른 하위 도메인에도 해당 매개 변수가 있습니다.

위키 백과 항목

여기에 이미지 설명을 입력하십시오

Microsoft Codeplex

여기에 이미지 설명을 입력하십시오


Google 웹 마스터 도구 (또는 리퍼러 로그)에 어떤 URL이이 URL에 링크되어 있는지에 대한 표시가 있습니까?
MrWhite

@ w3d : 로그에 액세스 할 수 없습니다. GWT에서는 " HTML 개선 "→ "반복 된 페이지 제목" 에 나열되었습니다 . 따라서 추천자 정보를 얻을 수 없습니다.
unor

트래픽> 사이트 링크> 가장 많이 연결된 콘텐츠> 더보기 (링크 된 모든 페이지를 가져 오기)에 문제가 있는지 궁금합니다. 를 들어 ?chocaid=397다음 색인을 얻을 아마도 뭔가 첫번째 장소에있는 링크를 찾기 위해 구글을 위해에 연결되어?
MrWhite

@ w3d : 아, 알겠습니다. 불행히도이 보고서에 대한 데이터는 여전히 누락되었습니다 (아마도 며칠 동안 만 GWT를 사용하고 있기 때문에).
17:00에

이것이 도움이되는지 확실하지 않지만 숫자 397은 해시 와 관련이 있습니다 ( herehere 참조 ). 나는 이것이이 질문과 관련이 있는지 확실하지 않지만 ?chocaid=397해시를 엉망으로 만드는 시도가 될 수 있습니다 (나는 이것에 대해 많이 알지 못하므로 확실하지 않습니다). 또한 이것은 좋은 질문입니다.

답변:


1

도메인이 얼마나 새롭습니까? 이전 도메인에서 많이 사용되는 쿼리 였으므로 여전히 "방문자"가 표시 될 수 있습니다. 유효한 페이지 또는 404에 매핑됩니까? 거기에 많은 인기가 있고 404 인 경우 홈페이지 또는 무언가에 .htaccess를 사용하여 다시 매핑합니다.


1
나는 아직 방문자를 보지 못했다. Google에서 색인을 생성 한 페이지를 보았습니다. 매개 변수가 생략 된 것처럼 동일한 프론트 페이지에 맵핑됩니다. 나는 그것을 리디렉션하거나 사용할 수 있다는 것을 알고 canonical있지만이 질문은이 매개 변수의 출처에 관한 것입니다.
unor

2
그러나 이것은 다른 많은 도메인의 검색 결과에 동일한 URL 매개 변수가 나타나는 이유를 설명하지 않습니다.
MrWhite

1

jQuery / Javascript에 액세스하고 가능한 모든 것을 크롤링하려는 Googlebot 일 수 있습니다. Googlebot이 사이트에서 유효하지 않은 URL을 크롤링했기 때문에 도움을 요청하는 최근 게시물이 여기에있었습니다. John M은 Googlebot이 사이트의 스크립트에서 크롤링하기 위해 더 많은 URL을 찾는 방법에 대해 대답했습니다. 그는 Google 웹 마스터 도구에서 일합니다. 표준 태그를 설정하여 자신의 질문에 거의 대답했습니다.


1

확실한 대답은 없지만 이것을 좁히는 데 도움이되는 몇 가지 사항을 찾았습니다.

  • 링크는 Bing 및 Yahoo에도 표시되므로 Google과 관련이 없습니다.
  • 위키, Tumblr 블로그, Wordpress 블로그 및 기타 사이트에 표시되므로 특정 소프트웨어의 악용을 통해 추가되지 않습니다.
  • 그들은 매우 낮은 품질의 Tumblr 사이트에 나타나기 때문에 광고가 게재되지 않았을 것입니다. 마찬가지로 위키 백과 기사는 광고를 통해 홍보되지 않을 수 있습니다.

가장 좋은 추측은이 URL을 찾은 모든 링크에 추가하는 스크레이퍼 사이트가 있다는 것입니다. 분명히 외부 링크는 그들이 어디에서 왔는지에 대한 가장 가능성이 높은 설명처럼 보이며 디렉토리는 꽤 임의의 페이지에 추가되기 때문에 디렉토리가 아닐 가능성이 높습니다.


0

이것은 귀하가 가지고있을 수있는 광고 제공 업체의 것일 수 있습니다. 동일한 문제가 있으며 유일하게 가능한 곳은 자바 스크립트 코드를 통해 일부 악성 코드를 주입하는 공급 업체입니다.


이에 대한 소스 / 증거가 있습니까? 이 매개 변수를 사용하여 색인화 된 일부 Wikipedia 가 있으므로 Wikipedia가 여기에 감염되었음을 의미합니다 .
unor

그래, 내가이 때문에 Google이 차단 한 블로그가 있고 범인 광고를 제거한 후 차단을 제거하기 시작했습니다
Raymund
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.