Google은 HTML 양식을 제출합니까?


10

나는 웹 페이지를 가지고 있으며, http://domain/purchase이 페이지에는 웹 양식이 있습니다. 이 양식을 제출하면 (클라이언트 측과 서버 측 모두 유효성 검사가 있고 필드가 적절하게 채워질 때까지 유효성 검사되지 않음) 다른 양식을 선택할 수있는 다른 페이지로 리디렉션됩니다. 다른 설정을 한 다음 제품을 구입하십시오. 두 번째 페이지가 있다고 가정합니다 http://domain/options.

따라서 사용자는 사이트를 방문 http://domain/purchase하여 양식을 작성하고 제출 한 다음 http://doamin/options?parameter1=value1&parameter2=value2첫 번째 페이지의 매개 변수가 포함 된 두 번째 페이지로 리디렉션됩니다 . 이는 웹 페이지간에 (또는 기술적으로 URL간에) 매개 변수를 전달할 때 매우 일반적입니다.

이제 내 웹 사이트를 검토 한 결과 Google에서 다음과 같이 리디렉션 된 웹 페이지 및 URL을 색인으로 생성 한 것을 확인했습니다.

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

이는 Google Bot이 http://domain/purchase페이지 를 방문하여 양식을 작성하고 제출했으며 해당 매개 변수를 사용하여 다른 URL로 리디렉션 되었음을 의미합니다 . 이것은 나에게 이해되는 유일한 방법입니다. Google은 실제로 양식을 작성합니까?

추신 : 모든 매개 변수는 의미가 있습니다. 즉, 임의로 채워지지 않습니다. 예를 들어 인덱싱 된 페이지 의 phone 매개 변수에는 올바른 전화 번호가 있습니다. 그게 어떻게 가능해?

답변:


8

Google 은 2008 년부터 HTML 양식을 크롤링 할 수있었습니다 .

각 입력에 대한 값을 선택하면 사용자가 수행 할 수있는 쿼리에 해당하는 URL을 생성 한 다음 크롤링하려고합니다. 검색어로 인해 생성 된 웹 페이지가 유효하고 흥미롭고 색인에없는 콘텐츠를 포함하고 있음을 확인하는 경우 다른 웹 페이지를 포함하는 것처럼 색인에 해당 페이지를 포함시킬 수 있습니다.

반면에 GoogleBot이 해당 필드에 입력 할 올바른 매개 변수를 알지 못할 가능성이 있으므로 다른 설명이있을 수 있습니다. 사용자가 리디렉션 된 페이지에 연결할 수 있습니까?


이 Google 웹 마스터 동영상은 다음 두 가지 사항을 모두 다룹니다. youtube.com/watch?v=xS0oHYZafTQ
DisgruntledGoat

그들은 단지 GET 양식을 크롤링한다고 말합니다 . 내 양식 메소드는 POST 입니다. 따라서 적용 할 수 없습니다. 예, 왜 URL은 항상 링크 가능합니다.
Saeed Neamati

5
당신이 ?parameter1=value9&parameter2=value10URL에서 볼 수 있다면 , 그들은 그것을 얻는 것입니다; POST는 URL에 양식 변수를 포함하지 않습니다.
Wooble

@ Woobie :이 경우 URL 매개 변수는 양식이 POST 된 후 서버 측 리디렉션의 결과로 보입니다.
MrWhite

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.