다른 웹 사이트가 미러링되어 검색 결과에서 내 사이트보다 순위가 높습니다.


55

내 사이트를 완전히 반영했으며 이제 내 콘텐츠를 사용하여 1 위 자리에 Google에 링크가 표시됩니다. 로그 파일을 확인한 후이 사이트가 한동안 내 사이트를 크롤링하고 있으며 사이트에서 내 사이트로 10,000 개의 링크가 있음을 알았습니다.

이 사이트에서 참조 된 사용자 액세스를 차단했으며 이미 Google에 웹 스팸으로보고했습니다. 또한 도메인을 거부했습니다.

그들은 그런 사악한 전술을 위해 어떻게 구글에서 최고의 링크를 얻습니까 (내를 추월하더라도)? 이와 같은 문제를 완전히 제거하는 단계는 무엇입니까?

2014 년 8 월 28 일 업데이트 :

더 많은 정보를 얻었으므로 이에 대한 업데이트를 제공 할 것이라고 생각했습니다. 따라서 더러움은 하위 도메인을 내 IP로 지정하여 하위 도메인을 내 웹 사이트처럼 보이게하는 효과가있었습니다.

htaccess를 사용하기 때문에 며칠 동안 이것은 중요하지 않았습니다. 내 도메인이 아닌 모든 호스트를 내 도메인으로 리디렉션하여 기본적으로 Google에서 하위 도메인 트래픽 링크를 얻었습니다. 며칠 후 더티는 더 이상 이로부터 혜택을받지 못하도록 서브 도메인을 그들의 웹 사이트를 가리 키도록 변경했습니다.

요컨대 그들이 내 콘텐츠를 사용하여 Google에서 최고 순위를 차지했으며 이제는 더 많은 트래픽을 유도하기 위해 해당 링크를 웹 사이트로 다시 연결하고 있습니다.

그것은 더러운 웹 사이트에 의한 더러운 전술입니다. Google은 그러한 행동을 처벌하기를 희망합니다.


3
나는 그것이 당신의 동기에 의문을 제기하는 부분을 여기서 다루지 않았습니다. 그러나 그렇지 않으면 좋은 질문입니다.
John Conde

1
웹 사이트 복제는 새로운 트릭으로 보입니다. 현재 많은 웹 사이트가 잘못 사용되고 있습니다. Heise (독일어)에는이 주제에 관한 뉴스가 있습니다 . 일반적인 솔루션 (가짜 사이트보고 제외)은 크롤러의 IP 주소에 특수 컨텐츠를 공급하는 것으로 보이므로 예를 들어 실제 사이트에 대한 링크를 표시합니다.
martinstoeckli

1
미래에 대한 또 다른 걱정은 이제 Google이 웹 스팸에 대한 가혹한 입장을 취하게 되었기 때문에 경쟁 업체는 평판이 나쁜 사이트에 내 콘텐츠를 게시하여 내 평판을 손상시킬 수 있다는 것입니다. 또는 내 모르게 내 사이트를 가리키는 스팸성 보이는 블로그를 게시 할 것입니다.
말보로 Goodluck

3
@Jarrod Roberson : 실제로 소송에 대해 아는 사람은 없지만 여러 가지 솔루션이 있습니까?!
machineaddict

1
@JarrodRoberson 그러나 이것은 웹 마스터가 독점적으로 직면하는 문제이므로 여기에 요청하면 해당 웹 사이트를 처리해야하는 사람들로부터 응답을 얻을 수 있기 때문에이 사이트에 대해 매우 인기가 있습니다. 또한 사람들이 법적 솔루션과 함께 여러 가지 기술적 솔루션을 제출 한 것으로 보입니다.
than by

답변:


45

프록시 스크립트를 통해 사이트를 제공하거나 HTML 약어를 취소하여 사이트를 미러링하는 경우 표준 URL 을 페이지에 추가 할 수 있습니다 . 그러면 Google은 귀하의 콘텐츠가 원본 소스임을 알리고 자신의 URL이 아닌 검색 결과에 귀하의 URL을 표시합니다.

DMCA 요청 을 Google에 제출하십시오 . 그것들은 약간 느리지 만 궁극적으로 색인에서 해당 페이지를 제거합니다.

링크를 거부하는 것은 현명한 움직임입니다.

그래도 사용자를 차단하는 것이 도움이되는지 모르겠습니다. 페이지 상단에 메시지를 표시하면 원래 사이트임을 알리고 다른 하나는 사기라는 것이 더 나은 해결책 일 수 있습니다.


2
정식 URL이 항상 도움이되는 것은 아닙니다. 내 사이트를 미러링 한 스크립트가 표준 URL도 가짜 사이트를 가리 키도록 변경했습니다. 무의미했습니다.
CaptainCodeman

28

DMCA 신고서를 제출할 수 있으며 미국에 거주하는 경우 저작권 민사 소송을 제기 할 수 있습니다.

다음은 DMCA 신고가 모든 사람을 도울 수있는 방법을 설명하는 간단한 답변 링크입니다.

DMCA 신고서를 제출하려면 미국에 있어야합니까?

... 그리고 다른 하나는 더 설명합니다 ...

DMCA 신고서를 제출하기 전에 얼마나 많은 콘텐츠를 복사해야합니까?

미국에 거주하는 경우 저작권 문제에 대해 잘 알고있는 변호사를 고용하여 중지하고 원하는 편지를 보내도록 할 수 있습니다. 콘텐츠를 삭제하려면 영업일이 아닌 영업일이 아닌 10 일을 제공합니다. 사이트의 증거 및 스냅 샷을 위해 문제가되는 사이트의 스냅 샷을 캡처하려고합니다. 페이지가 제거되었는지 확인하면 검색 결과가 아닌 사이트를 직접 확인하십시오.

해당 기간 내에 페이지를 제거하지 않은 경우, 연방 민사 소송을 제기 할 수 있으며 최소 10,000 달러가 소요되어 비용이 거의 들지 않습니다. 운전석에 앉을 것입니다. 합의는 적어도 $ 10,000 이상 가능할 수 있습니다. 비용도 되돌릴 수 있습니다. 중요한 것은 문제를 바로 잡을 수있는 무료 옵션을 제공하는 것입니다. 그 후에는 피고에게 책임을지지 않고 사건을 제기 할 수 있습니다.

또 다른 참고 사항은 법원에 갈 때 손해 배상을해야한다는 것입니다. 검색 트래픽 손실은 피해입니다. 여기서 변호사와 함께 트래픽 손실을 설명하는 메트릭을 수집하고 해당 트래픽의 가치를 통해 수익을 창출해야합니다. 물론 % 100 전환율로도 더 높은 수치를 가정 할 수 있습니다. 만일을 대비하여 현재와 미래에 Google Analytics와 로그 파일 분석 소프트웨어를 사용하여 트래픽 손실에 대한 메트릭을 수집 할 것입니다.

사례를 제출하는 것이 현재와 미래에 겪고있는 피해와 비교할 때 어렵거나 비용이 많이 들지 않습니다. 최근 저작권 침해가 줄어들고 있지만 요즘에는 저작권을 침해하는 사람들이 훨씬 과감합니다. 우리는 이러한 사람들을 막을 필요가 있으며 유일한 방법은 저작권 침해를 비영리적으로 만드는 사업 전략에 비용 요소를 넣는 것입니다.


2
당신이 밟고있는 모든 문제는 사이트 뒤에 누가 있는지 알아내는 것이 사실상 불가능하다는 것입니다. 즉, 사이트를 실제 개인에게 쉽게 추적 할 수 있도록 바보가되어야합니다.
David Mulder

1
@DavidMulder 사이드 스텝핑이 없습니다. 변호사는 회사에 필요한 정보를 소환 할 수 있습니다. 친절한 편지로도 충분합니다. 정보가 제공되지 않은 경우, 변호사는 판사가 출두하지 않으면 판결 전에 징역형을 선고하거나 요청 된 정보를 제공 할 수 있습니다. 미국에서는 법률 또는 기타 다른 방법으로 숨길 수 없습니다. 이것은 여전히 ​​예외적으로 국제적으로 작동합니다.
closetnoc

@closetnoc : 회사는 정보를 자유롭게 제공하거나 원하지 않을 수도 있습니다. 법원이 소환장을 발부하거나 트레일이 관할권을 유지할 것이라는 것은 확실하지 않습니다. 범죄자의 실명을 모르는 제 3 자와의 비용이 많이 들고 긴 법적 전투에서 자신을 발견 할 수 있습니다. 당신의 철저한 대답으로 판단 할 때, 당신은 의심 할 여지없이 이러한 장애물들을 알고 있지만, David Mulder와 함께해야합니다.
Marcks Thomas

@closetnoc : 예. 호스팅 제공 업체에 정확한 정보가 없습니다. 그리고 선불 신용 카드 또는 다른 선불 카드, 도난 신용 카드, 비트 코인 또는 추적 할 수없는 다른 거래 메커니즘을 사용하여 지불했을 것입니다. 아, 그리고 호스팅 제공 업체는 처음에는 미국에 있지 않을 수도 있습니다. 인터넷이라고합니다.
David Mulder

@DavidMulder 당신의 의견에 감사드립니다. 나는 특히 나쁜 사람을 찾는 방법에 대한 연구 분야의 보안 사업에 종사하고 있습니다. 당신이 말하는 대부분은 중국어, 러시아어 또는 폴란드어 일 것입니다. 이 사람들이 패턴 등을 통해 누구인지를 결정하는 방법은 여전히 ​​있습니다. 그들은 스스로를 멀리합니다. 이것은 구체적으로 내가하는 일입니다. 시도해야합니다. 롤오버 만 ​​할 수는 없습니다. 좋은 인터넷 변호사는 나와 같은 사람들과 정보를 얻는 방법을 알고 있습니다. 하나의 스레드 만 있으면되고 나는 보통 그것을 얻는다. 그러나 진정한 노력이 될 수 있습니다. 그러나 이것은 최악의 시나리오입니다.
closetnoc

27

IP (또는 IP)를 추적하고 원하는대로 미러링 할 수 있도록 완전히 다른 콘텐츠를 반환 할 수 있습니다. 이를 통해 광고 할 수있는 여유 공간을 확보 할 수 있으며 Google에서 높은 게재 순위를 활용할 수 있습니다.

한 번 이것을 사용하여 미러링 된 웹 사이트의 사용자에게 이것이 잘못된 도메인임을 설명했습니다. 간단한 HTTP 리디렉션 헤더를 게시 할 수도 있습니다.


8
나는 실제로 어떤 이유로 든 이것이 재미 있다는 것을 알았습니다. +1
Mehrdad

1
아마 HTTP 헤더를 복제하지는 않지만 자바 스크립트 애니메이션과 재미있는 Marquee 스타일 배너를 '이것은 찢어짐'이라고 말하고 좋은 오래된 애니메이션 GIF를 보낼 수 있습니다. : P
Florian Fida

메타 태그와 자바 스크립트 리디렉션을 사용할 수도 있습니다.이 중 하나는 거의 확실하게 작동합니다. 어쨌든 이것은 안정적인 솔루션이 아니며, 해결책을 찾고 작업을 시작할 때까지만 작동합니다. @Mehrdad, 나는 그것이 해키 때문에 재미 있다고 생각합니다 :)
Igor R

공격자가 언제든지 (공격자) 운동장에 피해자를 허용하여 공격자가 실제로 자신을 공격 할 수 있기 때문에 그것은 재밌습니다. 공격자가 꽤 어리석게 보입니다.
Igor R

Google에서의 높은 위치는 원래 웹 사이트의 높은 위치를 대체하므로 실제로는 "무료 광고"가 아닙니다.
CaptainCodeman

12

조금 늦었지만 웹 사이트를 보호하는 가장 좋은 아이디어는 다음과 같습니다. https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, 숫자로 방어) 내용을 볼 수 있지만 봇은

  • 내용을 버린다
  • 서클에서 크롤링
  • 동작을 멈추다

다른 가능한 아이디어-사용자에게 다음 중 하나도 표시되지 않도록하십시오.

  • GB에 정보를 저장하도록하십시오 (서버에 몇 KB 만있는 동안)
  • 봇이 가짜 링크로 자신의 기억을 홍수로 만들다
  • 가짜 콘텐츠를 보내십시오 (100 % boolsh * t- "Obama 임신", "Spider-Man 5-내년 여름"과 같은 내용을 작성해야합니다. 따라서 도둑이 호스팅 할 수 있습니다 ...)
  • 가짜 파일을 보내십시오 (42.zip과 같이 복사 된 내용을 확인하지 않으면 사용자가 재미있을 것입니다-> AV 도구는 무언가 잘못되었음을 보여줍니다-> 사용자는 p * ss * d입니다 ...)
  • 더 많은 데이터를 기다립니다 (파일 크기 = 1 ~ 10MB, 1 바이트 / 초 이하의 임의 cr * p 전송).

다른 아이디어 :

  • Javascript로 보호되는 링크 (이전, 더 이상 사용하지 않습니까? 그러나 변경되지 않은 상태로 남아있는 경우 사용자에게 잠시 동안 전송됩니다)
  • 동적 쓰레기 (댓글 또는 보이지 않는 항목을 사용하여 봇이 사용자가 볼 수없는 물건을 다운로드하도록합니다.
  • 너무 많은 / 너무 빠르거나 잘못된 방식으로 다운로드되는 IP 주소 차단 (봇은 인간처럼 행동하지 않음 1) 각 페이지의 모든 링크 2) 다음 링크를 선택하는 방식에 패턴이나 혼란이 있습니다.
  • 파일이 서버에서 호스팅되지 않는 경우 Javascript를 사용하여 서버로 리디렉션하십시오 (도난에 대한 도움은 없지만 도둑이 파일을 제거해야하거나 사용자가 페이지에 남아 있지 않음)-콘텐츠 해독과 같은 다른 루틴으로 코드를 작성할 수 있습니다. ))

거미를 차단하는 코드를 조정해야하는 자체 코드가 있습니다. 내가 그런 사람이기 때문에 나는 당신의 아이디어를 조사 할 것입니다! ;-) 좋은 팁!
closetnoc

4
거미와 봇을 차단할 때의 문제점은 아마도 모든 거미를 차단하고 싶지 않다는 것입니다. 예를 들어 사람들이 웹 사이트를 찾을 수있게하려면 Google이 매우 중요합니다. 또한 Google은 귀하의 사이트를 캐시에 저장하므로 웹 크롤러는 실제로 사이트를 크롤링하여 복제 할 필요가 없습니다.
trlkly

고의적으로 그들에게 대안을 줄 것이라면-나는 싸우지 말고 당신에게 유익한 (리디렉션 / 틀린 광고 / 호스트 광고) Igor의 대답 을 선호합니다 .
OJFord

2

이를 Google 프록시 해킹이라고하며 나에게도 일어났습니다.

먼저 첫 번째 것들:

  • 웹 호스트에 DMCA 신고서를 제출하십시오. 사용 이 링크를 올바르게 형성 불만을 생성하고, 호스트의 지원 또는 남용 이메일로 보낼 수 있습니다. 호스트가 미국에 있으면 사이트를 중단해야합니다. 미국에 거주하지 않더라도 어쨌든 사이트를 중단 할 수 있습니다. (나에게 한 번 일어났다.)
  • Google DMCA 도구 를 사용 하여 검색 결과에서 미러링 된 URL을 제거하도록 요청하십시오.
  • Google의 스크레이퍼 보고서 를 사용 하여 Google 알고리즘의 실패를보고하십시오.

그러나 근본적으로 이것은 구글 측의 실패입니다. "품질이 우수한 원본 콘텐츠"를 기반으로 순위를 매기는 것에 대해 그들이 말하는 모든 것에 대해, 이것은 꽤 솔직히 창피한 터무니없는 간단한 반례입니다.

많은 사람들이 이에 대해 불만을 표명하면 결국 구글은 그 행동을 취하고 사이트가 이전에 설립 된 사이트의 정확한 거울인지 확인하기 위해 10 줄의 코드를 작성하게됩니다.

또한 표준 URL을 사용하는 것이이 인스턴스에서 항상 작동하지는 않습니다. 이러한 프록시 스크립트 중 다수는 표준 URL이 미러 사이트를 가리 키도록 변경하여 쓸모 없게 만듭니다.

마지막으로 순위를 손상시키기 위해 가비지 링크로 메인 사이트를 스팸으로 분류했을 수도 있습니다. (이것도 나에게 일어났다.)

검색과 창의적 사고를한다면, 싸울 수있는 방법이 있습니다. 해커의 삶을 더 편하게 만들어주기 때문에 여기에 완전한 목록을 게시하는 것이 좋지 않다고 생각합니다.


1

다른 사람들이 언급했듯이 DMCA 불만 신고 및 저작권 민사 소송이 최선의 선택 일 수 있습니다.

게시하는 새 콘텐츠의 경우 게시하자마자 소셜 미디어 (Twitter, Facebook 등)에서 사이트 업데이트를 알리는 것을 고려할 수 있습니다. 타임 스탬프에 기록 된 타임 스탬프는이를 입증해야 할 경우 먼저 작성한 공정한 지표 일 수 있습니다. Google 웹 마스터 도구를 통해 Googlebot이 사이트를 자주 크롤링하도록 설정을 시행 할 수 있습니다 . 인기있는 검색 엔진이 웹 페이지를 정기적으로 색인화한다고 가정하면 (사이트 운영자 인 site : example.com을 사용하여 확인) 캐시 된 사본의 날짜를 컨텐츠가 게시 된시기의 대략적인 지표로 사용할 수 있습니다.

또한 게시하는 새 컨텐츠의 경우 이미지 내에 워터 마크를 삽입하고 JS 파일 내에 주석을 배치하여 해당 파일의 원래 소유자임을 표시 할 수 있습니다.


컨텐츠를 복사하는 봇이있는 경우 페이지에 저작 정보를 간단히 포함시킬 수 있으므로 복사 된 컨텐츠에는 "Foo, All rights reserved."와 같은 내용이 포함됩니다. 예를 들어 숨길 수 있습니다. 곡예에서는 봇이지만 일반 텍스트로 작동하며 사례가 더 강력 해집니다).
Ángel
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.