스팸봇은 어떻게 작동합니까?


43

포럼 스팸봇에 의해 많은 인기를 얻고있는 포럼이 있습니다. 물론 무언가를 물리 치는 가장 좋은 방법은 적을 아는 것입니다. 나중에 해당 스팸봇을 물리 치는 것에 대해 걱정할 것이지만 지금은 해당 스팸봇에 대해 더 알고 싶습니다. 주위를 둘러 보면서 주제에 대한 철저한 정보가 부족하거나 Google 검색 결과를 개선하기 위해 올바른 검색어를 입력 할 수 없다는 점에 놀랐습니다.

스팸봇에 대해 배우는 데 관심이 있습니다. 다른 포럼에서 질문 한 결과 "스팸봇은 항상 귀하의 사이트에 등록하는 사용자입니다."

  • 포럼 스팸봇은 어떻게 작동합니까?
  • '새 사용자 등록'페이지는 어떻게 찾습니까? (특히 일부 포럼에는 www.forum.com/register.html과 같은 전용 URL이 없지만 대신 쿼리 문자열이나 URL 표시 줄에 보이지 않는 다른 방법을 사용하기 때문에 놀랐습니다)
  • 각 '새 사용자 등록'필드에 무엇을 입력해야하는지 어떻게 알 수 있습니까?
  • 스팸이나 데이터를 입력 할 수있는 페이지가 무엇인지 아닌지를 어떻게 판단합니까?
  • 그들은 심지어이 페이지를 전혀 보지 않습니까?
  • .. 그렇지 않으면 서버와 직접 통신한다고 가정합니다. 어떻게 가능합니까? 그들은 그걸 어떻게 햇어?
  • 포럼 스팸봇이 보안 문자를 손상시킬 수 있습니까? 그들은 논리적 인 질문을 어떻게 해결할 수 있습니까? 수학 문제?
  • 클라이언트 측 안티 봇 유효성 검사 스크립트를 리버스 엔지니어링합니까? 서버 측 스크립트?
  • 어떤 기술이 여전히 유효하지 않습니까?
  • 스팸봇은 어디에서 왔습니까? 컴퓨터 뒤에 앉은 사람이 봇이 사이트를 방문한 후 사이트를 파괴하는 것을 지켜보고 있습니까? 아니면 그들은 단순히 어떻게 든 인터넷에 '릴리스'할 때 소리를 지르고 있습니까? 스팸봇이 감염된 컴퓨터에 의해 '실행'됩니까? 그들은 스스로 복제합니까?
  • 기타

답변:


48

'새 사용자 등록'페이지는 어떻게 찾습니까? (특히 일부 포럼에는 www.forum.com/register.html과 같은 전용 URL이 없지만 대신 쿼리 문자열이나 URL 표시 줄에 보이지 않는 다른 방법을 사용하기 때문에 놀랐습니다)

그들은 다음을 통해 새로운 사이트를 찾습니다.

  • 알려진 소프트웨어의 서명을 크롤링하고 찾습니다. 일반적으로 이것은 저작권 또는 메타 태그와 같은 텍스트 스 니펫이지만 일관된 식별자 일 수 있습니다. 이것은 일반적으로 블로그 및 포럼 소프트웨어에 적용됩니다.
  • 수동 포함. 세계 여러 지역에서 노동력이 저렴한 인간은 쉽게 이용할 수있는 알려진 소프트웨어 나 양식을 찾아 데이터베이스에 추가합니다. 이것은 일반적으로 사용자 정의 등록 및 연락 양식에 적용됩니다.
  • 그들은리스트를 산다. 스패머가 전자 메일 주소를 판매하는 것처럼 알려진 취약하거나 선호하는 대상 사이트 목록도 판매됩니다.

각 '새 사용자 등록'필드에 무엇을 입력해야하는지 어떻게 알 수 있습니까?

필드 이름을 가이드로 사용하여 각 필드에 입력 할 내용을 알고 있습니다. 이메일 주소 필드 이름의 99.99 %가 "이메일"또는 "이메일"이라는 단어가 포함 된 이름입니다. 이 필드가 아마도 이메일 주소를위한 것임을 알기 위해 로켓 과학자 일 필요는 없습니다. 이름, 로그인 ID, 주소 등의 경우 동일한 원리로 작동합니다.

스팸이나 데이터를 입력 할 수있는 페이지가 무엇인지 아닌지를 어떻게 판단합니까?

그들은 상관하지 않습니다. 자동화 된 도구는 짧은 시간에 많은 비용을 거의 들이지 않고 시험해 볼 수 있으므로 가능한 모든 양식을 시험해 보는 것은 쉬운 일이 아닙니다. 인간의 노동이 관여 할 때, 그들은 "스크립트 아동"이 될 수 있고, 양식이 잠재적으로 취약하다는 것을 나타내는 어떤 종류의 응답을 받는지 알아볼 수있는 명백한 것들을 시도합니다. 기본적으로 모든 형식은 사용자 입력을 허용하는 모든 페이지와 마찬가지로 잠재적 인 대상입니다.

포럼 스팸봇은 어떻게 작동합니까?

그들은 심지어이 페이지를 전혀 보지 않습니까? .. 그렇지 않으면 서버와 직접 통신한다고 가정합니다. 어떻게 가능합니까? 그들은 그걸 어떻게 햇어?

스팸봇은 어디에서 왔습니까? 컴퓨터 뒤에 앉은 사람이 봇이 사이트를 방문한 후 사이트를 파괴하는 것을 지켜보고 있습니까? 아니면 그들은 단순히 어떻게 든 인터넷에 '릴리스'할 때 소리를 지르고 있습니까? 스팸봇이 감염된 컴퓨터에 의해 '실행'됩니까? 그들은 스스로 복제합니까?

모두 자동화되었습니다. xrumer 와 같은 도구 는 제작 및 판매되며 알려진 취약점이있는 소프트웨어를 악용 할 수 있습니다. 누구나 구매할 수 있으며 설치 후에는 다소 불이 나고 잊어 버립니다. 목록의 모든 포럼으로 이동하여 최대한 활용하기 위해 스팸을 시도합니다. 무차별 적 인 힘으로 인해 스패머에게는 성공하고 가치가 있습니다. 그래서 그들은 절대 멈추지 않습니다. 작동하기 위해서는 손가락을 거의 들지 않아야합니다.

포럼 스팸봇이 보안 문자를 손상시킬 수 있습니까? 그들은 논리적 인 질문을 어떻게 해결할 수 있습니까? 수학 문제?

예, 그러나 항상 그런 것은 아닙니다. 구현 방법에 따라 다릅니다. 그러나 대기업이 제공 한 보안 문자를 포함하여 많은 보안 문자가 이겼으며 사실상 쓸모가 없습니다. 그렇기 때문에 여러 가지 보호 방법이 필요합니다. 그럼에도 불구하고 인간은 일반적으로 모든 시스템을 이길 수 있습니다.

어떤 기술이 여전히 유효하지 않습니까?

이전 답변에서 : 당신은 다음을 포함하여 여러 가지 일을 할 수 있습니다 (그리고 더 많은 일을해야합니다).

1) 봇만 볼 수있는 가짜 필드를 놓는 것. 그런 다음 해당 필드가 나머지 양식과 함께 제출되면 무시하고 원하는 경우 금지 할 수 있습니다. 숨겨진 링크를 따르는 나쁜 봇을 잡을 수도 있습니다 .

2) reCAPTCHA 와 같은 CAPATCHA를 사용하십시오.

3) 사용자가 5 + 3과 같은 질문에 대답하도록 요구하는 필드를 사용하십시오. 모든 사람이 대답 할 수 있지만 봇은 필드 이름을 기반으로 필드를 자동으로 채우기 때문에 수행 할 작업을 알 수 없습니다. 따라서 해당 필드가 잘못되었거나 누락 된 경우 제출이 거부됩니다.

4) 토큰을 사용하여 세션에 넣고 양식에 추가하십시오. 토큰이 양식과 함께 제출되지 않거나 일치하지 않으면 자동화되어 무시 될 수 있습니다.

5) 동일한 IP 주소에서 반복 제출을 찾습니다. 양식이 너무 많은 요청을받지 않아야하지만 갑자기 봇에 의해 공격을 받고있는 경우 IP 주소를 일시적으로 차단하는 것을 고려해야합니다.

6) Akismet을 사용하십시오 . 스팸 식별에 탁월합니다.


5
철저한 답변을 위해 +1. 스팸 문제가 발생하여 숨겨진 양식 요소를 구현하여 "이메일"/ "메일"이라고하고 실제 이메일 주소는 "주소"라고했습니다. 더 이상 스팸이 없습니다!
mar10

1
트롤을 다루는 방법에 대한 좋은 글 ( spambot도 마찬가지입니다) : codinghorror.com/blog/2011/06/suspension-ban-or-hellban.html .
ercpe

보안 문자의 경우 패배에 사용하는 도구에 따라 다릅니다. 때때로 (항상 그런 것은 아님) 보안 문자를 통과시키는 소프트웨어 프로그램이 있으며, 보안 문자를 해결하기 위해 값싼 노동력을 사용하는 서비스가 있으며 성공률이 더 높습니다.
ub3rst4r

11

포럼 스팸봇은 어떻게 작동합니까?

재능있는 (악한 경우) 프로그래머가 작성합니다. 아마도 사람들이 쓰는 것처럼 다양한 유형의 스팸봇이있을 수 있지만 불행히도 관리자를 위해 인생을 망치기 위해 작업을 공유하고 판매하는 스팸봇 작성자는 거의 없습니다 ...

널리 사용되는 포럼 스팸 응용 프로그램 중 하나는 "xrumer"입니다.

이것이 귀하의 모든 질문에 대한 답변은 아니라는 것을 알고 있지만, 봇이 수행 할 수없는 모든 것 (복잡한 비 정적 논리 문제 해결)은 저임금 근로자가 해외에서 수행 할 수 있다고 언급합니다. 스팸은 다른 비즈니스와 매우 유사한 비즈니스이며 스팸 메시지를 퍼뜨리는 데 많은 노력을 기울이지 않습니다.


4
육류 공장에서 젖소가 가공되는 것을 본 것 같습니다. 그러나 매우 유익합니다.
rlb.usa

크리스마스 이브가되었다는 재미있는 비디오. 날짜는 12-25-2006 12:15 am ... :-)
실수로

Ack! 그 재능이없는 것 같다 ... 그 프로그램은 나에게 FriendBlaster를 떠올리게한다. (우리는 직장에서 사용했었다. 저자가 프로그램에 투입 한 시간과 노력을 의심하지 않습니다. 그러나 솔직히 수행중인 것은 구현하기가 어렵지 않고 FriendBlaster의 경우에는 제대로 구현되지 않습니다. 릴리스보다 몇 주 내에 익스플로잇을 개발하고 DRM 체계를 파괴하는 해커와 보안 연구원이 훨씬 더 인상적입니다.
Lèse majesté

2

WordPress 용 스팸 방지 플러그인을 만들었습니다 . Captcha 또는 다른 어떤 것도 없이 스팸을 아주 잘 차단합니다 .

작동 방식 : 주석 양식에 두 개의 추가 필드가 추가됩니다. 첫 번째는 현재 연도에 대한 질문입니다. 두 번째는 비워 두어야합니다. 사용자가 사이트를 방문하는 경우 첫 번째 필드보다 자바 스크립트로 자동 응답되며 두 번째 필드는 비워두고 두 필드는 모두 숨겨져 보이지 않습니다. 스패머가 주석 양식을 제출하려고하면 첫 번째 필드에 대한 답변으로 실수를하거나 빈 필드를 제출하려고 시도하여 스팸 주석이 거부됩니다. 사용자가 봇이 아님을 증명하기 위해 보안 문자 나 다른 것을 입력 할 필요는 없습니다. 모든 것이 자바 스크립트로 작성됩니다.

플러그인을 다운로드하고 코드를 사용하여 사이트의 스팸 문제를 해결할 수 있습니다.


1
따라서 사용자가 등록하려면 자바 스크립트가 필요합니까? 접근성의 상실입니다. 그렇죠?
Augustin Riedinger

자바 스크립트가 비활성화 된 @AugustinRiedinger 안티 스팸 플러그인은 간단한 captha 접근 방식처럼 작동합니다. 자바 스크립트가 비활성화 된 사용자의 약 2 % 미만입니다.
webvitaly

이 경우 보안 문자를 표시한다는 의미입니까? 사용자가 거의 없다는 것을 알고 있지만 모범 사례 측면에서 생각하고있었습니다. 그래도 흥미로운 것을 읽으십시오 .
Augustin Riedinger

@ AugustinRiedinger 예, 사용자가 자바 스크립트를 비활성화 한 경우 현재 연도에 대한 보안 문자와 같은 질문을 표시합니다.
webvitaly

0

그들을 물리 치려고 할 때, 내가 명심해야 할 것은 그들의 목적은 일반적으로 블랙 햇 SEO 혜택을 위해 가능한 한 많은 웹 사이트에 대한 링크를 게시하는 것입니다.

그들은 귀하의 사이트가 아닌 액세스 권한이있는 사이트의 양에 관심을 갖습니다. 단지 당신의 사이트 만 스팸으로 만들고 싶은 누군가는 로봇을 사용하지 않고 간단하게 가입 할 수 있습니다.

따라서, 잘 작성된 맞춤형 테스트 (예 : 포럼 구성원이 답을 알 수있는 질문)가 로봇이 현명 할 가능성이있는 사전 작성된 테스트보다 거의 항상 로봇에 대해 더 효과적 일 것이라고 확신합니다. 에.

예를 들어, 로봇이 Recaptcha를 크랙하면 수백만 개의 양식에 스팸으로 액세스 할 수 있습니다. 맞춤 테스트를 통과 한 경우 하나의 웹 사이트에만 액세스 할 수 있으므로 자동화 된 스팸봇이이를 방해하지 않습니다.

https://www.projecthoneypot.org 는 유용한 데이터를 제공 할 수 있습니다 (예 : 키워드 및 ips 차단)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.