많은 스팸이 메일 서버의 필터를 통과하고 있습니다. (수백 개의 명백한) 체중 감량 또는 맨 위의 다른 사기 텍스트로 시작하는 비교적 간단한 트릭으로 시작한 다음 프로그래밍 문서에서 더 큰 텍스트 본문 — 또는 Exchange Exchange에서 스크랩 한 텍스트 중 가장 악한 것입니다 . 기껏해야 Spamassassin은 이것을 BAYES_50으로 간주하고 나머지 메시지는 다른 트리거에 부딪치지 않도록 신중하게 구성됩니다. (예를 들어, 헤더는 최소화되고 정확합니다.) 종종 포함 된 발췌문은 메시지 전체가 BAYES_00으로 평가되는 합법적 인 관심사와 밀접하게 일치합니다. 매우 스팸성 토큰은 sysadmin 문제 해결에 대한 수분이 많은 덩어리에 압도되기 때문입니다.
윗부분은 분명히 스팸성 이며 (사실 스팸 메일로 훈련되고 훈련 된 것과 매우 유사합니다.) 그것은 메시지의 상위 25 개 (또는 그 정도) 줄을 득점하고 문제를 크게 해결할 것이라고 생각한 별도의 패스처럼 보입니다. 이것을 할 수있는 방법이 있습니까?
여러 사람들이 사용자 정의 정규식 작성을 제안했습니다. 이것은 끊임없이지는 전투이기 때문에 이것에 들어가고 싶지 않습니다. 베이지안 스팸 분류가 널리 사용되기 전에 사람들이 한 일이며 일반적으로 끔찍했습니다. 인간은 계속 견딜 수 없습니다 . 각 스팸 메시지에 대해 삭제 키를 누르는 것보다 효과적이지 않으며 제게 더 많은 작업을합니다.
베이지안 스팸 필터링이 작동합니다. " 접은 곳 "부분을 분리하고 미끼 / 채프를 제거한 상태로 해당 부분을 분석 하면 이 스팸 에 대해서도 작동합니다 . 문제는 Spamassassin이 어떻게 그렇게 할 수 있습니까?