Maildir에서 중복 메시지 제거


10

IMAP 서버의 Maildir에 여러 개의 중복 메시지가 있습니다. 그들을 제거하는 가장 좋은 방법은 무엇입니까?

몇 가지 관련 사항 :

  • 공유 Message-ID는 일반적으로 충분한 중복 정의입니다. 중복 메시지 중 하나를 제외하고 모두 제거하는 작은 스크립트가 작동합니다.
  • 공유 메시지 본문을 기반으로 중복을 찾아야하는 경우가 있습니다. 여기 공유의 합리적인 정의는 무엇입니까? 비트 단위? 줄 바꿈, 이스케이프, 문자 인코딩의 이상한 차이점은 무엇입니까?
  • 때때로 '중복'메시지 간에는 의미있는 차이가 있습니다. '중복'메시지 세트의 차이점을 검토하는 가장 좋은 방법은 무엇입니까? 차이?

답변:



3

리눅스의 일반 파일의 경우 fdupes utils를 사용하여 중복 파일을 제거합니다. Maildir 메시지에서도 작동한다는 것을 알았습니다.


1
fdupes 는 정확한 복제본에 대해서만 작동하는 것처럼 보이지만 OP는 (암시 적으로) 더 복잡한 복제 패턴을 요구합니다. .forward약간 다른 헤더로 인해 메시지가 두 번 전달 되므로 메시지 자체가 복제되는 동안 두 사본이 포함 된 두 파일은 그렇지 않을 수 있습니다.
tripleee

0

Gnome의 Evolution (그래픽 메일 사용자 에이전트)에는 중복 메일을 제거하는 기능이 내장되어 있습니다. 이 도움말 페이지 에 설명 된대로 다음과 같이 요약됩니다.

  1. 의심스러운 메시지 (또는 모든 메시지)를 선택하십시오.
  2. 메뉴 메시지로 이동하여 중복 메시지 제거를 선택 하십시오 .

Voilà.

PS Evolution은 로컬 (MailDir, MH, Mbox) 또는 IMAP을 통해 메시지에 액세스 할 수 있습니다.


0

오늘 내가 찾은 것은 Kevin Deldycke의 maildir-deduplicate 입니다.

  • X-MIMETrack기본적으로 헤더를 무시하고 SHA224다이제스트를 사용하여 헤더를 비교합니다 .
  • 확인을 요구하지 않고 중복을 자동으로 삭제합니다. 그러나 어떤 복제본이 삭제 될지를 미리 볼 수있는 드라 이런 모드가 있습니다.

누군가 그의 IMAP 도구의 일부인 Rick Sanders의 delIMAPdups.pl 에서 멋진 것을 만들 수있을 것 입니다.


maildir-deduplicate 새 위치로 이동 하여 링크를 업데이트했습니다. 그러나 귀하의 정보가 최신이 아닙니다.
Adam Spiers

오래된 정보를 더 이상 오도하는 일이 없도록 업데이트했습니다.
Adam Spiers 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.