Mam kilka zduplikowanych wiadomości w Maildir mojego serwera IMAP. Jaki jest najlepszy sposób na ich usunięcie?
Niektóre istotne punkty:
- Współdzielony identyfikator wiadomości jest zwykle wystarczającą definicją duplikatu. Mały skrypt, który usuwa wszystkie zduplikowane wiadomości oprócz jednego, działałby.
- Czasami konieczne jest znalezienie duplikatów na podstawie udostępnionych treści wiadomości. Jaka jest rozsądna definicja udostępnionego tutaj? Odpowiednik bitowy? Co z dziwnymi różnicami w zawijaniu wiersza, ucieczce, kodowaniu znaków?
- Czasami istnieje pewna znacząca różnica między „zduplikowanymi” wiadomościami. Jaki jest najlepszy sposób na sprawdzenie różnic w zestawach „zduplikowanych” wiadomości? Różnice?