Mam duży i stale rosnący zestaw plików tekstowych, które są dość małe (mniej niż 100 bajtów). Chcę różnicować każdą możliwą parę plików i notować, które są duplikatami. Mógłbym napisać skrypt Pythona, aby to zrobić, ale zastanawiam się, czy istnieje narzędzie wiersza polecenia systemu Linux (a może prosta kombinacja narzędzi), które by to zrobiło?
Aktualizacja (w odpowiedzi na komentarz mfinni ): Pliki znajdują się w jednym katalogu, więc wszystkie mają różne nazwy plików. (Ale wszystkie mają wspólne rozszerzenie nazwy pliku, co ułatwia wybranie ich wszystkich za pomocą symboli wieloznacznych).