TLDR
Pierwotne pytanie było niejasne i czytano, że OP chciał po prostu unikalnej wersji zawartości pliku. To pokazano poniżej. W zaktualizowanej formie pytania OP twierdzi teraz, że po prostu chce wiedzieć, czy zawartość pliku jest unikalna, czy nie.
Sprawdź, czy zawartość pliku jest unikalna, czy nie
Możesz po prostu użyć sort
do sprawdzenia, czy plik jest unikalny lub zawiera takie duplikaty:
$ sort -uC input.txt && echo "unique" || echo "duplicates"
Przykład
Powiedz, że mam te dwa pliki:
zduplikowany plik przykładowy
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
unikalny przykładowy plik
$ cat uniq_input.txt
A
B
C
D
Teraz, gdy analizujemy te pliki, możemy stwierdzić, czy są one unikalne, czy zawierają duplikaty:
test duplikatów pliku
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
przetestuj unikalny plik
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
Oryginalne pytanie (unikalna zawartość pliku)
Można to zrobić za pomocą sort
:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680