Mam duże pliki 3-kolumnowe (~ 10 000 linii) i chciałbym usunąć linie, gdy zawartość trzeciej kolumny tej linii pojawi się w trzeciej kolumnie innej linii. Rozmiary plików sprawiają, że sortowanie jest trochę kłopotliwe i nie mogę użyć czegoś takiego jak poniższy kod, ponieważ całe linie nie są identyczne; tylko treść kolumny 3.
awk '!seen[$0]++' filename
-u
co usunie tylko duplikaty linii , a nie duplikaty kluczy ... ale się mylę.