Czy jest jakieś polecenie Linuksa, którego można użyć do próbkowania podzbioru pliku? Na przykład plik zawiera milion wierszy, a my chcemy losowo pobrać próbkę tylko tysiąca wierszy z tego pliku.
Dla losowych mam na myśli to, że każda linia ma takie samo prawdopodobieństwo wyboru i żadna z wybranych linii nie jest powtarzalna.
head
i tail
może wybrać podzbiór pliku, ale nie losowo. Wiem, że zawsze mogę napisać skrypt Pythona, ale zastanawiam się, czy istnieje takie polecenie.