bahamat i Alan Curry mają rację: wynika to ze sposobu, w jaki twoja powłoka buforuje wyjście echo
. W szczególności twoja powłoka jest bash i wydaje jedno write
wywołanie systemowe na linię. Stąd pierwszy fragment powoduje, że 1000000 zapisuje do pliku dyskowego, podczas gdy drugi fragment powoduje, że 1000000 zapisuje do potoku, a sed (w dużej mierze równolegle, jeśli masz wiele procesorów), robi znacznie mniejszą liczbę zapisów do pliku dyskowego ze względu na jego wynik buforowanie
Możesz obserwować, co się dzieje, biegając strace .
$ strace -f -e write bash -c 'echo -n a\ {1..2}\ c$'\'\\n\'' >file'
write(1, "a 1 c\n", 6) = 6
write(1, " a 2 c\n", 7) = 7
$ strace -f -e write bash -c 'echo -n a\ {1..2}\ c$'\'\\n\'' | sed "s/^ //" >file'
Process 28052 attached
Process 28053 attached
Process 28051 suspended
[pid 28052] write(1, "a 1 c\n", 6) = 6
[pid 28052] write(1, " a 2 c\n", 7) = 7
Process 28051 resumed
Process 28052 detached
Process 28051 suspended
[pid 28053] write(1, "a 1 c\na 2 c\n", 12) = 12
Process 28051 resumed
Process 28053 detached
--- SIGCHLD (Child exited) @ 0 (0) ---
Inne powłoki, takie jak ksh buforują dane wyjściowe echo
nawet wtedy, gdy są wielowierszowe, więc nie zobaczysz żadnej różnicy.
$ strace -f -e write ksh -c 'echo -n a\ {1..2}\ c$'\'\\n\'' >file'
write(1, "a 1 c\n a 2 c\n", 13) = 13
$ strace -f -e write ksh -c 'echo -n a\ {1..2}\ c$'\'\\n\'' | sed "s/^ //" >file'
Process 28058 attached
[pid 28058] write(1, "a 1 c\n a 2 c\n", 13) = 13
Process 28058 detached
--- SIGCHLD (Child exited) @ 0 (0) ---
write(1, "a 1 c\na 2 c\n", 12) = 12
Dzięki bash mam podobne stosunki czasowe. Z ksh widzę, że drugi fragment działa wolniej.
ksh$ time echo -n a\ {1..1000000}\ c$'\n' >file
real 0m1.44s
user 0m1.28s
sys 0m0.06s
ksh$ time echo -n a\ {1..1000000}\ c$'\n' | sed "s/^ //" >file
real 0m2.38s
user 0m1.52s
sys 0m0.14s