Jako programista języka C zdziwiłem się, widząc, że wc -c
(która liczy liczbę bajtów) i wc -m
(która liczy liczbę znaków) generują bardzo różne wyniki dla mojego długiego pliku tekstowego. Zawsze mi mówiono, że sizeof(char)
to 1 bajt.
qdii@nomada ~/Documents $ wc -c sentences.csv
102990983 sentences.csv
qdii@nomada ~/Documents $ wc -m sentences.csv
89023123 sentences.csv
Jakieś wyjaśnienie?