Dane binarne i tekstowe nie są rozdzielane: są po prostu danymi . To zależy od interpretacji, która czyni je jedną lub drugą. Jeśli otworzysz dane binarne (takie jak plik obrazu) w edytorze tekstu, wiele z nich nie będzie miało sensu, ponieważ nie pasuje do wybranej interpretacji (jako tekstu).
To, co nazywasz tekstem, jest podzbiorem możliwej zawartości pliku: Dane, które w danym zestawie znaków tłumaczą się na czytelne znaki.
Na przykład w ASCII widać, że spośród 128 „dozwolonych” wartości, tylko około połowa to litery i cyfry, 30 to znaki interpunkcyjne, a reszta to znaki kontrolne . Ta ostatnia grupa po prostu nie jest często używana w plikach tekstowych i nie mają naprawdę dobrej reprezentacji tekstowej. Niektóre z nich to znaki tabulacji i nowego wiersza , w których edytory tekstu muszą już wykazać się kreatywnością w ich wyświetlaniu.
Niektóre edytory tekstu mają opcje jawnego wyświetlania białych znaków. Następnie zostaną narysowane jako znaki, oprócz zwykłego formatowania (co jest również interpretacją tych znaków).
Czysty ASCII interpretuje tylko 128 wartości. Każda z bajtów używanych do przechowywania tych informacji ma 256 możliwych wartości, więc połowa możliwych wartości nie jest dozwolona w ASCII. Są one używane np. W zestawach znaków specyficznych dla regionu, takich jak Latin 1, ale w ASCII są niezdefiniowane. Nie mają użytecznej reprezentacji w przeglądarce tekstu, która obsługuje tylko ASCII.
Dane binarne zwykle nie są interpretowane jako tekst. Tak więc w tych plikach powszechnie można znaleźć wszystkie możliwe wartości bajtów . Wszystko inne byłoby marnotrawstwem (i dlatego bardzo dobrze kompresujesz tekst). Formaty plików graficznych są skomplikowane i zwykle nie wyświetla się ich jako tekstu, więc nie muszą być czytelne.
Ponieważ nie ma wspólnej interpretacji danych (zestawu znaków), która odwzorowuje wszystkie możliwe wartości na czytelne znaki, a ponieważ i tak nie miałoby to większego sensu (ponieważ nie jest to czytelny tekst), główne części są wyświetlane jako bełkot.
Edytor szesnastkowy wybiera inną reprezentację danych: wyświetla każdy bajt jako dwie cyfry szesnastkowe . To tylko inna reprezentacja i jedna z zestawem znaków czytelnym dla człowieka: wszystkie 256 możliwych wartości bajtów może być reprezentowanych jako dwie cyfry szesnastkowe.
Ponieważ istnieje łatwe odwzorowanie danych binarnych na szesnastkowe i odwrotnie (4 cyfry binarne na / z jednej cyfry szesnastkowej), a dane binarne zawierają bardzo mało informacji na cyfrę, szesnastkowy jest ogólnie preferowanym sposobem odczytywania danych binarnych przez ludzi, chyba że istnieją konkretne powody, dla których wolę inną reprezentację.
Niektóre edytory tekstu mogą mieć tryb edytora szesnastkowego, a niektóre heurystyczne, które próbują ustalić, czy plik jest tekstowy czy binarny, i automatycznie wybrać jeden tryb lub drugi. Ale może być trudno to naprawić i nie jest to konkretna właściwość pliku, która mówi, czy jest to jeden czy drugi rodzaj.
Niektórzy klienci FTP proszą o określenie, które zakończenia plików mają być używane dla danych tekstowych . Programy te zmienią następnie zawartość pliku, aby pasowała do systemu operacyjnego komputera, do którego jesteś podłączony, ponieważ Windows używa innej sekwencji znaków kończących wiersz ( CR/LF
) niż Linux i Unix (w tym Mac OS X; LF
).