Wiele naprawdę wczesnych prac wykonano przy użyciu 5-bitowych kodów baudot, ale te szybko stały się dość ograniczające (tylko 32 możliwe znaki, więc w zasadzie tylko wielkie litery i kilka znaków interpunkcyjnych, ale za mało „miejsca” na cyfry) .
Stamtąd sporo maszyn trafiło do postaci 6-bitowych. To wciąż było dość nieodpowiednie - jeśli chciałeś wielkich i małych (angielskich) liter i cyfr, pozostały tylko dwa znaki do interpunkcji, więc większość wciąż miała tylko jedną literę w zestawie znaków.
ASCII zdefiniował 7-bitowy zestaw znaków. Przez długi czas był on „wystarczająco dobry” do wielu zastosowań i stał się podstawą większości nowszych zestawów znaków (ISO 646, ISO 8859, Unicode, ISO 10646 itp.)
Komputery binarne motywują projektantów do tworzenia rozmiarów potęgi dwóch. Ponieważ „standardowy” zestaw znaków i tak wymagał 7 bitów, dodanie kolejnego bitu nie wymagało większego wysiłku, aby uzyskać moc 2 (i do tego czasu pamięć masowa stawała się na tyle tańsza, że „marnowała” trochę dla większości postaci był również bardziej do przyjęcia).
Od tego czasu zestawy znaków zostały przeniesione do 16 i 32 bitów, ale większość komputerów głównego nurtu jest w dużej mierze oparta na oryginalnym komputerze IBM. Z drugiej strony, wystarczająca część rynku jest wystarczająco zadowolona z 8-bitowych postaci, że nawet jeśli komputer nie osiągnąłby obecnego poziomu dominacji, nie jestem pewien, czy wszyscy i tak zrobiliby wszystko z większymi postaciami.
Powinienem również dodać, że rynek dość się zmienił. Na obecnym rynku rozmiar znaków jest mniej definiowany przez sprzęt niż oprogramowanie. Windows, Java itp. Już dawno przeniesiono do 16-bitowych znaków.
Obecnie przeszkodą we wspieraniu znaków 16- lub 32-bitowych są tylko minimalne trudności związane z samą postacią 16- lub 32-bitową, a przede wszystkim trudności z obsługą i18n w ogóle. W ASCII (na przykład) wykrycie, czy litera jest wielka czy mała, lub konwersja między nimi, jest niezwykle trywialne. W pełnej wersji Unicode / ISO 10646 jest on zasadniczo nie do opisania złożony (do tego stopnia, że standardy nawet nie próbują - podają tabele, a nie opisy). Następnie dodajesz fakt, że w przypadku niektórych języków / zestawów znaków nawet podstawowa koncepcja wielkich / małych liter nie ma zastosowania. Następnie dodajesz fakt, że nawet wyświetlanie znaków w niektórych z nich jest o wiele bardziej złożone.
To wszystko jest wystarczająco złożone, że zdecydowana większość oprogramowania nawet nie próbuje. Sytuacja powoli się poprawia, ale powoli pojawia się słowo operacyjne.