Unicode ma być uniwersalnym zestawem znaków do opisu wszystkich znaków wymaganych w tekście pisanym, obejmującym wszystkie systemy pisma, symbole techniczne i znaki interpunkcyjne.
Osobiście uważam, że czytanie kodu pełnego identyfikatorów Unicode jest mylące. Moim zdaniem zapobiega to również łatwemu utrzymywaniu kodu. Nie wspominając już o wysiłku włożonym przez autorów różnych tłumaczy w wdrożenie takiego wsparcia. Ciągle zauważam również brak (lub obecność) obsługi identyfikatorów Unicode na listach (nie) zalet różnych implementacji językowych (tak jakby …
Szukałem wydajnej implementacji String trie. Przeważnie znalazłem taki kod: Referencyjna implementacja w Javie (na wikipedię) Nie podobają mi się te wdrożenia z dwóch powodów: Obsługują tylko 256 znaków ASCII. Muszę obejmować takie rzeczy jak cyrylica. Są wyjątkowo nieefektywne pod względem pamięci. Każdy węzeł zawiera tablicę 256 odniesień, czyli 4096 bajtów …
Coś, co od dawna mnie myliło, to fakt, że tak wiele programów używa terminów „charset” i „kodowanie” jako synonimów. Kiedy ludzie odnoszą się do „kodowania” unicode, zawsze mają na myśli zestaw reguł do reprezentowania znaków unicode jako ciąg bajtów - jak ASCII lub UTF-8. Wydaje się to rozsądne i intuicyjne; …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.