Pytania otagowane jako unicode

Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.

6
Problem z kodowaniem Java FileReader
Próbowałem użyć java.io.FileReader do odczytania niektórych plików tekstowych i przekonwertowania ich na ciąg, ale okazało się, że wynik jest nieprawidłowo zakodowany i w ogóle nie jest czytelny. Oto moje środowisko: Windows 2003, kodowanie systemu operacyjnego: CP1252 Java 5.0 Moje pliki są zakodowane w UTF-8 lub CP1252, a niektóre z nich …
132 java  file  unicode  encoding 


7
O co chodzi w znormalizowanym UTF-8?
Projekt ICU (który ma teraz również bibliotekę PHP ) zawiera klasy potrzebne do normalizacji łańcuchów znaków UTF-8, aby ułatwić porównywanie wartości podczas wyszukiwania. Jednak próbuję dowiedzieć się, co to oznacza dla aplikacji. Na przykład w jakich przypadkach chcę „Równoważność kanoniczna” zamiast „Równoważność zgodności” lub odwrotnie?


8
Co to jest kod znaków HTML 8203?
Co oznacza kod znaku (HTML) ​? Znalazłem to w jednym z moich skryptów jQuery i zastanawiałem się, co to jest. Dzięki. Edytować: Oto skrypt, w którym się znajdował (został dodany na końcu, znalazł go w Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); …

3
Ekwiwalenty Unicode dla \ wi \ b w wyrażeniach regularnych Java?
Wiele nowoczesnych implementacji wyrażeń regularnych interpretuje \wskrót klasy znaków jako „dowolną literę, cyfrę lub łączącą interpunkcję” (zwykle: podkreślenie). W ten sposób regex podobne \w+dopasowania słów podoba hello, élève, GOÄ_432lub gefräßig. Niestety Java nie. W Javie \wjest ograniczony do [A-Za-z0-9_]. Utrudnia to między innymi dopasowywanie słów, takich jak te wymienione powyżej. …

7
Python - kodek „ascii” nie może dekodować bajtu
Jestem bardzo zmieszany. Próbowałem zakodować, ale błąd powiedział can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Wiem, jak uniknąć błędu z prefiksem „u” w ciągu. Zastanawiam się tylko, dlaczego …

10
Jak zapobiec renderowaniu znaków Unicode jako emoji w HTML z JavaScript?
Znajduję Unicode dla znaków specjalnych z wyszukiwania FileFormat.Info . Niektóre znaki są renderowane jako klasyczne czarno-białe glify, takie jak ⚠ (znak ostrzegawczy \u26A0lub ⚠). Są lepsze, ponieważ mogę zastosować do nich style CSS (takie jak kolor). Inne renderują się jako nowsze emotikony z kreskówek, takie jak ⌛ (klepsydra \u231Blub ⌛). …
119 javascript  html  css  unicode  emoji 

4
CSS: jak dodać spację przed zawartością elementu?
Żaden z poniższych kodów nie działa: p:before { content: " "; } p:before { content: " "; } Jak dodać spację przed zawartością elementu? Uwaga: muszę pokolorować obramowanie po lewej stronie i margines po lewej stronie do celów semantycznych i użyć spacji jako bezbarwnego marginesu. :)

13
Tworzenie znaku Unicode na podstawie jego numeru
Chcę wyświetlić znak Unicode w Javie. Jeśli to zrobię, działa dobrze: String symbol = "\u2202"; symbol jest równy „∂”. To jest to czego chce. Problem polega na tym, że znam numer Unicode i muszę na jego podstawie stworzyć symbol Unicode. Próbowałem (dla mnie) oczywistej rzeczy: int c = 2202; String …

6
Jak wyprowadzić UTF-8 z Perla?
Próbuję napisać skrypt Perla przy użyciu pragmy „utf8” i otrzymuję nieoczekiwane rezultaty. Używam systemu Mac OS X 10.5 (Leopard) i edytuję za pomocą TextMate. Wszystkie moje ustawienia zarówno mojego edytora, jak i systemu operacyjnego są domyślnie ustawione na zapisywanie plików w formacie utf-8. Jednak kiedy wprowadzam następujące polecenie do pliku …
110 perl  unicode  utf-8 

3
Jak działa „kodowanie o zmiennej szerokości” UTF-8?
Standard Unicode ma wystarczającą liczbę punktów kodowych, że potrzebujesz 4 bajtów, aby je wszystkie zapisać. To właśnie robi kodowanie UTF-32. Jednak kodowanie UTF-8 w jakiś sposób wciska je do znacznie mniejszych przestrzeni, używając czegoś, co nazywa się „kodowaniem o zmiennej szerokości”. W rzeczywistości udaje mu się przedstawić pierwsze 127 znaków …


5
Jaki jest właściwy sposób kodowania znaków Unicode w adresie URL?
Znam niestandardowy schemat% uxxxx, ale nie wydaje się to mądrym wyborem, ponieważ schemat został odrzucony przez W3C. Kilka interesujących przykładów: Charakter serca. Jeśli wpiszę to w przeglądarce: http://www.google.com/search?q=♥ Następnie skopiuj i wklej, widzę ten adres URL http://www.google.com/search?q=%E2%99%A5 co sprawia, że ​​wygląda na to, że Firefox (lub Safari) to robi. urllib.quote_plus(x.encode("latin-1")) …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.