Programowanie unicode

6

Próbowałem użyć java.io.FileReader do odczytania niektórych plików tekstowych i przekonwertowania ich na ciąg, ale okazało się, że wynik jest nieprawidłowo zakodowany i w ogóle nie jest czytelny. Oto moje środowisko: Windows 2003, kodowanie systemu operacyjnego: CP1252 Java 5.0 Moje pliki są zakodowane w UTF-8 lub CP1252, a niektóre z nich …

132 java file unicode encoding

12

Konwersja symboli, liter akcentujących na alfabet angielski

Problem polega na tym, że jak wiesz, na wykresie Unicode są tysiące znaków i chcę zamienić wszystkie podobne znaki na litery, które są w alfabecie angielskim. Na przykład oto kilka konwersji: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... i zobaczyłem, że istnieje ponad 20 wersji litery …

130 java unicode special-characters diacritics

7

O co chodzi w znormalizowanym UTF-8?

Projekt ICU (który ma teraz również bibliotekę PHP ) zawiera klasy potrzebne do normalizacji łańcuchów znaków UTF-8, aby ułatwić porównywanie wartości podczas wyszukiwania. Jednak próbuję dowiedzieć się, co to oznacza dla aplikacji. Na przykład w jakich przypadkach chcę „Równoważność kanoniczna” zamiast „Równoważność zgodności” lub odwrotnie?

130 php c unicode unicode-normalization

5

Jaki byłby znak Unicode dla dużego pocisku w środku znaku?

Chcę czegoś takiego 0x2022 8226 BULLET • Ale większy. Nie mogę ich nawet znaleźć pod adresem http://www.ssec.wisc.edu/~tomw/java/unicode.html Czego powinienem szukać? Kropki? kule?

129 unicode

8

Co to jest kod znaków HTML 8203?

Co oznacza kod znaku (HTML) &#8203;? Znalazłem to w jednym z moich skryptów jQuery i zastanawiałem się, co to jest. Dzięki. Edytować: Oto skrypt, w którym się znajdował (został dodany na końcu, znalazł go w Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); …

127 html unicode character-codes

3

Ekwiwalenty Unicode dla \ wi \ b w wyrażeniach regularnych Java?

Wiele nowoczesnych implementacji wyrażeń regularnych interpretuje \wskrót klasy znaków jako „dowolną literę, cyfrę lub łączącą interpunkcję” (zwykle: podkreślenie). W ten sposób regex podobne \w+dopasowania słów podoba hello, élève, GOÄ_432lub gefräßig. Niestety Java nie. W Javie \wjest ograniczony do [A-Za-z0-9_]. Utrudnia to między innymi dopasowywanie słów, takich jak te wymienione powyżej. …

126 java regex unicode character-properties

7

Python - kodek „ascii” nie może dekodować bajtu

Jestem bardzo zmieszany. Próbowałem zakodować, ale błąd powiedział can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Wiem, jak uniknąć błędu z prefiksem „u” w ciągu. Zastanawiam się tylko, dlaczego …

119 python python-2.7 unicode python-2.x python-unicode

10

Jak zapobiec renderowaniu znaków Unicode jako emoji w HTML z JavaScript?

Znajduję Unicode dla znaków specjalnych z wyszukiwania FileFormat.Info . Niektóre znaki są renderowane jako klasyczne czarno-białe glify, takie jak ⚠ (znak ostrzegawczy \u26A0lub &#x26a0;). Są lepsze, ponieważ mogę zastosować do nich style CSS (takie jak kolor). Inne renderują się jako nowsze emotikony z kreskówek, takie jak ⌛ (klepsydra \u231Blub &#x231b;). …

119 javascript html css unicode emoji

4

CSS: jak dodać spację przed zawartością elementu?

Żaden z poniższych kodów nie działa: p:before { content: " "; } p:before { content: "&nbsp;"; } Jak dodać spację przed zawartością elementu? Uwaga: muszę pokolorować obramowanie po lewej stronie i margines po lewej stronie do celów semantycznych i użyć spacji jako bezbarwnego marginesu. :)

118 css unicode space css-content

13

Tworzenie znaku Unicode na podstawie jego numeru

Chcę wyświetlić znak Unicode w Javie. Jeśli to zrobię, działa dobrze: String symbol = "\u2202"; symbol jest równy „∂”. To jest to czego chce. Problem polega na tym, że znam numer Unicode i muszę na jego podstawie stworzyć symbol Unicode. Próbowałem (dla mnie) oczywistej rzeczy: int c = 2202; String …

114 java string unicode character

6

Jak wyprowadzić UTF-8 z Perla?

Próbuję napisać skrypt Perla przy użyciu pragmy „utf8” i otrzymuję nieoczekiwane rezultaty. Używam systemu Mac OS X 10.5 (Leopard) i edytuję za pomocą TextMate. Wszystkie moje ustawienia zarówno mojego edytora, jak i systemu operacyjnego są domyślnie ustawione na zapisywanie plików w formacie utf-8. Jednak kiedy wprowadzam następujące polecenie do pliku …

110 perl unicode utf-8

3

Jak działa „kodowanie o zmiennej szerokości” UTF-8?

Standard Unicode ma wystarczającą liczbę punktów kodowych, że potrzebujesz 4 bajtów, aby je wszystkie zapisać. To właśnie robi kodowanie UTF-32. Jednak kodowanie UTF-8 w jakiś sposób wciska je do znacznie mniejszych przestrzeni, używając czegoś, co nazywa się „kodowaniem o zmiennej szerokości”. W rzeczywistości udaje mu się przedstawić pierwsze 127 znaków …

110 unicode utf-8 character-encoding multibyte

3

Jakie są najczęściej używane znaki Unicode inne niż BMP? [Zamknięte]

Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 6 lat temu . Popraw to pytanie W twoim doświadczeniu, które znaki Unicode, punkty kodowe, zakresy poza BMP (Basic …

108 unicode cjk codepoint surrogate-pairs astral-plane

5

Jaki jest właściwy sposób kodowania znaków Unicode w adresie URL?

Znam niestandardowy schemat% uxxxx, ale nie wydaje się to mądrym wyborem, ponieważ schemat został odrzucony przez W3C. Kilka interesujących przykładów: Charakter serca. Jeśli wpiszę to w przeglądarce: http://www.google.com/search?q=♥ Następnie skopiuj i wklej, widzę ten adres URL http://www.google.com/search?q=%E2%99%A5 co sprawia, że wygląda na to, że Firefox (lub Safari) to robi. urllib.quote_plus(x.encode("latin-1")) …

107 unicode utf-8 character-encoding urlencode web-standards

9

Przetwarzanie Unicode w C ++

Jaka jest najlepsza praktyka przetwarzania Unicode w C ++?

107 c++ unicode

Pytania otagowane jako unicode