Programowanie unicode

6

Jak utworzyć ciąg znaków Unicode za pomocą python3

Użyłem tego: u = unicode(text, 'utf-8') Ale pojawia się błąd w Pythonie 3 (lub ... może po prostu zapomniałem o czymś dołączyć): NameError: global name 'unicode' is not defined Dziękuję Ci.

100 python unicode python-3.x

11

Jak sortować alfabetycznie ciągi znaków Unicode w Pythonie?

Python domyślnie sortuje według wartości bajtów, co oznacza, że é występuje po z i innych równie zabawnych rzeczach. Jaki jest najlepszy sposób sortowania alfabetycznego w Pythonie? Czy jest do tego biblioteka? Nic nie mogłem znaleźć. Najlepiej, jeśli sortowanie powinno mieć obsługę języka, aby rozumieć, że åäö powinno być sortowane po …

98 python sorting unicode internationalization collation

10

HTML dla symbolu pauzy w sterowaniu audio i wideo

Próbuję znaleźć symbol Unicode, aby przycisk wyświetlał symbol pauzy Unicode. Udało mi się znaleźć, że symbol odtwarzania Unicode to, &#9658ale szukam odpowiednika symbolu pauzy Unicode.

97 html unicode special-characters symbols

7

Jak zdekodować sekwencje unikowe Unicode, takie jak „\ u00ed”, do odpowiednich znaków zakodowanych w UTF-8?

Czy w PHP jest funkcja, która może dekodować sekwencje unikowe Unicode, takie jak „ \u00ed” do í”i wszystkie inne podobne wystąpienia? Znalazłem tutaj podobne pytanie , ale wydaje się, że nie działa.

97 php unicode utf-8 escaping decoding

8

Różnica między open i codecs.open w Pythonie

Istnieją dwa sposoby otwarcia pliku tekstowego w Pythonie: f = open(filename) I import codecs f = codecs.open(filename, encoding="utf-8") Kiedy codecs.openlepiej open?

97 python unicode codec

9

UnicodeEncodeError: kodek „latin-1” nie może zakodować znaku

Co może powodować ten błąd, gdy próbuję wstawić obcy znak do bazy danych? >>UnicodeEncodeError: 'latin-1' codec can't encode character u'\u201c' in position 0: ordinal not in range(256) Jak mam to rozwiązać? Dzięki!

96 python mysql unicode pylons

6

Jaki jest pełny zakres znaków chińskich w Unicode?

U + 4E00..U + 9FFF jest częścią pełnego zestawu, ale nie wszystkich

95 unicode cjk

10

Jak porównać znaki Unicode, które „wyglądają podobnie”?

Wpadam w zaskakujący problem. Załadowałem plik tekstowy do mojej aplikacji i mam pewną logikę, która porównuje wartość mającą µ. I zdałem sobie sprawę, że nawet jeśli teksty są takie same, wartość porównania jest fałszywa. Console.WriteLine("μ".Equals("µ")); // returns false Console.WriteLine("µ".Equals("µ")); // return true W dalszej linii wklejany jest znak µ. Jednak …

94 c# .net string unicode string-comparison

3

Jak ustawić emoji przez Unicode w widoku tekstu?

Cześć, chciałbym wykonać następujące czynności: ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); aby uzyskać to w moim widoku tekstu: Tak szczęśliwy 😊 Jak mogę wdrożyć getEmojiByUnicode(unicode)? Jakiego typu powinna unicodebyć zmienna? (String, char, int?) Pamiętaj, że NIE chcę używać Drawables!

94 android unicode textview encode emoji

13

Java jest odpowiednikiem kodu JavaScript komponentu encodeURIC, który generuje identyczne dane wyjściowe?

Eksperymentowałem z różnymi fragmentami kodu Javy, próbując wymyślić coś, co zakoduje ciąg znaków zawierający cudzysłowy, spacje i „egzotyczne” znaki Unicode i wygeneruje dane wyjściowe identyczne z funkcją encodeURIComponent w JavaScript . Mój ciąg testowy na tortury to: „A” B ± ” Jeśli wprowadzę następującą instrukcję JavaScript w Firebug: encodeURIComponent('"A" B …

92 java javascript unicode utf-8

4

Co słychać w tych łączących znaki Unicode i jak możemy je filtrować?

กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ Ostatnio pojawiły się w sekcjach komentarzy na Facebooku. Jak możemy to oczyścić?

91 unicode sanitize combining-marks zalgo

4

Jakie znaki Unicode reprezentują „czas”?

Jakie symbole znaków Unicode określają czas trwania (np. Zegar, klepsydra lub inny zegarek)? Na przykład „★ 3⅔” zamiast „3 godziny i czterdzieści minut”, gdzie ★ jest symbolem czasu.

91 unicode

5

sqlite3.ProgrammingError: Nie możesz używać 8-bitowych bajtów, chyba że używasz text_factory, który może interpretować 8-bitowe bajty

Używając SQLite3 w Pythonie, próbuję przechowywać skompresowaną wersję fragmentu kodu HTML UTF-8. Kod wygląda następująco: ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid, zlib.compress(html))) W którym momencie pojawi się błąd: sqlite3.ProgrammingError: You must not use 8-bit bytestrings …

90 python unicode sqlite zlib

5

Wyświetlanie symboli Unicode w HTML

Chcę po prostu wyświetlić symbole zaznaczenia (✔) i krzyżyka (✘) na stronie HTML, ale pojawia się jako ramka lub goop - - oczywiście ma to związek z kodowaniem. Ustawiłem metatag tak, aby pokazywał utf-8, ale oczywiście czegoś mi brakuje. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> Edycja / rozwiązanie: Na podstawie komentarzy, …

89 html unicode

6

Kodowanie znaków JSON - czy UTF-8 jest dobrze obsługiwany przez przeglądarki, czy powinienem używać numerycznych sekwencji ucieczki?

Piszę usługę sieciową, która używa json do reprezentowania swoich zasobów i trochę utknąłem, myśląc o najlepszym sposobie zakodowania json. Czytając json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) widać, że preferowanym kodowaniem jest utf-8. Ale rfc opisuje również mechanizm ucieczki ciągów do określania znaków. Zakładam, że byłoby to generalnie używane do ucieczki przed …

89 web-services json unicode utf-8

Pytania otagowane jako unicode