Pytania otagowane jako unicode

Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.


11
Jak sortować alfabetycznie ciągi znaków Unicode w Pythonie?
Python domyślnie sortuje według wartości bajtów, co oznacza, że ​​é występuje po z i innych równie zabawnych rzeczach. Jaki jest najlepszy sposób sortowania alfabetycznego w Pythonie? Czy jest do tego biblioteka? Nic nie mogłem znaleźć. Najlepiej, jeśli sortowanie powinno mieć obsługę języka, aby rozumieć, że åäö powinno być sortowane po …






10
Jak porównać znaki Unicode, które „wyglądają podobnie”?
Wpadam w zaskakujący problem. Załadowałem plik tekstowy do mojej aplikacji i mam pewną logikę, która porównuje wartość mającą µ. I zdałem sobie sprawę, że nawet jeśli teksty są takie same, wartość porównania jest fałszywa. Console.WriteLine("μ".Equals("µ")); // returns false Console.WriteLine("µ".Equals("µ")); // return true W dalszej linii wklejany jest znak µ. Jednak …

3
Jak ustawić emoji przez Unicode w widoku tekstu?
Cześć, chciałbym wykonać następujące czynności: ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); aby uzyskać to w moim widoku tekstu: Tak szczęśliwy 😊 Jak mogę wdrożyć getEmojiByUnicode(unicode)? Jakiego typu powinna unicodebyć zmienna? (String, char, int?) Pamiętaj, że NIE chcę używać Drawables!

13
Java jest odpowiednikiem kodu JavaScript komponentu encodeURIC, który generuje identyczne dane wyjściowe?
Eksperymentowałem z różnymi fragmentami kodu Javy, próbując wymyślić coś, co zakoduje ciąg znaków zawierający cudzysłowy, spacje i „egzotyczne” znaki Unicode i wygeneruje dane wyjściowe identyczne z funkcją encodeURIComponent w JavaScript . Mój ciąg testowy na tortury to: „A” B ± ” Jeśli wprowadzę następującą instrukcję JavaScript w Firebug: encodeURIComponent('"A" B …

4
Co słychać w tych łączących znaki Unicode i jak możemy je filtrować?
กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ Ostatnio pojawiły się w sekcjach komentarzy na Facebooku. Jak możemy to oczyścić?

4
Jakie znaki Unicode reprezentują „czas”?
Jakie symbole znaków Unicode określają czas trwania (np. Zegar, klepsydra lub inny zegarek)? Na przykład „★ 3⅔” zamiast „3 godziny i czterdzieści minut”, gdzie ★ jest symbolem czasu.
91 unicode 

5
sqlite3.ProgrammingError: Nie możesz używać 8-bitowych bajtów, chyba że używasz text_factory, który może interpretować 8-bitowe bajty
Używając SQLite3 w Pythonie, próbuję przechowywać skompresowaną wersję fragmentu kodu HTML UTF-8. Kod wygląda następująco: ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid, zlib.compress(html))) W którym momencie pojawi się błąd: sqlite3.ProgrammingError: You must not use 8-bit bytestrings …
90 python  unicode  sqlite  zlib 

5
Wyświetlanie symboli Unicode w HTML
Chcę po prostu wyświetlić symbole zaznaczenia (✔) i krzyżyka (✘) na stronie HTML, ale pojawia się jako ramka lub goop - - oczywiście ma to związek z kodowaniem. Ustawiłem metatag tak, aby pokazywał utf-8, ale oczywiście czegoś mi brakuje. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> Edycja / rozwiązanie: Na podstawie komentarzy, …
89 html  unicode 

6
Kodowanie znaków JSON - czy UTF-8 jest dobrze obsługiwany przez przeglądarki, czy powinienem używać numerycznych sekwencji ucieczki?
Piszę usługę sieciową, która używa json do reprezentowania swoich zasobów i trochę utknąłem, myśląc o najlepszym sposobie zakodowania json. Czytając json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) widać, że preferowanym kodowaniem jest utf-8. Ale rfc opisuje również mechanizm ucieczki ciągów do określania znaków. Zakładam, że byłoby to generalnie używane do ucieczki przed …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.