Pytania otagowane jako utf-8

UTF-8 to kodowanie znaków, które opisuje każdy punkt kodowy Unicode przy użyciu sekwencji bajtów o długości od jednego do czterech bajtów. Jest wstecznie kompatybilny z ASCII, a jednocześnie obsługuje reprezentację wszystkich punktów kodowych Unicode.


13
Java jest odpowiednikiem kodu JavaScript komponentu encodeURIC, który generuje identyczne dane wyjściowe?
Eksperymentowałem z różnymi fragmentami kodu Javy, próbując wymyślić coś, co zakoduje ciąg znaków zawierający cudzysłowy, spacje i „egzotyczne” znaki Unicode i wygeneruje dane wyjściowe identyczne z funkcją encodeURIComponent w JavaScript . Mój ciąg testowy na tortury to: „A” B ± ” Jeśli wprowadzę następującą instrukcję JavaScript w Firebug: encodeURIComponent('"A" B …

6
Kodowanie znaków JSON - czy UTF-8 jest dobrze obsługiwany przez przeglądarki, czy powinienem używać numerycznych sekwencji ucieczki?
Piszę usługę sieciową, która używa json do reprezentowania swoich zasobów i trochę utknąłem, myśląc o najlepszym sposobie zakodowania json. Czytając json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) widać, że preferowanym kodowaniem jest utf-8. Ale rfc opisuje również mechanizm ucieczki ciągów do określania znaków. Zakładam, że byłoby to generalnie używane do ucieczki przed …

5
Naprawdę dobre, złe przykładowe dane testowe UTF-8 [zamknięte]
Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 3 lata temu . Popraw to pytanie Mamy więc ściągawkę XSS do testowania naszego filtrowania XSS - ale poza przykładową niegroźną stroną nie …
88 unicode  utf-8 



6
Użycie „use utf8;” daje mi „szeroki charakter w druku”
Jeśli uruchomię następujący program w Perlu: perl -e 'use utf8; print "鸡\n";' Otrzymuję to ostrzeżenie: Wide character in print at -e line 1. Jeśli uruchomię ten program w Perlu: perl -e 'print "鸡\n";' Nie dostaję ostrzeżenia. Pomyślałem, że use utf8konieczne jest użycie znaków UTF-8 w skrypcie Perla. Dlaczego to nie …
86 perl  unicode  utf-8 

1
WebClient.DownloadString powoduje zniekształcone znaki z powodu problemów z kodowaniem, ale przeglądarka działa poprawnie
Poniższy kod: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); daje w wyniku zmienną, textktóra zawiera między innymi ciąg „$ κ $ -Przestrzeń Minkowskiego, pole skalarne i kwestia niezmienności Lorentza” Jednak kiedy odwiedzam ten adres URL w przeglądarce Firefox, otrzymuję $ κ $ -Przestrzeń Minkowskiego, pole skalarne i kwestia niezmienniczości Lorentza co jest …


3
Jak usunąć znaki inne niż UTF-8 z pliku tekstowego
Mam kilka plików arabskich, angielskich i rosyjskich zakodowanych w utf-8. Próbując przetworzyć te pliki za pomocą skryptu Perla, pojawia się ten błąd: Malformed UTF-8 character (fatal) Ręczne sprawdzanie zawartości tych plików znalazłem w nich dziwne znaki. Teraz szukam sposobu, aby automatycznie usunąć te znaki z plików. Czy w ogóle można …

5
Jak używać sortowania UTF-8 w bazie danych SQL Server?
Przeprowadziłem migrację bazy danych z mysql do SQL Server (polityka), oryginalnej bazy danych mysql używającej UTF8. Teraz przeczytałem /dba/7346/sql-server-2005-2008-utf-8-collation-charset, że SQL Server 2008 nie obsługuje utf8, czy to żart? SQL Server obsługuje wiele baz danych, w większości zakodowanych w alfabecie łacińskim. Ponieważ migrowana baza danych jest przeznaczona do publikowania w …
84 sql-server  utf-8 

7
Jak napisać UTF-8 w pliku CSV
Próbuję utworzyć plik tekstowy w formacie csv z PyQt4 QTableWidget. Chcę napisać tekst z kodowaniem UTF-8, ponieważ zawiera znaki specjalne. Używam następującego kodu: import codecs ... myfile = codecs.open(filename, 'w','utf-8') ... f = result.table.item(i,c).text() myfile.write(f+";") Działa, dopóki komórka nie zawiera znaku specjalnego. Próbowałem też z myfile = open(filename, 'w') ... …
84 python  csv  encoding  utf-8 

6
Ile znaków można odwzorować za pomocą Unicode?
Proszę o policzenie wszystkich możliwych prawidłowych kombinacji w Unicode z wyjaśnieniem. Wiem, że znak można zakodować jako 1, 2, 3 lub 4 bajty. Nie rozumiem też, dlaczego bajty kontynuacji mają ograniczenia, mimo że początkowy bajt tego znaku określa, jak długo powinien być.
83 unicode  utf-8  utf 


3
Jak wysłać wiadomość e-mail UTF-8?
Kiedy wysyłam e-mail, e-mail nie zawiera znaków innych niż angielski. Pokazuje jak poniżej: ä½ ™ ç ”Ÿä» ä » Może właściwie wiedzieć, co to powoduje? Nawet ja próbowałem dodać w skrypcie typ zawartości i kodowanie, ale nadal pokazuje to samo. użyłem Mail::Factory("mail");
83 php  email  utf-8 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.