Pytania otagowane jako utf-8

UTF-8 to kodowanie znaków, które opisuje każdy punkt kodowy Unicode przy użyciu sekwencji bajtów o długości od jednego do czterech bajtów. Jest wstecznie kompatybilny z ASCII, a jednocześnie obsługuje reprezentację wszystkich punktów kodowych Unicode.


24
Wykryj kodowanie i uczyń wszystko UTF-8
Odczytywanie wielu tekstów z różnych kanałów RSS i wstawianie ich do mojej bazy danych. Oczywiście istnieje kilka różnych kodowań znaków używanych w kanałach, np. UTF-8 i ISO 8859-1. Niestety czasami występują problemy z kodowaniem tekstów. Przykład: „Ss” w „Fußball” powinien wyglądać następująco w mojej bazie danych: „Ÿ”. Jeśli jest to …

5
UTF-8: Ogólne? Kosz? Unicode?
Próbuję dowiedzieć się, jakiego sortowania powinienem używać dla różnych typów danych. 100% treści, które będę przechowywać, jest przesłane przez użytkownika. Rozumiem, że powinienem używać UTF-8 General CI (bez rozróżniania wielkości liter) zamiast UTF-8 Binary. Nie mogę jednak znaleźć wyraźnego rozróżnienia między CI UTF-8 General CI a CI UTF-8 Unicode. Czy …
279 mysql  utf-8  collation 




2
Url dekoduje UTF-8 w Pythonie
Sporo czasu spędziłem w Pythonie. Jak mogę kiedykolwiek zdekodować taki adres URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 do tego w Pythonie 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) zwraca coś bardzo brzydkiego. Nadal nie ma rozwiązania, każda pomoc jest doceniana.

11
UTF-8 bajt [] na String
Załóżmy, że właśnie użyłem a BufferedInputStreamdo odczytania bajtów pliku tekstowego zakodowanego w UTF-8 do tablicy bajtów. Wiem, że mogę użyć poniższej procedury do konwersji bajtów na ciąg, ale czy istnieje bardziej wydajny / mądrzejszy sposób na zrobienie tego niż tylko iteracja po bajtach i konwersja każdego z nich? public String …
243 java  utf-8 

17
„Niepoprawna wartość ciągu” podczas próby wstawienia UTF-8 do MySQL przez JDBC?
Oto jak ustawia się moje połączenie: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); I pojawia się następujący błąd podczas wiązania w celu dodania wiersza do tabeli: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Wstawiam tysiące rekordów i zawsze pojawia się ten błąd, gdy tekst …
228 mysql  jdbc  utf-8  utf8mb4 

16
Czy naprawdę muszę kodować „&” jako „& amp;”?
&W mojej witrynie używam symbolu „ ” z HTML5 i UTF-8 <title>. Google pokazuje ampersand dobrze na swoich SERP, podobnie jak wszystkie przeglądarki w swoich tytułach. http://validator.w3.org daje mi to: i nie rozpoczął odniesienia do znaku. (i prawdopodobnie powinienem uciec jako &.) Czy naprawdę muszę to zrobić &? Nie przejmuję …

4
Zapisz do pliku UTF-8 w Pythonie
Jestem naprawdę mylony z codecs.open function. Kiedy robię: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Daje mi to błąd UnicodeDecodeError: Kodek „ascii” nie może dekodować bajtu 0xef w pozycji 0: porządek poza zakresem (128) Jeśli zrobię: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() To działa dobrze. Pytanie brzmi, dlaczego pierwsza metoda …

8
Problemy z kodowaniem HTML - zamiast „& nbsp;” pojawia się znak „”
Mam starszą aplikację, która zaczyna się źle zachowywać, z jakiegokolwiek powodu nie jestem pewien. Generuje wiązkę HTML, która jest przekształcana w raporty PDF przez ActivePDF. Proces działa w następujący sposób: Wyciągnij szablon HTML z bazy danych z tokenami do zastąpienia (np. „~ CompanyName ~”, „~ CustomerName ~” itp.) Zamień tokeny …

12
PHP DOMDokładanie dokumentu HTML nie poprawnie koduje UTF-8
Próbuję parsować trochę HTML przy użyciu DOMDocument, ale kiedy to robię, nagle tracę kodowanie (przynajmniej tak mi się wydaje). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Wynikiem tego kodu jest to, że otrzymuję mnóstwo znaków, które …

9
Jak przekonwertować ciąg znaków na utf-8 w Pythonie
Mam przeglądarkę, która wysyła znaki utf-8 do mojego serwera Python, ale kiedy pobieram go z ciągu zapytania, kodowanie, które zwraca Python, to ASCII. Jak przekonwertować zwykły ciąg znaków na utf-8? UWAGA: Ciąg przekazywany z sieci jest już zakodowany w UTF-8, chcę tylko, aby Python traktował go jako UTF-8, a nie …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.