Programowanie utf-8

14

Odczytywanie i zapisywanie plików w języku Python w standardzie Unicode (UTF-8)

Mam problem z mózgiem w rozumieniu czytania i pisania tekstu do pliku (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) („u'Capit \ xe1n” ”,„ Capit \ xc3 \ xa1n ”) print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() …

329 python unicode utf-8 io

24

Wykryj kodowanie i uczyń wszystko UTF-8

Odczytywanie wielu tekstów z różnych kanałów RSS i wstawianie ich do mojej bazy danych. Oczywiście istnieje kilka różnych kodowań znaków używanych w kanałach, np. UTF-8 i ISO 8859-1. Niestety czasami występują problemy z kodowaniem tekstów. Przykład: „Ss” w „Fußball” powinien wyglądać następująco w mojej bazie danych: „ÂŸ”. Jeśli jest to …

304 php encoding utf-8 character-encoding

5

UTF-8: Ogólne? Kosz? Unicode?

Próbuję dowiedzieć się, jakiego sortowania powinienem używać dla różnych typów danych. 100% treści, które będę przechowywać, jest przesłane przez użytkownika. Rozumiem, że powinienem używać UTF-8 General CI (bez rozróżniania wielkości liter) zamiast UTF-8 Binary. Nie mogę jednak znaleźć wyraźnego rozróżnienia między CI UTF-8 General CI a CI UTF-8 Unicode. Czy …

279 mysql utf-8 collation

11

Jak sprawdzić, czy ciąg znaków jest Unicode, czy ASCI?

Co muszę zrobić w Pythonie, aby dowiedzieć się, które kodowanie ma łańcuch?

271 python unicode encoding utf-8

16

Jak używać UTF-8 we właściwościach zasobów z ResourceBundle

Muszę użyć UTF-8 we właściwościach zasobów za pomocą Java ResourceBundle. Kiedy wprowadzam tekst bezpośrednio do pliku właściwości, wyświetla się on jako mojibake. Moja aplikacja działa na Google App Engine. Czy ktoś może dać mi przykład? Nie mogę dostać tej pracy.

259 java google-app-engine utf-8 internationalization resourcebundle

14

Używanie PowerShell do napisania pliku w UTF-8 bez BOM

Out-File wydaje się wymuszać BOM podczas korzystania z UTF-8: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath Jak mogę napisać plik w UTF-8 bez BOM za pomocą PowerShell?

246 encoding powershell utf-8 byte-order-mark

2

Url dekoduje UTF-8 w Pythonie

Sporo czasu spędziłem w Pythonie. Jak mogę kiedykolwiek zdekodować taki adres URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 do tego w Pythonie 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) zwraca coś bardzo brzydkiego. Nadal nie ma rozwiązania, każda pomoc jest doceniana.

245 python encoding utf-8 urldecode

11

UTF-8 bajt [] na String

Załóżmy, że właśnie użyłem a BufferedInputStreamdo odczytania bajtów pliku tekstowego zakodowanego w UTF-8 do tablicy bajtów. Wiem, że mogę użyć poniższej procedury do konwersji bajtów na ciąg, ale czy istnieje bardziej wydajny / mądrzejszy sposób na zrobienie tego niż tylko iteracja po bajtach i konwersja każdego z nich? public String …

243 java utf-8

17

„Niepoprawna wartość ciągu” podczas próby wstawienia UTF-8 do MySQL przez JDBC?

Oto jak ustawia się moje połączenie: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); I pojawia się następujący błąd podczas wiązania w celu dodania wiersza do tabeli: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Wstawiam tysiące rekordów i zawsze pojawia się ten błąd, gdy tekst …

228 mysql jdbc utf-8 utf8mb4

16

Czy naprawdę muszę kodować „&” jako „& amp;”?

&W mojej witrynie używam symbolu „ ” z HTML5 i UTF-8 <title>. Google pokazuje ampersand dobrze na swoich SERP, podobnie jak wszystkie przeglądarki w swoich tytułach. http://validator.w3.org daje mi to: i nie rozpoczął odniesienia do znaku. (i prawdopodobnie powinienem uciec jako &amp;.) Czy naprawdę muszę to zrobić &amp;? Nie przejmuję …

207 validation html utf-8 character-encoding

4

Zapisz do pliku UTF-8 w Pythonie

Jestem naprawdę mylony z codecs.open function. Kiedy robię: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Daje mi to błąd UnicodeDecodeError: Kodek „ascii” nie może dekodować bajtu 0xef w pozycji 0: porządek poza zakresem (128) Jeśli zrobię: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() To działa dobrze. Pytanie brzmi, dlaczego pierwsza metoda …

204 python utf-8 byte-order-mark

8

Problemy z kodowaniem HTML - zamiast „& nbsp;” pojawia się znak „Â”

Mam starszą aplikację, która zaczyna się źle zachowywać, z jakiegokolwiek powodu nie jestem pewien. Generuje wiązkę HTML, która jest przekształcana w raporty PDF przez ActivePDF. Proces działa w następujący sposób: Wyciągnij szablon HTML z bazy danych z tokenami do zastąpienia (np. „~ CompanyName ~”, „~ CustomerName ~” itp.) Zamień tokeny …

203 html vb.net encoding utf-8 iso-8859-1

12

PHP DOMDokładanie dokumentu HTML nie poprawnie koduje UTF-8

Próbuję parsować trochę HTML przy użyciu DOMDocument, ale kiedy to robię, nagle tracę kodowanie (przynajmniej tak mi się wydaje). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Wynikiem tego kodu jest to, że otrzymuję mnóstwo znaków, które …

194 php utf-8 character-encoding

9

Jak przekonwertować ciąg znaków na utf-8 w Pythonie

Mam przeglądarkę, która wysyła znaki utf-8 do mojego serwera Python, ale kiedy pobieram go z ciągu zapytania, kodowanie, które zwraca Python, to ASCII. Jak przekonwertować zwykły ciąg znaków na utf-8? UWAGA: Ciąg przekazywany z sieci jest już zakodowany w UTF-8, chcę tylko, aby Python traktował go jako UTF-8, a nie …

193 python python-2.7 unicode utf-8

30

Jak mogę wyprowadzić UVF-8 CSV w PHP, który Excel będzie poprawnie czytał?

Mam tę bardzo prostą rzecz, która po prostu wyświetla niektóre pliki w formacie CSV, ale musi to być UTF-8. Otwieram ten plik w TextEdit lub TextMate lub Dreamweaver i wyświetla on poprawnie znaki UTF-8, ale jeśli otworzę go w Excelu, robi to głupio. Oto, co mam na początku mojego dokumentu: …

191 php csv utf-8 byte-order-mark

Pytania otagowane jako utf-8