UTF-8 to kodowanie znaków, które opisuje każdy punkt kodowy Unicode przy użyciu sekwencji bajtów o długości od jednego do czterech bajtów. Jest wstecznie kompatybilny z ASCII, a jednocześnie obsługuje reprezentację wszystkich punktów kodowych Unicode.
Mam problem z mózgiem w rozumieniu czytania i pisania tekstu do pliku (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) („u'Capit \ xe1n” ”,„ Capit \ xc3 \ xa1n ”) print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() …
Odczytywanie wielu tekstów z różnych kanałów RSS i wstawianie ich do mojej bazy danych. Oczywiście istnieje kilka różnych kodowań znaków używanych w kanałach, np. UTF-8 i ISO 8859-1. Niestety czasami występują problemy z kodowaniem tekstów. Przykład: „Ss” w „Fußball” powinien wyglądać następująco w mojej bazie danych: „Ÿ”. Jeśli jest to …
Próbuję dowiedzieć się, jakiego sortowania powinienem używać dla różnych typów danych. 100% treści, które będę przechowywać, jest przesłane przez użytkownika. Rozumiem, że powinienem używać UTF-8 General CI (bez rozróżniania wielkości liter) zamiast UTF-8 Binary. Nie mogę jednak znaleźć wyraźnego rozróżnienia między CI UTF-8 General CI a CI UTF-8 Unicode. Czy …
Muszę użyć UTF-8 we właściwościach zasobów za pomocą Java ResourceBundle. Kiedy wprowadzam tekst bezpośrednio do pliku właściwości, wyświetla się on jako mojibake. Moja aplikacja działa na Google App Engine. Czy ktoś może dać mi przykład? Nie mogę dostać tej pracy.
Out-File wydaje się wymuszać BOM podczas korzystania z UTF-8: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath Jak mogę napisać plik w UTF-8 bez BOM za pomocą PowerShell?
Sporo czasu spędziłem w Pythonie. Jak mogę kiedykolwiek zdekodować taki adres URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 do tego w Pythonie 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) zwraca coś bardzo brzydkiego. Nadal nie ma rozwiązania, każda pomoc jest doceniana.
Załóżmy, że właśnie użyłem a BufferedInputStreamdo odczytania bajtów pliku tekstowego zakodowanego w UTF-8 do tablicy bajtów. Wiem, że mogę użyć poniższej procedury do konwersji bajtów na ciąg, ale czy istnieje bardziej wydajny / mądrzejszy sposób na zrobienie tego niż tylko iteracja po bajtach i konwersja każdego z nich? public String …
Oto jak ustawia się moje połączenie: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); I pojawia się następujący błąd podczas wiązania w celu dodania wiersza do tabeli: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Wstawiam tysiące rekordów i zawsze pojawia się ten błąd, gdy tekst …
&W mojej witrynie używam symbolu „ ” z HTML5 i UTF-8 <title>. Google pokazuje ampersand dobrze na swoich SERP, podobnie jak wszystkie przeglądarki w swoich tytułach. http://validator.w3.org daje mi to: i nie rozpoczął odniesienia do znaku. (i prawdopodobnie powinienem uciec jako &amp;.) Czy naprawdę muszę to zrobić &amp;? Nie przejmuję …
Jestem naprawdę mylony z codecs.open function. Kiedy robię: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Daje mi to błąd UnicodeDecodeError: Kodek „ascii” nie może dekodować bajtu 0xef w pozycji 0: porządek poza zakresem (128) Jeśli zrobię: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() To działa dobrze. Pytanie brzmi, dlaczego pierwsza metoda …
Mam starszą aplikację, która zaczyna się źle zachowywać, z jakiegokolwiek powodu nie jestem pewien. Generuje wiązkę HTML, która jest przekształcana w raporty PDF przez ActivePDF. Proces działa w następujący sposób: Wyciągnij szablon HTML z bazy danych z tokenami do zastąpienia (np. „~ CompanyName ~”, „~ CustomerName ~” itp.) Zamień tokeny …
Próbuję parsować trochę HTML przy użyciu DOMDocument, ale kiedy to robię, nagle tracę kodowanie (przynajmniej tak mi się wydaje). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Wynikiem tego kodu jest to, że otrzymuję mnóstwo znaków, które …
Mam przeglądarkę, która wysyła znaki utf-8 do mojego serwera Python, ale kiedy pobieram go z ciągu zapytania, kodowanie, które zwraca Python, to ASCII. Jak przekonwertować zwykły ciąg znaków na utf-8? UWAGA: Ciąg przekazywany z sieci jest już zakodowany w UTF-8, chcę tylko, aby Python traktował go jako UTF-8, a nie …
Mam tę bardzo prostą rzecz, która po prostu wyświetla niektóre pliki w formacie CSV, ale musi to być UTF-8. Otwieram ten plik w TextEdit lub TextMate lub Dreamweaver i wyświetla on poprawnie znaki UTF-8, ale jeśli otworzę go w Excelu, robi to głupio. Oto, co mam na początku mojego dokumentu: …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.