Programowanie character-encoding

17

Czy istnieje postać odwrócona do góry nogami?

Muszę utrzymywać dużą liczbę klasycznych stron ASP, z których wiele ma dane tabelaryczne bez możliwości sortowania. Niezależnie od kolejności, w jakiej pierwotny programista użyty w zapytaniu do bazy danych, utknąłeś. Chcę zająć się kilkoma podstawowymi sortowaniami do kilku tych stron i robię to po stronie klienta za pomocą javascript. Mam …

265 html sorting user-interface character-encoding character

13

Jak przekonwertować ciągi na i z tablic bajtów UTF8 w Javie

W Javie mam ciąg znaków i chcę go zakodować jako tablicę bajtów (w UTF8 lub innym kodowaniu). Alternatywnie mam tablicę bajtów (w znanym kodowaniu) i chcę przekonwertować ją na ciąg Java. Jak wykonać te konwersje?

239 java string encoding character-encoding

8

Zapisujesz tekst Unicode do pliku tekstowego?

Wyciągam dane z dokumentu Google, przetwarzam je i zapisuję w pliku (który ostatecznie wkleję na stronie Wordpress). Ma kilka symboli spoza ASCII. Jak przekonwertować je bezpiecznie na symbole, których można używać w źródle HTML? Obecnie po drodze konwertuję wszystko na Unicode, łączę to wszystko w łańcuch Python, a następnie: import …

225 python unicode character-encoding python-2.x

18

Jak echo 4-znakowego znaku Unicode w Bash?

Chciałbym dodać czaszkę i skrzyżowane piszczele Unicode do mojego monitu powłoki (konkretnie „CZASZKA I KRZYŻOWCE” (U + 2620)), ale nie mogę rozgryźć magicznej inkantacji, która sprawiłaby, że echo wyplułoby ją, lub jakiekolwiek inne, 4-cyfrowy znak Unicode. Dwucyfrowe są łatwe. Na przykład echo -e "\ x55",. Oprócz poniższych odpowiedzi należy zauważyć, …

224 bash shell unicode character-encoding

10

Co to jest format ANSI?

Co to jest format kodowania ANSI? Czy jest to domyślny format systemu? Czym różni się od ASCII?

217 character-encoding ascii ansi codepages

10

Co to jest zakładka pionowa?

Jakie było pierwotne historyczne użycie pionowego znaku tabulacji ( \vw języku C, ASCII 11)? Czy kiedykolwiek miał klawisz na klawiaturze? Jak ktoś to wygenerował? Czy istnieje dziś jakiś język lub system, w którym pionowy znak tabulacji robi coś interesującego i pożytecznego?

216 character-encoding ascii special-characters character

10

„For line in…” powoduje błąd UnicodeDecodeError: kodek „utf-8” nie może dekodować bajtu

Oto mój kod for line in open('u.item'): #read each line za każdym razem, gdy uruchamiam ten kod, pojawia się następujący błąd: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Próbowałem rozwiązać ten problem i dodać dodatkowy parametr w open (), kod wygląda jak; for line …

214 python python-3.x character-encoding

6

Dlaczego nazwy zestawów znaków nie są stałymi?

Kwestie zestawów znaków są same w sobie mylące i skomplikowane, ale ponadto należy pamiętać dokładne nazwy zestawów znaków. Czy to "utf8"jest Czy "utf-8"? A może "UTF-8"? Podczas wyszukiwania przykładów kodu w Internecie zobaczysz wszystkie powyższe. Dlaczego nie nadać im nazw stałych i używać Charset.UTF8?

211 java character-encoding

16

Czy naprawdę muszę kodować „&” jako „& amp;”?

&W mojej witrynie używam symbolu „ ” z HTML5 i UTF-8 <title>. Google pokazuje ampersand dobrze na swoich SERP, podobnie jak wszystkie przeglądarki w swoich tytułach. http://validator.w3.org daje mi to: i nie rozpoczął odniesienia do znaku. (i prawdopodobnie powinienem uciec jako &amp;.) Czy naprawdę muszę to zrobić &amp;? Nie przejmuję …

207 validation html utf-8 character-encoding

12

PHP DOMDokładanie dokumentu HTML nie poprawnie koduje UTF-8

Próbuję parsować trochę HTML przy użyciu DOMDocument, ale kiedy to robię, nagle tracę kodowanie (przynajmniej tak mi się wydaje). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Wynikiem tego kodu jest to, że otrzymuję mnóstwo znaków, które …

194 php utf-8 character-encoding

6

Jaka jest różnica między kodowaniem / dekodowaniem?

Nigdy nie byłem pewien, czy rozumiem różnicę między dekodowaniem i kodowaniem str / unicode. Wiem, że dzieje się tak, str().decode()gdy masz ciąg bajtów, o którym wiesz, że ma pewne kodowanie znaków, biorąc pod uwagę nazwę kodowania, zwróci ciąg Unicode. Wiem, że unicode().encode()konwertuje znaki Unicode na ciąg bajtów zgodnie z podaną …

180 python string unicode character-encoding python-2.x

11

Konwertuj Unicode na ASCII bez błędów w Pythonie

Mój kod po prostu zeskrobuje stronę internetową, a następnie konwertuje ją na Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Ale dostaję UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: …

178 python unicode utf-8 character-encoding ascii

4

Po co określać @charset „UTF-8”; w twoim pliku CSS?

Widziałem tę instrukcję jako pierwszą linię wielu plików CSS, które zostały mi przekazane: @charset "UTF-8"; Co to robi i czy ta reguła jest konieczna? Ponadto, jeśli umieszczę ten metatag w moim elemencie „head”, czy wyeliminuje to potrzebę umieszczania go również w moich plikach CSS? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

173 css character-encoding

11

Jaka jest różnica między kodowaniem a zestawem znaków?

Nie mam pewności co do kodowania tekstu i zestawu znaków. Z wielu powodów muszę się nauczyć rzeczy innych niż Unicode i UTF8 w mojej nadchodzącej pracy. Znajduję słowo „charset” w nagłówkach e-maili, jak w „ISO-2022-JP”, ale nie ma takiego kodowania w edytorach tekstu. (Rozejrzałem się po różnych edytorach tekstu.) Jaka …

151 encoding character-encoding

11

PHP: Konwertuj dowolny ciąg do UTF-8 bez znajomości oryginalnego zestawu znaków lub przynajmniej spróbuj

Mam aplikację, która obsługuje klientów z całego świata i oczywiście chcę, aby wszystko, co trafia do moich baz danych, było zakodowane w UTF-8. Głównym problemem dla mnie jest to, że nie wiem, jakie kodowanie będzie miało źródło dowolnego ciągu - może to być z pola tekstowego (użycie <form accept-charset="utf-8">jest przydatne …

146 php utf-8 character-encoding

Pytania otagowane jako character-encoding