Kodowanie znaków odnosi się do sposobu, w jaki znaki są reprezentowane jako seria bajtów. Kodowanie znaków dla sieci Web jest zdefiniowane w standardzie kodowania.
Muszę utrzymywać dużą liczbę klasycznych stron ASP, z których wiele ma dane tabelaryczne bez możliwości sortowania. Niezależnie od kolejności, w jakiej pierwotny programista użyty w zapytaniu do bazy danych, utknąłeś. Chcę zająć się kilkoma podstawowymi sortowaniami do kilku tych stron i robię to po stronie klienta za pomocą javascript. Mam …
W Javie mam ciąg znaków i chcę go zakodować jako tablicę bajtów (w UTF8 lub innym kodowaniu). Alternatywnie mam tablicę bajtów (w znanym kodowaniu) i chcę przekonwertować ją na ciąg Java. Jak wykonać te konwersje?
Wyciągam dane z dokumentu Google, przetwarzam je i zapisuję w pliku (który ostatecznie wkleję na stronie Wordpress). Ma kilka symboli spoza ASCII. Jak przekonwertować je bezpiecznie na symbole, których można używać w źródle HTML? Obecnie po drodze konwertuję wszystko na Unicode, łączę to wszystko w łańcuch Python, a następnie: import …
Chciałbym dodać czaszkę i skrzyżowane piszczele Unicode do mojego monitu powłoki (konkretnie „CZASZKA I KRZYŻOWCE” (U + 2620)), ale nie mogę rozgryźć magicznej inkantacji, która sprawiłaby, że echo wyplułoby ją, lub jakiekolwiek inne, 4-cyfrowy znak Unicode. Dwucyfrowe są łatwe. Na przykład echo -e "\ x55",. Oprócz poniższych odpowiedzi należy zauważyć, …
Jakie było pierwotne historyczne użycie pionowego znaku tabulacji ( \vw języku C, ASCII 11)? Czy kiedykolwiek miał klawisz na klawiaturze? Jak ktoś to wygenerował? Czy istnieje dziś jakiś język lub system, w którym pionowy znak tabulacji robi coś interesującego i pożytecznego?
Oto mój kod for line in open('u.item'): #read each line za każdym razem, gdy uruchamiam ten kod, pojawia się następujący błąd: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Próbowałem rozwiązać ten problem i dodać dodatkowy parametr w open (), kod wygląda jak; for line …
Kwestie zestawów znaków są same w sobie mylące i skomplikowane, ale ponadto należy pamiętać dokładne nazwy zestawów znaków. Czy to "utf8"jest Czy "utf-8"? A może "UTF-8"? Podczas wyszukiwania przykładów kodu w Internecie zobaczysz wszystkie powyższe. Dlaczego nie nadać im nazw stałych i używać Charset.UTF8?
&W mojej witrynie używam symbolu „ ” z HTML5 i UTF-8 <title>. Google pokazuje ampersand dobrze na swoich SERP, podobnie jak wszystkie przeglądarki w swoich tytułach. http://validator.w3.org daje mi to: i nie rozpoczął odniesienia do znaku. (i prawdopodobnie powinienem uciec jako &amp;.) Czy naprawdę muszę to zrobić &amp;? Nie przejmuję …
Próbuję parsować trochę HTML przy użyciu DOMDocument, ale kiedy to robię, nagle tracę kodowanie (przynajmniej tak mi się wydaje). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Wynikiem tego kodu jest to, że otrzymuję mnóstwo znaków, które …
Nigdy nie byłem pewien, czy rozumiem różnicę między dekodowaniem i kodowaniem str / unicode. Wiem, że dzieje się tak, str().decode()gdy masz ciąg bajtów, o którym wiesz, że ma pewne kodowanie znaków, biorąc pod uwagę nazwę kodowania, zwróci ciąg Unicode. Wiem, że unicode().encode()konwertuje znaki Unicode na ciąg bajtów zgodnie z podaną …
Mój kod po prostu zeskrobuje stronę internetową, a następnie konwertuje ją na Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Ale dostaję UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: …
Widziałem tę instrukcję jako pierwszą linię wielu plików CSS, które zostały mi przekazane: @charset "UTF-8"; Co to robi i czy ta reguła jest konieczna? Ponadto, jeśli umieszczę ten metatag w moim elemencie „head”, czy wyeliminuje to potrzebę umieszczania go również w moich plikach CSS? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Nie mam pewności co do kodowania tekstu i zestawu znaków. Z wielu powodów muszę się nauczyć rzeczy innych niż Unicode i UTF8 w mojej nadchodzącej pracy. Znajduję słowo „charset” w nagłówkach e-maili, jak w „ISO-2022-JP”, ale nie ma takiego kodowania w edytorach tekstu. (Rozejrzałem się po różnych edytorach tekstu.) Jaka …
Mam aplikację, która obsługuje klientów z całego świata i oczywiście chcę, aby wszystko, co trafia do moich baz danych, było zakodowane w UTF-8. Głównym problemem dla mnie jest to, że nie wiem, jakie kodowanie będzie miało źródło dowolnego ciągu - może to być z pola tekstowego (użycie <form accept-charset="utf-8">jest przydatne …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.