Pytania otagowane jako character-encoding

Kodowanie znaków odnosi się do sposobu, w jaki znaki są reprezentowane jako seria bajtów. Kodowanie znaków dla sieci Web jest zdefiniowane w standardzie kodowania.



8
Zapisujesz tekst Unicode do pliku tekstowego?
Wyciągam dane z dokumentu Google, przetwarzam je i zapisuję w pliku (który ostatecznie wkleję na stronie Wordpress). Ma kilka symboli spoza ASCII. Jak przekonwertować je bezpiecznie na symbole, których można używać w źródle HTML? Obecnie po drodze konwertuję wszystko na Unicode, łączę to wszystko w łańcuch Python, a następnie: import …

18
Jak echo 4-znakowego znaku Unicode w Bash?
Chciałbym dodać czaszkę i skrzyżowane piszczele Unicode do mojego monitu powłoki (konkretnie „CZASZKA I KRZYŻOWCE” (U + 2620)), ale nie mogę rozgryźć magicznej inkantacji, która sprawiłaby, że echo wyplułoby ją, lub jakiekolwiek inne, 4-cyfrowy znak Unicode. Dwucyfrowe są łatwe. Na przykład echo -e "\ x55",. Oprócz poniższych odpowiedzi należy zauważyć, …




6
Dlaczego nazwy zestawów znaków nie są stałymi?
Kwestie zestawów znaków są same w sobie mylące i skomplikowane, ale ponadto należy pamiętać dokładne nazwy zestawów znaków. Czy to "utf8"jest Czy "utf-8"? A może "UTF-8"? Podczas wyszukiwania przykładów kodu w Internecie zobaczysz wszystkie powyższe. Dlaczego nie nadać im nazw stałych i używać Charset.UTF8?

16
Czy naprawdę muszę kodować „&” jako „& amp;”?
&W mojej witrynie używam symbolu „ ” z HTML5 i UTF-8 <title>. Google pokazuje ampersand dobrze na swoich SERP, podobnie jak wszystkie przeglądarki w swoich tytułach. http://validator.w3.org daje mi to: i nie rozpoczął odniesienia do znaku. (i prawdopodobnie powinienem uciec jako &.) Czy naprawdę muszę to zrobić &? Nie przejmuję …

12
PHP DOMDokładanie dokumentu HTML nie poprawnie koduje UTF-8
Próbuję parsować trochę HTML przy użyciu DOMDocument, ale kiedy to robię, nagle tracę kodowanie (przynajmniej tak mi się wydaje). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Wynikiem tego kodu jest to, że otrzymuję mnóstwo znaków, które …


11
Konwertuj Unicode na ASCII bez błędów w Pythonie
Mój kod po prostu zeskrobuje stronę internetową, a następnie konwertuje ją na Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Ale dostaję UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: …

4
Po co określać @charset „UTF-8”; w twoim pliku CSS?
Widziałem tę instrukcję jako pierwszą linię wielu plików CSS, które zostały mi przekazane: @charset "UTF-8"; Co to robi i czy ta reguła jest konieczna? Ponadto, jeśli umieszczę ten metatag w moim elemencie „head”, czy wyeliminuje to potrzebę umieszczania go również w moich plikach CSS? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

11
Jaka jest różnica między kodowaniem a zestawem znaków?
Nie mam pewności co do kodowania tekstu i zestawu znaków. Z wielu powodów muszę się nauczyć rzeczy innych niż Unicode i UTF8 w mojej nadchodzącej pracy. Znajduję słowo „charset” w nagłówkach e-maili, jak w „ISO-2022-JP”, ale nie ma takiego kodowania w edytorach tekstu. (Rozejrzałem się po różnych edytorach tekstu.) Jaka …

11
PHP: Konwertuj dowolny ciąg do UTF-8 bez znajomości oryginalnego zestawu znaków lub przynajmniej spróbuj
Mam aplikację, która obsługuje klientów z całego świata i oczywiście chcę, aby wszystko, co trafia do moich baz danych, było zakodowane w UTF-8. Głównym problemem dla mnie jest to, że nie wiem, jakie kodowanie będzie miało źródło dowolnego ciągu - może to być z pola tekstowego (użycie <form accept-charset="utf-8">jest przydatne …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.