Pytania otagowane jako unicode

Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.



6
Błąd składni: znak inny niż ASCII „xa3” w pliku, gdy funkcja zwraca „£”
Powiedz, że mam funkcję: def NewFunction(): return '£' Chcę wydrukować coś ze znakiem funta przed nim i wyświetla błąd podczas próby uruchomienia tego programu, ten komunikat o błędzie jest wyświetlany: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Czy ktoś może mi powiedzieć, …

21
Jak uzyskać obiekty JSON zamiast Unicode?
Używam Pythona 2 do analizy JSON z plików tekstowych zakodowanych w ASCII . Podczas ładowania tych plików za pomocą jsonlub simplejson, wszystkie moje ciągi znaków są rzutowane na obiekty Unicode zamiast na ciągi znaków. Problem polega na tym, że muszę używać danych z niektórymi bibliotekami, które akceptują tylko obiekty łańcuchowe. …


4
Dlaczego ten kod, napisany wstecz, wypisuje „Hello World!”
Oto kod, który znalazłem w Internecie: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Ten kod drukuje Hello World!się na ekranie; możesz zobaczyć, jak to działa tutaj . Wyraźnie widzępublic static void main napisane, ale jest odwrotnie. Jak działa ten kod? Jak to się nawet kompiluje? Edycja: Wypróbowałem ten kod …

9
UnicodeDecodeError, niepoprawny bajt kontynuacji
Dlaczego poniższy element nie działa? i dlaczego to się udaje dzięki kodekowi „latin-1”? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") prowadzi do: Traceback (most recent call last): File "<stdin>", line 1, in <module> …
257 python  unicode  decode 

7
Zamień znaki spoza ASCII na pojedynczą spację
Muszę zastąpić wszystkie znaki spoza ASCII (\ x00- \ x7F) spacją. Dziwi mnie, że w Pythonie nie jest to łatwe, chyba że czegoś mi brakuje. Następująca funkcja po prostu usuwa wszystkie znaki spoza ASCII: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) I ten zastępuje znaki spoza ASCII …

13
Python: Usunięcie \ xa0 z ciągu?
Obecnie używam Beautiful Soup do parsowania pliku HTML i wywoływania get_text(), ale wygląda na to, że mam dużo \ xa0 znaków reprezentujących spacje. Czy istnieje skuteczny sposób na usunięcie ich wszystkich w Pythonie 2.7 i zamianę ich w spacje? Wydaje mi się, że bardziej ogólne pytanie brzmi: czy istnieje sposób …
241 python  parsing  unicode 

12
Ile bajtów zajmuje jeden znak Unicode?
Jestem trochę zdezorientowany co do kodowania. O ile wiem, stare znaki ASCII zajmowały jeden bajt na znak. Ile bajtów wymaga znak Unicode? Zakładam, że jeden znak Unicode może zawierać każdy możliwy znak z dowolnego języka - czy mam rację? Ile bajtów potrzebuje na znak? A co oznaczają UTF-7, UTF-6, UTF-16 …

5
Jak mogę zmienić kodowanie pliku za pomocą vima?
Jestem przyzwyczajony do używania vima do modyfikowania zakończeń linii pliku: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Czy można zastosować podobny proces do zmiany kodowania Unicode pliku? Próbuję następujących, które nie …
235 vim  unicode 

8
Zapisujesz tekst Unicode do pliku tekstowego?
Wyciągam dane z dokumentu Google, przetwarzam je i zapisuję w pliku (który ostatecznie wkleję na stronie Wordpress). Ma kilka symboli spoza ASCII. Jak przekonwertować je bezpiecznie na symbole, których można używać w źródle HTML? Obecnie po drodze konwertuję wszystko na Unicode, łączę to wszystko w łańcuch Python, a następnie: import …

5
Jaka jest różnica między _tmain () i main () w C ++?
Jeśli uruchomię aplikację C ++ przy użyciu następującej metody main (), wszystko będzie w porządku: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout …
224 c++  unicode  arguments 

18
Jak echo 4-znakowego znaku Unicode w Bash?
Chciałbym dodać czaszkę i skrzyżowane piszczele Unicode do mojego monitu powłoki (konkretnie „CZASZKA I KRZYŻOWCE” (U + 2620)), ale nie mogę rozgryźć magicznej inkantacji, która sprawiłaby, że echo wyplułoby ją, lub jakiekolwiek inne, 4-cyfrowy znak Unicode. Dwucyfrowe są łatwe. Na przykład echo -e "\ x55",. Oprócz poniższych odpowiedzi należy zauważyć, …

11
JavaScript + wyrażenia regularne
Jak mogę używać wyrażeń regularnych obsługujących Unicode w JavaScript? Na przykład powinno być coś podobnego, \wco może pasować do dowolnego punktu kodowego w kategorii Litery lub Znaki (nie tylko ASCII), i mam nadzieję, że mają filtry takie jak [[P *]] do interpunkcji itp.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.