Programowanie unicode

18

Jak używać znaków Unicode w wierszu poleceń systemu Windows?

Mamy projekt w Team Foundation Server (TFS), który ma nieangielski charakter (š). Podczas próby skryptu kilka rzeczy związanych z Build-my natknęliśmy się na problem - nie możemy zdać ów list do narzędzi wiersza polecenia. Wiersz polecenia lub coś innego nie wyświetla go w porządku , a narzędzie tf.exe nie może …

316 unicode command-line input windows-console

10

Jak poprawić TypeError: Obiekty Unicode muszą zostać zakodowane przed mieszaniem?

Mam ten błąd: Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(line) TypeError: Unicode-objects must be encoded before hashing kiedy próbuję wykonać ten kod w Python 3.2.2 : import hashlib, sys m = hashlib.md5() hash = "" hash_file = input("What is the file name in which the …

295 python python-3.x unicode syntax-error hashlib

6

Błąd składni: znak inny niż ASCII „xa3” w pliku, gdy funkcja zwraca „£”

Powiedz, że mam funkcję: def NewFunction(): return '£' Chcę wydrukować coś ze znakiem funta przed nim i wyświetla błąd podczas próby uruchomienia tego programu, ten komunikat o błędzie jest wyświetlany: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Czy ktoś może mi powiedzieć, …

284 python unicode python-unicode

21

Jak uzyskać obiekty JSON zamiast Unicode?

Używam Pythona 2 do analizy JSON z plików tekstowych zakodowanych w ASCII . Podczas ładowania tych plików za pomocą jsonlub simplejson, wszystkie moje ciągi znaków są rzutowane na obiekty Unicode zamiast na ciągi znaków. Problem polega na tym, że muszę używać danych z niektórymi bibliotekami, które akceptują tylko obiekty łańcuchowe. …

276 python json serialization unicode python-2.x

11

Jak sprawdzić, czy ciąg znaków jest Unicode, czy ASCI?

Co muszę zrobić w Pythonie, aby dowiedzieć się, które kodowanie ma łańcuch?

271 python unicode encoding utf-8

4

Dlaczego ten kod, napisany wstecz, wypisuje „Hello World!”

Oto kod, który znalazłem w Internecie: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Ten kod drukuje Hello World!się na ekranie; możesz zobaczyć, jak to działa tutaj . Wyraźnie widzępublic static void main napisane, ale jest odwrotnie. Jak działa ten kod? Jak to się nawet kompiluje? Edycja: Wypróbowałem ten kod …

261 java unicode right-to-left

9

UnicodeDecodeError, niepoprawny bajt kontynuacji

Dlaczego poniższy element nie działa? i dlaczego to się udaje dzięki kodekowi „latin-1”? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") prowadzi do: Traceback (most recent call last): File "<stdin>", line 1, in <module> …

257 python unicode decode

7

Zamień znaki spoza ASCII na pojedynczą spację

Muszę zastąpić wszystkie znaki spoza ASCII (\ x00- \ x7F) spacją. Dziwi mnie, że w Pythonie nie jest to łatwe, chyba że czegoś mi brakuje. Następująca funkcja po prostu usuwa wszystkie znaki spoza ASCII: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) I ten zastępuje znaki spoza ASCII …

244 python unicode encoding ascii

13

Python: Usunięcie \ xa0 z ciągu?

Obecnie używam Beautiful Soup do parsowania pliku HTML i wywoływania get_text(), ale wygląda na to, że mam dużo \ xa0 znaków reprezentujących spacje. Czy istnieje skuteczny sposób na usunięcie ich wszystkich w Pythonie 2.7 i zamianę ich w spacje? Wydaje mi się, że bardziej ogólne pytanie brzmi: czy istnieje sposób …

241 python parsing unicode

12

Ile bajtów zajmuje jeden znak Unicode?

Jestem trochę zdezorientowany co do kodowania. O ile wiem, stare znaki ASCII zajmowały jeden bajt na znak. Ile bajtów wymaga znak Unicode? Zakładam, że jeden znak Unicode może zawierać każdy możliwy znak z dowolnego języka - czy mam rację? Ile bajtów potrzebuje na znak? A co oznaczają UTF-7, UTF-6, UTF-16 …

239 string language-agnostic unicode encoding

5

Jak mogę zmienić kodowanie pliku za pomocą vima?

Jestem przyzwyczajony do używania vima do modyfikowania zakończeń linii pliku: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Czy można zastosować podobny proces do zmiany kodowania Unicode pliku? Próbuję następujących, które nie …

235 vim unicode

8

Zapisujesz tekst Unicode do pliku tekstowego?

Wyciągam dane z dokumentu Google, przetwarzam je i zapisuję w pliku (który ostatecznie wkleję na stronie Wordpress). Ma kilka symboli spoza ASCII. Jak przekonwertować je bezpiecznie na symbole, których można używać w źródle HTML? Obecnie po drodze konwertuję wszystko na Unicode, łączę to wszystko w łańcuch Python, a następnie: import …

225 python unicode character-encoding python-2.x

5

Jaka jest różnica między _tmain () i main () w C ++?

Jeśli uruchomię aplikację C ++ przy użyciu następującej metody main (), wszystko będzie w porządku: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout …

224 c++ unicode arguments

18

Jak echo 4-znakowego znaku Unicode w Bash?

Chciałbym dodać czaszkę i skrzyżowane piszczele Unicode do mojego monitu powłoki (konkretnie „CZASZKA I KRZYŻOWCE” (U + 2620)), ale nie mogę rozgryźć magicznej inkantacji, która sprawiłaby, że echo wyplułoby ją, lub jakiekolwiek inne, 4-cyfrowy znak Unicode. Dwucyfrowe są łatwe. Na przykład echo -e "\ x55",. Oprócz poniższych odpowiedzi należy zauważyć, …

224 bash shell unicode character-encoding

11

JavaScript + wyrażenia regularne

Jak mogę używać wyrażeń regularnych obsługujących Unicode w JavaScript? Na przykład powinno być coś podobnego, \wco może pasować do dowolnego punktu kodowego w kategorii Litery lub Znaki (nie tylko ASCII), i mam nadzieję, że mają filtry takie jak [[P *]] do interpunkcji itp.

216 javascript regex unicode character-properties

Pytania otagowane jako unicode