Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.
Mamy projekt w Team Foundation Server (TFS), który ma nieangielski charakter (š). Podczas próby skryptu kilka rzeczy związanych z Build-my natknęliśmy się na problem - nie możemy zdać ów list do narzędzi wiersza polecenia. Wiersz polecenia lub coś innego nie wyświetla go w porządku , a narzędzie tf.exe nie może …
Mam ten błąd: Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(line) TypeError: Unicode-objects must be encoded before hashing kiedy próbuję wykonać ten kod w Python 3.2.2 : import hashlib, sys m = hashlib.md5() hash = "" hash_file = input("What is the file name in which the …
Powiedz, że mam funkcję: def NewFunction(): return '£' Chcę wydrukować coś ze znakiem funta przed nim i wyświetla błąd podczas próby uruchomienia tego programu, ten komunikat o błędzie jest wyświetlany: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Czy ktoś może mi powiedzieć, …
Używam Pythona 2 do analizy JSON z plików tekstowych zakodowanych w ASCII . Podczas ładowania tych plików za pomocą jsonlub simplejson, wszystkie moje ciągi znaków są rzutowane na obiekty Unicode zamiast na ciągi znaków. Problem polega na tym, że muszę używać danych z niektórymi bibliotekami, które akceptują tylko obiekty łańcuchowe. …
Oto kod, który znalazłem w Internecie: class M{public static void main(String[]a){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Ten kod drukuje Hello World!się na ekranie; możesz zobaczyć, jak to działa tutaj . Wyraźnie widzępublic static void main napisane, ale jest odwrotnie. Jak działa ten kod? Jak to się nawet kompiluje? Edycja: Wypróbowałem ten kod …
Dlaczego poniższy element nie działa? i dlaczego to się udaje dzięki kodekowi „latin-1”? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") prowadzi do: Traceback (most recent call last): File "<stdin>", line 1, in <module> …
Muszę zastąpić wszystkie znaki spoza ASCII (\ x00- \ x7F) spacją. Dziwi mnie, że w Pythonie nie jest to łatwe, chyba że czegoś mi brakuje. Następująca funkcja po prostu usuwa wszystkie znaki spoza ASCII: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) I ten zastępuje znaki spoza ASCII …
Obecnie używam Beautiful Soup do parsowania pliku HTML i wywoływania get_text(), ale wygląda na to, że mam dużo \ xa0 znaków reprezentujących spacje. Czy istnieje skuteczny sposób na usunięcie ich wszystkich w Pythonie 2.7 i zamianę ich w spacje? Wydaje mi się, że bardziej ogólne pytanie brzmi: czy istnieje sposób …
Jestem trochę zdezorientowany co do kodowania. O ile wiem, stare znaki ASCII zajmowały jeden bajt na znak. Ile bajtów wymaga znak Unicode? Zakładam, że jeden znak Unicode może zawierać każdy możliwy znak z dowolnego języka - czy mam rację? Ile bajtów potrzebuje na znak? A co oznaczają UTF-7, UTF-6, UTF-16 …
Jestem przyzwyczajony do używania vima do modyfikowania zakończeń linii pliku: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Czy można zastosować podobny proces do zmiany kodowania Unicode pliku? Próbuję następujących, które nie …
Wyciągam dane z dokumentu Google, przetwarzam je i zapisuję w pliku (który ostatecznie wkleję na stronie Wordpress). Ma kilka symboli spoza ASCII. Jak przekonwertować je bezpiecznie na symbole, których można używać w źródle HTML? Obecnie po drodze konwertuję wszystko na Unicode, łączę to wszystko w łańcuch Python, a następnie: import …
Jeśli uruchomię aplikację C ++ przy użyciu następującej metody main (), wszystko będzie w porządku: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout …
Chciałbym dodać czaszkę i skrzyżowane piszczele Unicode do mojego monitu powłoki (konkretnie „CZASZKA I KRZYŻOWCE” (U + 2620)), ale nie mogę rozgryźć magicznej inkantacji, która sprawiłaby, że echo wyplułoby ją, lub jakiekolwiek inne, 4-cyfrowy znak Unicode. Dwucyfrowe są łatwe. Na przykład echo -e "\ x55",. Oprócz poniższych odpowiedzi należy zauważyć, …
Jak mogę używać wyrażeń regularnych obsługujących Unicode w JavaScript? Na przykład powinno być coś podobnego, \wco może pasować do dowolnego punktu kodowego w kategorii Litery lub Znaki (nie tylko ASCII), i mam nadzieję, że mają filtry takie jak [[P *]] do interpunkcji itp.
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.