Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.
Używam Pythona 2.6.5. Mój kod wymaga użycia znaku „więcej niż lub równe”. Oto jest: >>> s = u'\u2265' >>> print s >>> ≥ >>> print "{0}".format(s) Traceback (most recent call last): File "<input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\u2265' in position 0: ordinal not in …
Otrzymuję błąd z następującym wzorcem: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Nie wiem, co to u'\ufeff'jest, pojawia się, gdy przeglądam sieć. Jak mogę zaradzić tej sytuacji? Metoda .replace()string na tym nie działa.
Czytałem dokumentację StringBuffer, w szczególności metodę reverse () . Ta dokumentacja wspomina coś o parach zastępczych . Co to jest para zastępcza w tym kontekście? A czym są niskie i wysokie surogaty?
Próba zrozumienia subtelności współczesnego Unicode przyprawia mnie o ból głowy. W szczególności rozróżnienie między punktami kodowymi, znakami, glifami i grafemami - pojęciami, które w najprostszym przypadku, gdy mamy do czynienia z tekstem angielskim używającym znaków ASCII, wszystkie mają ze sobą relację jeden do jednego - sprawia mi kłopot. Widząc, jak …
Próbuję użyć pakietu Pythona o nazwie bidi. W module w tym pakiecie (algorytm.py) jest kilka wierszy, które dają mi błąd, chociaż jest to część pakietu. Oto linie: # utf-8 ? we need unicode if isinstance(unicode_or_str, unicode): text = unicode_or_str decoded = False else: text = unicode_or_str.decode(encoding) decoded = True a …
Ten kod: string a = "abc"; string b = "A𠈓C"; Console.WriteLine("Length a = {0}", a.Length); Console.WriteLine("Length b = {0}", b.Length); wyjścia: Length a = 3 Length b = 4 Czemu? Jedyne, co mogłem sobie wyobrazić, to to, że chiński znak ma 2 bajty i że .Lengthmetoda zwraca liczbę bajtów.
На этот вопрос есть ответы на Stack Overflow на русском : Как из Python вывести на Windows-консоль строку в Юникоде? Kiedy próbuję wydrukować ciąg Unicode w konsoli systemu Windows, pojawia się UnicodeEncodeError: 'charmap' codec can't encode character ....błąd. Zakładam, że dzieje się tak, ponieważ konsola systemu Windows nie akceptuje znaków …
На этот вопрос есть ответы на Stack Overflow на русском : по кодировкам utf-8 выдает результат по-русском Z pewnością będzie to łatwe, ale naprawdę mnie to niepokoi. Mam skrypt, który czyta stronę internetową i analizuje ją za pomocą Beautiful Soup . Z zupy wyciągam wszystkie linki, moim ostatecznym celem jest …
Śledzę plik maszyny wirtualnej Virtual PC (* .vmc) w git i po wprowadzeniu zmiany git zidentyfikował plik jako binarny i nie porównał go dla mnie. Odkryłem, że plik został zakodowany w UTF-16. Czy można nauczyć git, aby rozpoznawał, że ten plik jest tekstowy i odpowiednio go obsługiwał? Używam git pod …
Z powłoki Pythona 2.6: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> Spodziewałem się jakiegoś bełkotu lub błędu po instrukcji print, ponieważ znak „é” nie jest częścią ASCII i nie określiłem kodowania. Wydaje mi się, że nie rozumiem, co oznacza ASCII jako domyślne kodowanie. EDYTOWAĆ Przeniosłem …
Różnica między UTF-8 i UTF-16? Dlaczego tego potrzebujemy? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
Muszę wstawić Omega (Ω) na moją stronę HTML. W tym celu używam jego kodu ucieczki HTML, więc mogę pisać &#937;i pobierać Ω. Wszystko jest w porządku, kiedy umieszczam to w elemencie HTML; Jednak kiedy próbuję umieścić go w moim JS, np var Omega = &#937;. analizuje ten kod jako JS …
Czy w 2010 r. Udostępniłbyś adresy URL zawierające znaki UTF-8 w dużym portalu internetowym? Znaki Unicode są zabronione zgodnie z RFC w adresach URL (patrz tutaj ). Aby były zgodne ze standardami, musiałyby być zakodowane w procentach. Moim głównym celem jest jednak serwowanie niezakodowanych znaków wyłącznie w celu posiadania ładnie …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.