Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.
Mam kilka problemów, próbując zakodować ciąg do UTF-8. Próbowałem wielu rzeczy, w tym używania string.encode('utf-8')i unicode(string), ale pojawia się błąd: UnicodeDecodeError: kodek „ascii” nie może zdekodować bajtu 0xef na pozycji 1: numer porządkowy poza zakresem (128) To jest mój ciąg: (。・ω・。)ノ Nie rozumiem, co się dzieje, jakiś pomysł? Edycja: Problem …
Mam wymaganie, które jest stosunkowo niejasne, ale wydaje mi się, że powinno być możliwe przy użyciu BCL. Dla kontekstu analizuję ciąg daty / godziny w czasie Noda . Utrzymuję logiczny kursor dla mojej pozycji w ciągu wejściowym. Tak więc, chociaż cały ciąg może mieć postać „3 stycznia 2013 r.”, Kursor …
Wiem o tym String#codePointAt(int), ale jest indeksowany przez charprzesunięcie, a nie przez przesunięcie punktu kodowego. Myślę o spróbowaniu czegoś takiego: używając String#charAt(int)do uzyskania charat indeksu testowanie, czy charjest w zakresie wysokich surogatów jeśli tak, użyj, String#codePointAt(int)aby uzyskać kod i zwiększ indeks o 2 jeśli nie, użyj podanej charwartości jako punktu …
Jak wyglądałby awkskrypt (prawdopodobnie jednolinijkowy) służący do usuwania zestawienia komponentów ? Specyfikacja: wypisz każdy wiersz po pierwszym ( NR > 1) dla pierwszego wiersza: jeśli zaczyna się od #FE #FFlub #FF #FE, usuń je i wydrukuj resztę
Mam ciąg, który wygląda tak: 6Â 918Â 417Â 712 Jasnym sposobem przycięcia tego ciągu (jak rozumiem Python) jest po prostu powiedzenie, że ciąg znajduje się w zmiennej o nazwie s, otrzymujemy: s.replace('Â ', '') To powinno załatwić sprawę. Ale oczywiście narzeka, że znak spoza ASCII '\xc2'w pliku blabla.py nie jest …
Czytam i analizuję plik Amazon XML i podczas gdy plik XML wyświetla ``, kiedy próbuję go wydrukować, pojawia się następujący błąd: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Z tego, co do tej pory przeczytałem w Internecie, błąd wynika z faktu, że plik XML …
W moim kodzie JavaScript muszę utworzyć wiadomość do serwera w następującym formacie: <size in bytes>CRLF <data>CRLF Przykład: 3 foo Dane mogą zawierać znaki Unicode. Muszę je wysłać jako UTF-8. Szukam najbardziej używanego w różnych przeglądarkach sposobu obliczenia długości ciągu w bajtach w JavaScript. Próbowałem tak skomponować mój ładunek: return unescape(encodeURIComponent(str)).length …
Próbuję to zrobić: <TextBlock Text="{Binding Path=Text, Converter={StaticResource stringFormatConverter}, ConverterParameter='&\u2014{0}'}" /> Aby uzyskać -, aby pojawił się przed tekstem. To nie działa. Co mam tu robić?
W pliku tekstowym znajduje się ciąg „Nie podoba mi się to”. Jednak kiedy wczytuję go do ciągu, staje się „Nie tak \ xe2 \ x80 \ x98t”. Rozumiem, że \ u2018 to symbol „” ”w formacie Unicode. używam f1 = open (file1, "r") text = f1.read() polecenie wykonania odczytu. Czy …
Moje kategorie należy nazywać greckimi literami. Używam ggplot2i pięknie działa z danymi. Niestety nie mogę wymyślić, jak umieścić te greckie symbole na osi x (przy znacznikach), a także wyświetlić je w legendzie. Czy jest na to sposób? AKTUALIZACJA: Rzuciłem okiem na link , jednak nie ma opisanej dobrej metody, aby …
Pracując z Pythonem 2.7, zastanawiam się, jaka jest prawdziwa zaleta w używaniu typu unicodezamiast str, ponieważ oba wydają się być w stanie przechowywać ciągi Unicode. Czy jest jakiś szczególny powód oprócz możliwości ustawienia kodów Unicode w unicodełańcuchach za pomocą znaku ucieczki \?: Wykonanie modułu z: # -*- coding: utf-8 -*- …
Zgodnie z dokumentacją Apache Commons Lang dla StringUtils.isNumeric(), ciąg „१२३” jest numeryczny. Ponieważ uważałem, że to może być błąd w dokumentacji, przeprowadziłem testy, aby zweryfikować oświadczenie. Odkryłem, że według Apache Commons jest to numeryczny. Dlaczego ten ciąg jest numeryczny? Co reprezentują te postacie?
Mamy już naszą bazę kodu działającą pod Pythonem 2.6. Aby przygotować się do Pythona 3.0, zaczęliśmy dodawać: z __future__ importuj unicode_literals do naszych .pyplików (w miarę ich modyfikacji). Zastanawiam się, czy ktoś inny to robił i napotkał nieoczywiste problemy (być może po spędzeniu dużo czasu na debugowaniu).
Pracuję z plikiem .txt. Chcę ciąg tekstu z pliku bez znaków spoza zestawu ASCII. Chcę jednak zostawić spacje i kropki. W tej chwili też je rozdzieram. Oto kod: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) …
Uruchamiam ten fragment dwukrotnie, w terminalu Ubuntu (kodowanie ustawione na utf-8), raz z, ./test.pya potem z ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Bez przekierowania drukuje śmieci. Z przekierowaniem otrzymuję UnicodeDecodeError. Czy ktoś może wyjaśnić, dlaczego otrzymuję błąd dopiero w drugim przypadku, czy jeszcze lepiej udzielić szczegółowego wyjaśnienia, co dzieje …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.