Unicode jest standardem kodowania, reprezentacji i obsługi tekstu z zamiarem obsługi wszystkich znaków wymaganych dla tekstu pisanego, obejmujących wszystkie systemy pisania, symbole techniczne i interpunkcję.
Próbowałem użyć java.io.FileReader do odczytania niektórych plików tekstowych i przekonwertowania ich na ciąg, ale okazało się, że wynik jest nieprawidłowo zakodowany i w ogóle nie jest czytelny. Oto moje środowisko: Windows 2003, kodowanie systemu operacyjnego: CP1252 Java 5.0 Moje pliki są zakodowane w UTF-8 lub CP1252, a niektóre z nich …
Problem polega na tym, że jak wiesz, na wykresie Unicode są tysiące znaków i chcę zamienić wszystkie podobne znaki na litery, które są w alfabecie angielskim. Na przykład oto kilka konwersji: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... i zobaczyłem, że istnieje ponad 20 wersji litery …
Projekt ICU (który ma teraz również bibliotekę PHP ) zawiera klasy potrzebne do normalizacji łańcuchów znaków UTF-8, aby ułatwić porównywanie wartości podczas wyszukiwania. Jednak próbuję dowiedzieć się, co to oznacza dla aplikacji. Na przykład w jakich przypadkach chcę „Równoważność kanoniczna” zamiast „Równoważność zgodności” lub odwrotnie?
Chcę czegoś takiego 0x2022 8226 BULLET • Ale większy. Nie mogę ich nawet znaleźć pod adresem http://www.ssec.wisc.edu/~tomw/java/unicode.html Czego powinienem szukać? Kropki? kule?
Co oznacza kod znaku (HTML) &#8203;? Znalazłem to w jednym z moich skryptów jQuery i zastanawiałem się, co to jest. Dzięki. Edytować: Oto skrypt, w którym się znajdował (został dodany na końcu, znalazł go w Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); …
Wiele nowoczesnych implementacji wyrażeń regularnych interpretuje \wskrót klasy znaków jako „dowolną literę, cyfrę lub łączącą interpunkcję” (zwykle: podkreślenie). W ten sposób regex podobne \w+dopasowania słów podoba hello, élève, GOÄ_432lub gefräßig. Niestety Java nie. W Javie \wjest ograniczony do [A-Za-z0-9_]. Utrudnia to między innymi dopasowywanie słów, takich jak te wymienione powyżej. …
Jestem bardzo zmieszany. Próbowałem zakodować, ale błąd powiedział can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Wiem, jak uniknąć błędu z prefiksem „u” w ciągu. Zastanawiam się tylko, dlaczego …
Znajduję Unicode dla znaków specjalnych z wyszukiwania FileFormat.Info . Niektóre znaki są renderowane jako klasyczne czarno-białe glify, takie jak ⚠ (znak ostrzegawczy \u26A0lub &#x26a0;). Są lepsze, ponieważ mogę zastosować do nich style CSS (takie jak kolor). Inne renderują się jako nowsze emotikony z kreskówek, takie jak ⌛ (klepsydra \u231Blub &#x231b;). …
Żaden z poniższych kodów nie działa: p:before { content: " "; } p:before { content: "&nbsp;"; } Jak dodać spację przed zawartością elementu? Uwaga: muszę pokolorować obramowanie po lewej stronie i margines po lewej stronie do celów semantycznych i użyć spacji jako bezbarwnego marginesu. :)
Chcę wyświetlić znak Unicode w Javie. Jeśli to zrobię, działa dobrze: String symbol = "\u2202"; symbol jest równy „∂”. To jest to czego chce. Problem polega na tym, że znam numer Unicode i muszę na jego podstawie stworzyć symbol Unicode. Próbowałem (dla mnie) oczywistej rzeczy: int c = 2202; String …
Próbuję napisać skrypt Perla przy użyciu pragmy „utf8” i otrzymuję nieoczekiwane rezultaty. Używam systemu Mac OS X 10.5 (Leopard) i edytuję za pomocą TextMate. Wszystkie moje ustawienia zarówno mojego edytora, jak i systemu operacyjnego są domyślnie ustawione na zapisywanie plików w formacie utf-8. Jednak kiedy wprowadzam następujące polecenie do pliku …
Standard Unicode ma wystarczającą liczbę punktów kodowych, że potrzebujesz 4 bajtów, aby je wszystkie zapisać. To właśnie robi kodowanie UTF-32. Jednak kodowanie UTF-8 w jakiś sposób wciska je do znacznie mniejszych przestrzeni, używając czegoś, co nazywa się „kodowaniem o zmiennej szerokości”. W rzeczywistości udaje mu się przedstawić pierwsze 127 znaków …
Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 6 lat temu . Popraw to pytanie W twoim doświadczeniu, które znaki Unicode, punkty kodowe, zakresy poza BMP (Basic …
Znam niestandardowy schemat% uxxxx, ale nie wydaje się to mądrym wyborem, ponieważ schemat został odrzucony przez W3C. Kilka interesujących przykładów: Charakter serca. Jeśli wpiszę to w przeglądarce: http://www.google.com/search?q=♥ Następnie skopiuj i wklej, widzę ten adres URL http://www.google.com/search?q=%E2%99%A5 co sprawia, że wygląda na to, że Firefox (lub Safari) to robi. urllib.quote_plus(x.encode("latin-1")) …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.