Unicode jest branżowym standardem komputerowym do spójnego kodowania, reprezentacji i obsługi tekstu wyrażonego w większości systemów pisania na świecie.
Jestem na systemie Ubuntu (tak myślę). I nie mają korzeni, więc nie mogę zmienić ustawienia regionalne. Chcę, aby mój domyślny profil terminala domyślnie używał UTF-8. Powinien istnieć sposób, aby to zrobić, albo .gconf/apps/gnome-terminal/gdzieś w katalogu, albo w zmiennej środowiskowej, czy coś takiego. Jednak nie mogę tego znaleźć. Edytuj z większą …
Czasami chcę pisać specjalne znaki Unicode, takie jak em-dash (-), w różnych programach, takich jak vim, Chrome (jak teraz!) Lub LibreOffice. W LibreOffice mogę to osiągnąć poprzez dedykowane okno dialogowe znajdujące się w menu Wstaw. Wydaje się, że inne programy nie mają wbudowanego sposobu. Moim rozwiązaniem w tych przypadkach jest …
Jak mogę sprawdzić, czy plik tekstowy utf-8 ma BOM z wiersza poleceń? filepolecenie pokazuje mi UTF-8 Unicode text. Ale nie wiem, to znaczy, że w pliku nie ma BOM. Używam Ubuntu 12.04.
Ktoś wysłał mi plik ZIP zawierający pliki o hebrajskich nazwach (i utworzony w systemie Windows, nie jestem pewien, z jakim narzędziem). Używam LXDE na Debian Stretch. Menedżerowi archiwum Gnome udało się rozpakować plik, ale hebrajskie znaki są zniekształcone. Wydaje mi się, że rozszerzam oktety UTF-8 na znaki Unicode, np. Mam …
Używam Arch Linux z prostym terminalem, używając czcionki Adobe Source Code Pro. Moje ustawienia regionalne są poprawnie ustawione na LANG=en_US.UTF-8. Chcę wydrukować na moim terminalu znaki Unicode reprezentujące karty do gry. Korzystam z Wikipedii w celach informacyjnych . Znaki Unicode dla kolorów kart działają dobrze. Na przykład wydawanie $ printf …
Emotikony wydają się być określone przy użyciu formatu U + xxxxx, w którym każdy x jest cyfrą szesnastkową. Na przykład U + 1F615 to oficjalny kod konsorcjum Unicode dla „zdezorientowanej twarzy” 😕 Ponieważ często jestem zdezorientowany, mam silne powinowactwo do tego symbolu. Reprezentacja U + 1F615 jest dla mnie myląca, …
Kiedy używałem cutdzisiaj, dowiedziałem się, że nie traktuje znaku UTF-8 jako znaku, ale 3 znaki, ponieważ ma 3 bajty długości. Wydaje się to być ogólnie prawdą w przypadku wielu narzędzi. Czy istnieją wersje, coreutilsktóre obsługują UTF-8? Moja localeprodukcja: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" LC_COLLATE="en_US.UTF-8" LC_MONETARY="en_US.UTF-8" LC_MESSAGES="en_US.UTF-8" LC_PAPER="en_US.UTF-8" LC_NAME="en_US.UTF-8" LC_ADDRESS="en_US.UTF-8" LC_TELEPHONE="en_US.UTF-8" LC_MEASUREMENT="en_US.UTF-8" …
Jak znaleźć odpowiednią czcionkę do renderowania punktów kodowych Unicode? gnome-terminalokaże się, że znaki takie jak «🉃 ⼼ 😻🕲🝤» mogą być renderowane za pomocą czcionek takich jak Symbola, a nie czcionek terminalowych lub zastępczego kodu zastępczego w kwadracie (????). W jaki sposób ?
Polecenie cutma opcję -cpracy na znakach zamiast bajtów z tą opcją -b. Ale to wydaje się nie działać, na poziomie en_US.UTF-8lokalnym: Drugi bajt podaje drugi znak ASCII (który jest tak samo zakodowany w UTF-8): $ printf 'ABC' | cut -b 2 B ale nie podaje drugiego z trzech greckich znaków …
Jaki byłby najbliższy przenośny sposób uzyskania szerokości wyświetlania (co najmniej na terminalu (takim, który wyświetla znaki w bieżących ustawieniach regionalnych o właściwej szerokości)) ciągu znaków ze skryptu powłoki. Interesuje mnie przede wszystkim szerokość znaków niekontrolowanych, ale mile widziane są również rozwiązania uwzględniające znaki sterujące, takie jak backspace, powrót karetki, tabulacja …
Czy w systemach operacyjnych opartych na Uniksie nazwy plików utf6 są dozwolone? Jeśli tak, muszę zrobić coś specjalnego, aby zapisać plik na dysku. Pozwól mi wyjaśnić, co mam nadzieję zrobić. Piszę aplikację, która prześle plik przez ftp do zdalnego systemu, ale nazwa pliku jest dynamicznie zmieniana za pomocą zestawu metadanych, …
W ogromnym pliku tekstowym UTF-8 chcę pokazać wszystkie linie zawierające japońskie kanjis . Jakie grep(lub inne) wyrażenie to robi? Jeśli się nie mylę, kanjis to znaki między \u4e00a \u4dbf. Nie muszę pokazywać kan , ale pokazanie ich również nie byłoby dużym problemem.
Używam Ubuntu .. W 'gnome-terminal', mogę wpisać Unicode Codepoints, najpierw wpisując Ctrl-Shift-u, a następnie wartość szesnastkową Codepoint, np. C-S-u 2468produkuje ⑨ konsole, mój preferowany terminal, nie ma tej funkcji CSu (gnome) .. Czy istnieje jakiś równoważny sposób KDE w Konsole?
Podczas próby przekonwertowania pliku tekstowego na jego odpowiednik ASCII pojawia się komunikat o błędzie iconv: illegal input sequence at position. Polecenie, którego używam, to iconv -f UTF-8 -t ascii//TRANSLIT file Obrażającą postacią jest æ. Sam plik tekstowy jest tutaj obecny . Dlaczego mówi nielegalna sekwencja? Znak wejściowy jest prawidłowy UTF-8 …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.