Unix & Linux unicode

3

Niesamowite symbole i znaki w szybkim podpowiedzi

Właśnie natknąłem się na zrzut ekranu czyjegoś terminalu: Czy istnieje lista wszystkich znaków, które mogą być użyte w podpowiedzi Bash, czy ktoś może zdobyć dla mnie postać dla gwiazdy i prawej strzałki?

81 bash prompt unicode

6

Jak mogę usunąć BOM z pliku UTF-8?

Mam plik w kodowaniu UTF-8 z BOM i chcę usunąć BOM. Czy istnieją jakieś narzędzia wiersza polecenia systemu Linux do usunięcia BOM z pliku? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines

63 command-line files unicode

2

Jak mogę ustawić domyślne kodowanie VIM na UTF-8?

Chciałbym przyczynić się do projektu open source dostarczającego przetłumaczone ciągi. Jednym z ich wymagań jest to, że autorzy muszą używać UTF-8 jako kodowania plików PO. Używam VIM 7.3 w systemie Linux. Jak mogę się upewnić, że kodowanie VIM jest ustawione na UTF-8, aby móc poprawnie edytować i zapisywać plik .po?

62 vim character-encoding unicode

2

Dlaczego printf „kurczy się”?

Jeśli wykonam następujący prosty skrypt: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Drukuje: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz to znaczy tekst z umlautami (np. ü) jest „zmniejszany” o jeden znak na umlaut. Oczywiście, mam gdzieś jakieś …

54 bash unicode printf

6

Filtrowanie niepoprawnego utf8

Mam plik tekstowy w nieznanym lub mieszanym kodowaniu. Chcę zobaczyć wiersze zawierające sekwencję bajtów, która jest niepoprawna UTF-8 (przez przesłanie pliku tekstowego do jakiegoś programu). Odpowiednio chcę odfiltrować wiersze, które są poprawne UTF-8. Innymi słowy, szukam .grep [notutf8] Idealne rozwiązanie byłoby przenośne, krótkie i możliwe do uogólnienia w stosunku do …

50 command-line text-processing character-encoding unicode

2

Jakie czcionki są dobre dla glifów Unicode

Spojrzałem więc na tę odpowiedź na stackoverflow i zdałem sobie sprawę, że moje czcionki nie pokrywają całego spektrum utf-8 unicode (ponieważ otrzymuję wiele kwadratów). Czy ktoś zna czcionkę, która obejmie cały ten post?

38 fonts unicode

1

Czy powinniśmy używać znaków UTF-8, takich jak ⏰, w skrypcie bash / shell?

Prosty kod działa tutaj zgodnie z oczekiwaniami na moim komputerze, jeśli jest uruchamiany z bash: function ⏰(){ date } ⏰ Czy może być problem dla innych osób korzystających z tego, czy może jest on uniwersalny? Zastanawiam się, ponieważ na razie nie widziałem czegoś takiego w innym kodzie źródłowym. Edycja: Istnieją …

36 bash shell unicode

1

Jak uświadomić TR, że znaki nie są ascii (Unicode)?

Próbuję usunąć niektóre znaki z pliku (UTF-8). Używam trdo tego celu: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Plik zawiera niektóre obce znaki (np. „Латвийская” lub „àé”). trwydaje się ich nie rozumieć: traktuje je jako inne niż alfa i również je usuwa. Próbowałem zmienić niektóre ustawienia regionalne: LC_CTYPE=C LC_COLLATE=C tr -cs …

36 linux text-processing unicode tr

6

Czy istnieje alternatywa dla sed, która obsługuje Unicode?

Na przykład: sed 's/\u0091//g' file1 W tej chwili muszę zrobić, hexdumpaby uzyskać numer szesnastkowy i wpisać w sednastępujący sposób: $ echo -ne '\u9991' | hexdump -C 00000000 e9 a6 91 |...| 00000003 I wtedy: $ sed 's/\xe9\xa6\x91//g' file1

33 sed unicode hexdump

5

Zaktualizowałem mój arch. Serwer Linux i teraz otrzymuję tmux: potrzebuję ustawień regionalnych UTF-8 (LC_CTYPE), ale mam ANSI_X3.4-1968

Niedawno zaktualizowałem mój serwer Arch Linux i podczas tego procesu tmux został zaktualizowany. Używałem tmuxpodczas aktualizacji i korzystałem z niej później, ale wszystko podczas tej samej sesji SSH. Teraz jednak za każdym razem, gdy próbuję wydać dowolne tmuxpolecenie, pojawia się ten błąd: tmux: need UTF-8 locale (LC_CTYPE) but have ANSI_X3.4-1968 …

29 arch-linux tmux locale unicode

4

Jak określić znaki za pomocą kodów szesnastkowych w `grep`?

To pytanie zostało przeniesione z Stack Overflow, ponieważ można na nie odpowiedzieć na Unix i Linux Stack Exchange. Migrował 8 lat temu . Używam następującego polecenia do grep zakresu zestawu znaków dla kodu szesnastkowego 0900 (zamiast अ) do 097F (zamiast व). Jak mogę użyć kodu szesnastkowego zamiast अ i व? …

27 shell grep character-encoding unicode

3

Dlaczego sort mówi, że ɛ = e?

ɛ(„Latin epsilon”) to litera używana w niektórych językach afrykańskich, zwykle reprezentująca dźwięk samogłoski w angielskim „łóżku”. W Unicode jest zakodowany jako U + 025B, co różni się od codzienności e. Jeśli jednak sort: eb ed ɛa ɛc wydaje się, że sortuważa ɛi erównoważne: ɛa eb ɛc ed Co tu się …

25 sort locale unicode

6

W bash, jak mogę przekonwertować Unicode Codepoint [0-9A-F] na znak do druku?

Mam listę znaków kodowych Unicode, ale nie znam „prostego” sposobu konwersji tych wartości szesnastkowych na rzeczywiste znaki, które reprezentują ... Słyszałem, że zsh ma echo -e '\u0965', ale używam bash 4.1. Czy istnieje coś tak prostego jak metoda zsh dla bash?

23 bash unicode

6

Konwertuj między formularzami normalizacji Unicode w wierszu poleceń unix

W Unicode niektóre kombinacje znaków mają więcej niż jedną reprezentację. Na przykład znak ä można przedstawić jako „ä”, czyli punkt kodowy U + 00E4 (dwa bajty c3 a4w kodowaniu UTF-8) lub jako „ä”, tj. dwa punkty kodowe U + 0061 U + 0308 (trzy bajty 61 cc 88w UTF-8). Zgodnie …

22 command-line text-processing conversion unicode

8

jak wpisać „inteligentne cytaty” (U + 201C, U + 201D)

To jest tak: “(U + 201C) ”(U + 201D).

22 xorg keyboard special-characters unicode

Pytania otagowane jako unicode