Pytania otagowane jako unicode

Unicode jest branżowym standardem komputerowym do spójnego kodowania, reprezentacji i obsługi tekstu wyrażonego w większości systemów pisania na świecie.


6
Jak mogę usunąć BOM z pliku UTF-8?
Mam plik w kodowaniu UTF-8 z BOM i chcę usunąć BOM. Czy istnieją jakieś narzędzia wiersza polecenia systemu Linux do usunięcia BOM z pliku? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines

2
Jak mogę ustawić domyślne kodowanie VIM na UTF-8?
Chciałbym przyczynić się do projektu open source dostarczającego przetłumaczone ciągi. Jednym z ich wymagań jest to, że autorzy muszą używać UTF-8 jako kodowania plików PO. Używam VIM 7.3 w systemie Linux. Jak mogę się upewnić, że kodowanie VIM jest ustawione na UTF-8, aby móc poprawnie edytować i zapisywać plik .po?

2
Dlaczego printf „kurczy się”?
Jeśli wykonam następujący prosty skrypt: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Drukuje: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz to znaczy tekst z umlautami (np. ü) jest „zmniejszany” o jeden znak na umlaut. Oczywiście, mam gdzieś jakieś …
54 bash  unicode  printf 

6
Filtrowanie niepoprawnego utf8
Mam plik tekstowy w nieznanym lub mieszanym kodowaniu. Chcę zobaczyć wiersze zawierające sekwencję bajtów, która jest niepoprawna UTF-8 (przez przesłanie pliku tekstowego do jakiegoś programu). Odpowiednio chcę odfiltrować wiersze, które są poprawne UTF-8. Innymi słowy, szukam .grep [notutf8] Idealne rozwiązanie byłoby przenośne, krótkie i możliwe do uogólnienia w stosunku do …

2
Jakie czcionki są dobre dla glifów Unicode
Spojrzałem więc na tę odpowiedź na stackoverflow i zdałem sobie sprawę, że moje czcionki nie pokrywają całego spektrum utf-8 unicode (ponieważ otrzymuję wiele kwadratów). Czy ktoś zna czcionkę, która obejmie cały ten post?
38 fonts  unicode 


1
Jak uświadomić TR, że znaki nie są ascii (Unicode)?
Próbuję usunąć niektóre znaki z pliku (UTF-8). Używam trdo tego celu: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Plik zawiera niektóre obce znaki (np. „Латвийская” lub „àé”). trwydaje się ich nie rozumieć: traktuje je jako inne niż alfa i również je usuwa. Próbowałem zmienić niektóre ustawienia regionalne: LC_CTYPE=C LC_COLLATE=C tr -cs …


5
Zaktualizowałem mój arch. Serwer Linux i teraz otrzymuję tmux: potrzebuję ustawień regionalnych UTF-8 (LC_CTYPE), ale mam ANSI_X3.4-1968
Niedawno zaktualizowałem mój serwer Arch Linux i podczas tego procesu tmux został zaktualizowany. Używałem tmuxpodczas aktualizacji i korzystałem z niej później, ale wszystko podczas tej samej sesji SSH. Teraz jednak za każdym razem, gdy próbuję wydać dowolne tmuxpolecenie, pojawia się ten błąd: tmux: need UTF-8 locale (LC_CTYPE) but have ANSI_X3.4-1968 …


3
Dlaczego sort mówi, że ɛ = e?
ɛ(„Latin epsilon”) to litera używana w niektórych językach afrykańskich, zwykle reprezentująca dźwięk samogłoski w angielskim „łóżku”. W Unicode jest zakodowany jako U + 025B, co różni się od codzienności e. Jeśli jednak sort: eb ed ɛa ɛc wydaje się, że sortuważa ɛi erównoważne: ɛa eb ɛc ed Co tu się …
25 sort  locale  unicode 




Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.