Pytania dotyczące różnych reprezentacji znaków i zestawów znaków, takich jak: ASCII, UTF-8, EBCDIC. Często spotykane podczas przenoszenia plików między systemami operacyjnymi, które kodują nowe wiersze ze znakami powrotu karetki i / lub znakami nowej linii.
Aplikacja z rosyjskim interfejsem użytkownika wyświetla większość znaków zapytania (niektóre elementy są renderowane poprawnie). Ustawienia regionalne systemu to angielski (en_US, en_IE), próbowałem Ubuntu i XUbuntu 12.04 z Wine 1.5. Próbowałem uruchomić aplikację za pomocą LANG=ru_RU.utf8 wine myapp.exe ale to nie pomaga. Sprawdziłem również, czy ttf-mscorefonts-installerjest zainstalowany. Jeśli korzystam z systemu …
Ze względu na dużą wymianę plików między systemem Windows ( kodowanie GBK ) a Linuksem ( kodowanie UTF-8 ) łatwo napotka problemy związane z kodowaniem znaków, takie jak: Pliki zip / tar, których nazwa zawiera chińskie znaki w systemie Windows, rozpakuj / rozpakuj w systemie Linux. uruchom migrowaną starszą aplikację …
Jako programista języka C zdziwiłem się, widząc, że wc -c(która liczy liczbę bajtów) i wc -m(która liczy liczbę znaków) generują bardzo różne wyniki dla mojego długiego pliku tekstowego. Zawsze mi mówiono, że sizeof(char)to 1 bajt. qdii@nomada ~/Documents $ wc -c sentences.csv 102990983 sentences.csv qdii@nomada ~/Documents $ wc -m sentences.csv 89023123 …
POSIX definiuje zachowanie narzędzi takich jak grep, awk, seditp, które pracują na plikach tekstowych. Ponieważ jest to plik tekstowy, myślę, że występują problemy z kodowaniem znaków. Pytanie: Jakie kodowanie znaków jest obsługiwane przez POSIX? (lub pliki tekstowe, jakie kodowanie może być obsługiwane przez systemy z kompilatorem POSIX?)
Podczas próby wysłania pliku tekstowego do drukarki za pośrednictwem lprz xterm, treść została uszkodzona nie do poznania, czego przyczyną ostatecznie było kodowanie pliku. Jeśli zamiast tego przetwarzam tekst za pomocą iconv(np. iconv -f utf-8 -t ascii//TRANSLIT), Plik jest drukowany normalnie. Inną sugestią, na jaką natknąłem się, jest ustawienie formatu dokumentu …
W niektórych programach, takich jak htoplinie i ramki, nie są wyświetlane poprawnie. Zamiast tego są wyświetlane jako -i /. Ale na innym komputerze są one wyświetlane poprawnie jako odpowiednie linie: Nie jestem pewien, czy jest to problem z terminalem, czy może jakiś pakiet jest potrzebny. W przypadku, gdy jest to …
Próbuję dowiedzieć się, jak $LANGzachowuje się zmienna z gnome-terminalem (i opcją preferencji kodowania znaków). Używam iso8859-1 (latin1) jako mojego głównego zestawu znaków i wszystkie moje nazwy plików są zakodowane jako takie. Dla następujących testów zrobię ls -lkatalog z hiszpańskimi znakami akcentowanymi w nazwach plików: Przypadek 1: terminal gnome skonfigurowany dla …
Podczas pracy z kolegą znalazłem dziwny problem, który wydaje się związany z kodowaniem. Pracujemy z niektórych obrazów, które mają dość proste nazwy plików, takich jak city.gifczy wine.gif, ale jak można się spodziewać rzeczy uzyskać bardziej skomplikowane przy użyciu znaków specjalnych, takich jak é, ë, à. Pracujemy również z danymi holenderskimi, …
Pliki programu Excel można przekonwertować na CSV przy użyciu: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Wszystko wydaje się działać dobrze. Kodowanie jest jednak ustawione na coś dziwnego. Zamiast mdash UTF-8 (-), który otrzymuję, jeśli wykonam ręcznie „zapisz jako” z LibreOffice Calc, daje mi \ 227 ( ). Użycie …
Problem polega na tym, że klucz tworzenia działa dobrze, ale niektóre aplikacje nie akceptują niektórych znaków. Np. Mogę wpisać znak ∞w Emacsie ( Compose+ 8+ 8), ale to nie zadziała w FireFox, Konsole i Kate. Ale wiele innych znaków, np. €Wpisanych tam (w FireFox, Konsole i Kate) z Compose, działa …
Próbuję zidentyfikować dziwną postać, którą znalazłem w pliku, z którym pracuję: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 Plik korzysta z kodowania ISO-8859 i nie można go przekonwertować na format UTF-8: $ …
Mam niewielki problem z bardzo upartym błędem podczas rsync. Jest to spowodowane plikiem ze znakiem specjalnym w nazwie pliku. Były inne, ale mogłem to rozwiązać, dokonując konwersji w kodowaniu nazwy pliku. Jednak tego jednego pliku nawet nie mogę znaleźć. Oto, co mówi rsync: ../.\#033OA.tex.pyD0MB" failed: No such file or directory …
Zastanawiałem się, dlaczego jeśli otworzysz plik tekstowy utworzony w Notatniku Windows pod Uniksem, przekonasz się, że ma on ^Mtam, gdzie powinna być nowa linia? Rozumiem, że w systemie Windows każda linia jest zakończona \r\n, tj. 0x0D0AW ASCII, podczas gdy ^Mma wartość ASCII 0x5E4D. Nie mogę powiązać tych dwóch ze sobą.
Zainstalowałem treena moim Ubuntu Box, kiedy łączę się z nim z Putty i uruchamiam, treeotrzymuję: $ tree âââ html.vim -> xml.vim âââ js.vim -> xml.vim âââ xml.vim zamiast tego : $ tree --charset=ANSII |-- html.vim -> xml.vim |-- js.vim -> xml.vim `-- xml.vim Ten problem pojawia się również wtedy, gdy …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.