Pytania dotyczące różnych reprezentacji znaków i zestawów znaków, takich jak: ASCII, UTF-8, EBCDIC. Często spotykane podczas przenoszenia plików między systemami operacyjnymi, które kodują nowe wiersze ze znakami powrotu karetki i / lub znakami nowej linii.
Mam plik TXT: $ file -i x.txt x.txt: text/plain; charset=unknown-8bit $ file x.txt x.txt: Non-ISO extended-ASCII text, with CRLF line terminators I niektóre znaki są niepoprawnie zakodowane: trwa³y, sta³y, usuwaæ Jak mogę zmienić kodowanie tego pliku na UTF-8? Do tej pory wypróbowałem następującą metodę: $ iconv -f ASCII -t UTF-8 …
Mam kilka katalogów i podkatalogów, które zawierają pliki ze znakami specjalnymi, takie jak ten plik: robbie@phil:~$ ls test�sktest.txt test?sktest.txt Znajdź ujawnia sekwencję ucieczki: robbie@phil:~$ find test�sktest.txt -ls 424512 4000 -rwxr--r-x 1 robbie robbie 4091743 Jan 26 00:34 test\323sktest.txt Jedynym powodem, dla którego mogę nawet wpisać ich nazwy w konsoli, jest …
Co może być sposobem, aby pobrać listę wszystkich znaków w danej klasy postaci (jak blank, alpha, digit...) w obecnej lokalizacji. Na przykład, LC_ALL=en_GB.UTF-8 that-command blank idealnie, w moim systemie Debian, wyświetlałby coś takiego: 09 U+0009 HORIZONTAL TAB 20 U+0020 SPACE e1 9a 80 U+1680 OGHAM SPACE MARK e1 a0 8e …
Mam plik tekstowy zakodowany w następujący sposób zgodnie z file: Tekst ISO-8859, z zakończeniami linii CRLF Ten plik zawiera tekst francuski z akcentami. Moja powłoka może wyświetlać akcent, aw emacstrybie konsoli jest w stanie poprawnie wyświetlać te akcenty. Mój problem polega na tym more, cati lessnarzędzia nie poprawnie wyświetlić ten …
Ktoś wysłał mi plik ZIP zawierający pliki o hebrajskich nazwach (i utworzony w systemie Windows, nie jestem pewien, z jakim narzędziem). Używam LXDE na Debian Stretch. Menedżerowi archiwum Gnome udało się rozpakować plik, ale hebrajskie znaki są zniekształcone. Wydaje mi się, że rozszerzam oktety UTF-8 na znaki Unicode, np. Mam …
Mam pewne problemy z używaniem sshi zdalnym serwerem (do którego nie mam uprawnień administratora) - W szczególności jest tam kilka folderów z tekstem koreańskim i cyrylicy. Gdy wyświetlam zawartość folderu nadrzędnego za pomocą ls, znaki są oznaczone jako „?”. Być może warto zauważyć, że koreańskie postacie wydają się uciekać znacznie …
Emotikony wydają się być określone przy użyciu formatu U + xxxxx, w którym każdy x jest cyfrą szesnastkową. Na przykład U + 1F615 to oficjalny kod konsorcjum Unicode dla „zdezorientowanej twarzy” 😕 Ponieważ często jestem zdezorientowany, mam silne powinowactwo do tego symbolu. Reprezentacja U + 1F615 jest dla mnie myląca, …
Polecenie cutma opcję -cpracy na znakach zamiast bajtów z tą opcją -b. Ale to wydaje się nie działać, na poziomie en_US.UTF-8lokalnym: Drugi bajt podaje drugi znak ASCII (który jest tak samo zakodowany w UTF-8): $ printf 'ABC' | cut -b 2 B ale nie podaje drugiego z trzech greckich znaków …
Chciałem wypisać ciąg wszystkich znaków ascii za pomocą następującego polecenia for i in `seq 32 127`; do printf "%c" $i; done Dane wyjściowe powyższego polecenia to: 33333334444444444555555555566666666667777777777.............. Jest to pierwsza (od lewej) cyfra każdego numeru. Przeglądając tę stronę natknąłem się na odpowiedź na mój problem. Jak wydrukować wszystkie drukowalne znaki …
Podczas próby przekonwertowania pliku tekstowego na jego odpowiednik ASCII pojawia się komunikat o błędzie iconv: illegal input sequence at position. Polecenie, którego używam, to iconv -f UTF-8 -t ascii//TRANSLIT file Obrażającą postacią jest æ. Sam plik tekstowy jest tutaj obecny . Dlaczego mówi nielegalna sekwencja? Znak wejściowy jest prawidłowy UTF-8 …
Wiem vim -bjednak, że w zależności od zastosowanych ustawień regionalnych wyświetla znaki wielobajtowe (jak UTF-8) jako pojedyncze litery. Jak mogę poprosić vimo wyświetlanie tylko znaków drukowalnych ASCII, a resztę traktować jak dane binarne, bez względu na zestaw znaków?
Korzystam z wget, aby pobrać statyczną stronę HTML. W3C Validator mówi mi, że strona jest zakodowana w UTF-8. Kiedy jednak cat pobiera plik po pobraniu, dostaję binarne bzdury. Jestem na Ubuntu i myślałem, że domyślnym kodowaniem jest UTF-8? Tak właśnie wygląda mój plik ustawień regionalnych. Dlaczego tak się dzieje i …
Napisałem norweski dokument przeceny: $ file brukerveiledning.md brukerveiledning.md: UTF-8 Unicode text Przekształciłem go na HTML za pomocą markdownpolecenia: $ markdown > brukerveiledning.html < brukerveiledning.md $ file brukerveiledning.html brukerveiledning.html: UTF-8 Unicode text Jednak Firefox nalega na użycie kodowania „windows-1252”, łamiąc znaki inne niż ASCII. Próbowałem zmienić kodowanie tekstu zastępczego z „Domyślne …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.