Pytania otagowane jako character-encoding

Kodowanie znaków odnosi się do sposobu, w jaki znaki są reprezentowane jako seria bajtów. Kodowanie znaków dla sieci Web jest zdefiniowane w standardzie kodowania.


6
Czy kod ASCII jest 7-bitowy czy 8-bitowy?
Mój nauczyciel powiedział mi, że ASCII to 8-bitowy schemat kodowania znaków. Ale jest zdefiniowany tylko dla kodów 0-127, co oznacza, że ​​może być dopasowany do 7-bitowych. Czy więc nie można argumentować, że bit ASCII jest w rzeczywistości kodem 7-bitowym? A co w ogóle mamy na myśli, mówiąc, że ASCII jest …

7
Jak wiarygodnie odgadnąć kodowanie między MacRoman, CP1252, Latin1, UTF-8 i ASCII
W pracy wydaje się, że żaden tydzień nie mija bez związanej z kodowaniem żałoby, nieszczęścia lub katastrofy. Problem zwykle pochodzi od programistów, którzy uważają, że mogą niezawodnie przetworzyć plik „tekstowy” bez określania kodowania. Ale nie możesz. Postanowiono więc odtąd zabronić plikom kiedykolwiek nazw kończących się na *.txtlub *.text. Uważa się, …



3
JsonParseException: Niedozwolony znak bez cudzysłowu ((CTRL-CHAR, kod 10)
Próbuję użyć org.apache.httpcomponentsRest API, które będzie wysyłać dane w formacie JSON do API. Mam ten wyjątek: Spowodowany przez: com.fasterxml.jackson.core.JsonParseException: Niedozwolony znak bez cudzysłowu ((CTRL-CHAR, kod 10)): musi zostać zmieniony za pomocą odwrotnego ukośnika, aby został uwzględniony w ciągu. Powodem jest to, że ctrl-charjest zawarty w ciągu JSON. Czy jest jakiś …

10
Kompletny zestaw znaków, aby uniknąć „java.nio.charset.MalformedInputException: Input length = 1”?
Tworzę prosty program do liczenia słów w Javie, który czyta pliki tekstowe katalogu. Jednak ciągle otrzymuję błąd: java.nio.charset.MalformedInputException: Input length = 1 z tego wiersza kodu: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Wiem, że prawdopodobnie to rozumiem, ponieważ użyłem Charset znaku, który nie zawierał niektórych znaków w plikach tekstowych, z których niektóre …

2
Ile bitów lub bajtów zawiera znak? [Zamknięte]
Trudno powiedzieć, o co się tutaj pyta. Pytanie to jest niejednoznaczne, niejasne, niekompletne, zbyt szerokie lub retoryczne i nie można na nie rozsądnie odpowiedzieć w obecnej formie. Aby uzyskać pomoc w wyjaśnieniu tego pytania i ponownym otwarciu, odwiedź Centrum pomocy . Zamknięte 9 lat temu . Ile bitów lub bajtów …

9
Odczytywanie pliku CSV UTF8 w Pythonie
Próbuję odczytać plik CSV ze znakami akcentowanymi w języku Python (tylko znaki francuskie i / lub hiszpańskie). W oparciu o dokumentację Pythona 2.5 dla csvreadera ( http://docs.python.org/library/csv.html ) wymyśliłem następujący kod do odczytu pliku CSV, ponieważ csvreader obsługuje tylko ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode …

6
Jak znaleźć domyślny zestaw znaków / kodowanie w Javie?
Oczywistą odpowiedzią jest użycie, Charset.defaultCharset()ale niedawno odkryliśmy, że może to nie być właściwa odpowiedź. Powiedziano mi, że wynik różni się od rzeczywistego domyślnego zestawu znaków używanego przez klasy java.io w kilku przypadkach. Wygląda na to, że Java zachowuje 2 zestawy domyślnego zestawu znaków. Czy ktoś ma jakieś spostrzeżenia w tej …

6
problemy z kodowaniem danych wyjściowych dziennika git w wierszu polecenia systemu Windows 10
Problem Jak git logprawidłowo wyświetlić dane wyjściowe polecenia w wierszu polecenia systemu Windows? Przykład Jak widać, mogę poprawnie wpisywać znaki diakrytyczne, ale na git logwyjściu jest jakoś uciekany. Zgodnie z UTF-8tabelą kodowania kody między nawiasami kątowymi ( <i >) na wyjściu odpowiadają wcześniej wpisanym git configparametrom. Próbowałem ustawić LESSCHARSETzmienną środowiskową …

5
Python: konwersja z ISO-8859-1 / latin1 do UTF-8
Mam ten ciąg, który został zdekodowany z Quoted-printable do ISO-8859-1 za pomocą modułu e-mail. To daje mi ciągi takie jak „\ xC4pple”, które odpowiadałyby „Ępple” (Apple po szwedzku). Jednak nie mogę przekonwertować tych ciągów na UTF-8. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most recent call last): …


7
Konwersja tablicy bajtów na ciąg znaków (Java)
Piszę aplikację internetową w Google App Engine. Pozwala ludziom zasadniczo edytować kod HTML, który jest przechowywany jako .htmlplik w blobstore. Używam fetchData, aby zwrócić byte[]wszystkie znaki w pliku. Próbuję drukować do html, aby użytkownik mógł edytować kod HTML. Wszystko działa świetnie! Oto mój jedyny teraz problem: Tablica bajtów ma pewne …

4
Czy istnieje zestaw plików „Lorem ipsums” do testowania problemów z kodowaniem znaków?
Do tworzenia układu mamy nasz słynny tekst „Lorem ipsum”, aby sprawdzić, jak wygląda. To, czego szukam, to zestaw plików zawierających tekst zakodowany za pomocą kilku różnych kodowań, których mogę użyć w moich testach JUnit, aby przetestować niektóre metody, które zajmują się kodowaniem znaków podczas czytania plików tekstowych. Przykład: Posiadanie ISO …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.