Pytania otagowane jako character-encoding

Kodowanie znaków odnosi się do sposobu, w jaki znaki są reprezentowane jako seria bajtów. Kodowanie znaków dla sieci Web jest zdefiniowane w standardzie kodowania.


3
Jak usunąć znaki inne niż UTF-8 z pliku tekstowego
Mam kilka plików arabskich, angielskich i rosyjskich zakodowanych w utf-8. Próbując przetworzyć te pliki za pomocą skryptu Perla, pojawia się ten błąd: Malformed UTF-8 character (fatal) Ręczne sprawdzanie zawartości tych plików znalazłem w nich dziwne znaki. Teraz szukam sposobu, aby automatycznie usunąć te znaki z plików. Czy w ogóle można …


3
Java: Konwersja ciągu znaków do iz ByteBuffera i powiązane problemy
Używam Java NIO do połączeń przez gniazdo, a mój protokół jest oparty na tekście, więc przed zapisaniem ich w SocketChannel muszę być w stanie przekonwertować ciągi znaków na ByteBuffers i przekonwertować przychodzące ByteBuffers z powrotem na ciągi. Obecnie używam tego kodu: public static Charset charset = Charset.forName("UTF-8"); public static CharsetEncoder …

1
Dekodowanie Pythona Unicode nie jest obsługiwane
Mam problem z kodowaniem w Pythonie. Próbowałem różnych metod, ale nie mogę znaleźć najlepszego sposobu na zakodowanie mojego wyjścia do UTF-8. Oto, co próbuję zrobić: result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGooglezwraca pierwszy wynik Google dla zapytania param. Oto błąd, który otrzymuję: exceptions.TypeError: decoding Unicode is not supported Czy ktoś wie, jak …



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.