Pytania otagowane jako byte-order-mark

Znak kolejności bajtów (BOM) to znak Unicode używany do sygnalizowania kolejności bajtów w pliku tekstowym lub strumieniu. Ponieważ BOM to U + FEFF, jest jasne, czy bajty wyższego rzędu są pierwsze (strumień zaczyna się od FE.FF) czy drugie (strumień zaczyna się od FF.FE).



4
Zapisz do pliku UTF-8 w Pythonie
Jestem naprawdę mylony z codecs.open function. Kiedy robię: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Daje mi to błąd UnicodeDecodeError: Kodek „ascii” nie może dekodować bajtu 0xef w pozycji 0: porządek poza zakresem (128) Jeśli zrobię: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() To działa dobrze. Pytanie brzmi, dlaczego pierwsza metoda …


10
UTF-8 bez BOM
Mam pliki javascript, których potrzebuję, aby je zapisać w UTF-8 (bez BOM), za każdym razem, gdy przekonwertuję je na właściwy format w Notepad ++ , są one przywracane z powrotem do UTF-8 z BOM, gdy otwieram je w Visual Studio. Jak mogę powstrzymać VS2010 przed zrobieniem tego? Kolejne pytanie, czy …



8
Znacznik kolejności bajtów utrudnia odczyt plików w Javie
Próbuję odczytać pliki CSV przy użyciu języka Java. Niektóre pliki mogą mieć znacznik kolejności bajtów na początku, ale nie wszystkie. Gdy występuje, kolejność bajtów jest odczytywana wraz z resztą pierwszego wiersza, powodując w ten sposób problemy z porównaniami łańcuchów. Czy istnieje łatwy sposób na pominięcie znaku kolejności bajtów, gdy jest …



6
Konwertuj UTF-8 z BOM na UTF-8 bez BOM w Pythonie
Tutaj dwa pytania. Mam zestaw plików, które zwykle są w formacie UTF-8 z BOM. Chciałbym je przekonwertować (najlepiej na miejscu) do UTF-8 bez BOM. Wygląda na to, codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors)że poradzi sobie z tym. Ale tak naprawdę nie widzę dobrych przykładów użycia. Czy byłby to najlepszy sposób …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.