Mam plik TXT:
$ file -i x.txt
x.txt: text/plain; charset=unknown-8bit
$ file x.txt
x.txt: Non-ISO extended-ASCII text, with CRLF line terminators
I niektóre znaki są niepoprawnie zakodowane:
trwa³y, sta³y, usuwaæ
Jak mogę zmienić kodowanie tego pliku na UTF-8? Do tej pory wypróbowałem następującą metodę:
$ iconv -f ASCII -t UTF-8 x.txt
puiconv: illegal input sequence at position 4
Może powinienem w jakiś sposób użyć extended ASCII
( high ASCII
), ale nie mogę go znaleźć na iconv
liście kodowania.
iconv -f windows-1252 -t utf-8 file