Mam wiele plików zip, w których występują błędy kodowania dla niemieckich umlautów (äüöĘÜÖß). Pojawiają się zarówno w pliku filename.zip, jak również w dołączonych katalogach i plikach takich jak ten:
- Fünf = Fu╠ênf
- Räuber = Ra╠êuber
- Überfall = U╠êberfall
i tak dalej. Zwykle używam Linuksa, ale z powodu tych problemów próbowałem również maszyny wirtualnej z systemem Windows7, ale powoduje to ten sam bałagan kodowania. W Linuksie bawiłem się z convmv i detox, ale bez powodzenia.
Kiedy używam
- convmv -f iso-8859-1 -t utf8 --replace --notest -r *
Dostaję komunikat „Pomijanie, już UTF-8”.
Masz jakieś przemyślenia na ten temat?
find -type f -print0 |xargs -r -n1 -0 convmv -f WINDOWS-1252 -t UTF-8 --notest
Znajduje pliki z aktualnego katalogu do przodu i uruchamia convmv osobno dla każdego pliku. Nazwa pliku jest zapisywana jako lista nieaktualna.