Mam plik HTML z dużą ilością zakodowanego w% tekstu UTF-8 w adresach URL.
Na przykład „% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B” oznacza „ресурсы” („zasoby” w języku rosyjskim).
Zadanie polega na zastąpieniu wszystkich takich podciągów czytelnym tekstem UTF-8.
Aby uprościć zadanie, możemy uznać, że %
w pliku nie ma innego użycia znaku. Cyfry literowe mogą być zarówno dużymi, jak i małymi literami.
Podejrzewam, że można to zrobić elegancko sed
, perl
, awk
czy coś, ale nie wiem jak.
Wygląda na to, że ta aplikacja internetowa rozwiązuje problem z wklejanym tam tekstem.