Do tworzenia układu mamy nasz słynny tekst „Lorem ipsum”, aby sprawdzić, jak wygląda.
To, czego szukam, to zestaw plików zawierających tekst zakodowany za pomocą kilku różnych kodowań, których mogę użyć w moich testach JUnit, aby przetestować niektóre metody, które zajmują się kodowaniem znaków podczas czytania plików tekstowych.
Przykład:Posiadanie ISO 8859-1
zakodowanego pliku testowego i Windows-1252
zakodowanego pliku testowego. Windows-1252 musi wywołać różnice w regionie 80 16 - 9F 16 . Innymi słowy, musi zawierać co najmniej jeden znak z tego regionu, aby odróżnić go od ISO 8859-1.
Być może najlepszym zestawem plików testowych jest ten, w którym plik testowy dla każdego kodowania zawiera raz wszystkie swoje znaki. Ale może nie jestem tego świadomy - wszyscy lubimy to kodowanie, prawda? :-)
Czy istnieje taki zestaw plików testowych do rozwiązywania problemów z kodowaniem znaków?