Czy istnieje sposób na określenie zestawu znaków używanego dla danego pliku kształtu?
Czy istnieje sposób na określenie zestawu znaków używanego dla danego pliku kształtu?
Odpowiedzi:
Próba i błąd. Spróbuj otworzyć plik .dbf za pomocą Ms Excel lub OpenOffice przy użyciu różnych ustawień, aż wszystko będzie dobrze.
Spójrz na ten post, aby uzyskać więcej wskazówek: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Istnieją dwa sposoby określania zestawu znaków dla pliku kształtu przez programy.
file
Narzędzie jest w stanie odgadnąć, kodowanie pliku tekstowego. Użyj ogr2ogr
do konwersji, która zachowuje oryginalne kodowanie, jeśli nie ma .cpg
pliku :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Przykładowe dane wyjściowe:
file.csv: ISO-8859 text
Przetestowałem to przy użyciu dwóch najczęstszych kodowań, UTF-8 i Latin1. Działa w systemie Ubuntu od razu po instalacji, nie jestem pewien co do systemu OS X. Nie znam file
narzędzia w systemie Windows.
UWAGA : Gdy tylko pojawi się odpowiedni .cpg
plik, który wskazuje kodowanie, ogr2ogr
honoruje go, a wyjście będzie w UTF-8. Ale jeśli wyjście CSV wygląda poprawnie, wiesz, że informacje w .cpg
pliku są dokładne.
Kolejna tabela do konwersji 29. bajtu * .dbf na stronę kodową: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm