Jesteśmy małą grupą, która promuje rozpowszechnianie Unicode w Indiach (tutaj starsze kodowania są głęboko zakorzenione). Ale mam problem z konwersją dokumentu w tekście Unicode w dowolnym języku indyjskim do formatu PDF. Tekst jest wyświetlany zgodnie z przeznaczeniem, ale po wklejeniu kopii treść częściowo zmienia się w bełkot.
Używam programu InDesign CC do pisania w systemie Windows 7. Mogę dobrze eksportować do formatu epub. Ale eksportowany plik PDF ma ten problem. Próbowałem także drukować na drukarce Adobe PDF i PrimoPDF, tylko pogorszyło się. Podczas sprawdzania plików PDF w Internecie okazuje się, że ten problem występuje we wszystkich takich kodowanych plikach PDF w formacie Unicode (i prawdopodobnie we wszystkich złożonych skryptach wschodnioazjatyckich). Czy to problem w specyfikacjach PDF?
Sprawdź plik PDF tutaj http://www.rajbhasha.nic.in/pdf/dolebook-4.pdf
Skopiuj dowolny tekst i dopasuj do oryginału, zobaczysz, że znaki są zastępowane innymi znakami, wkradła się niepotrzebna biała spacja.
Teraz promujemy Unicode, ponieważ ułatwi to kopiowanie i wyszukiwanie / indeksowanie. Ten problem całkowicie to niszczy. Jakieś pomysły?
xpdf
. Spojrzałem na plik PDF mutool
, który używa specjalnych czcionek, które nie używają kodowania Unicode. Potrzebujesz innego programu do pisania (zamiast programu InDesign CC) i takiego, który tworzy pliki PDF z kodowaniem Unicode (nie, nie znam żadnej opcji dla Windows 7). To pytanie zawiera szczegółowe informacje techniczne na temat Unicode w PDF, wydaje się możliwe, ale niełatwe.
/ToUnicode
mapowań, ale z jakiegoś powodu nie działają. Nie wiem jeszcze, co poszło nie tak.