Jesteśmy małą grupą, która promuje rozpowszechnianie Unicode w Indiach (tutaj starsze kodowania są głęboko zakorzenione). Ale mam problem z konwersją dokumentu w tekście Unicode w dowolnym języku indyjskim do formatu PDF. Tekst jest wyświetlany zgodnie z przeznaczeniem, ale po wklejeniu kopii treść częściowo zmienia się w bełkot.
Używam programu InDesign CC do pisania w systemie Windows 7. Mogę dobrze eksportować do formatu epub. Ale eksportowany plik PDF ma ten problem. Próbowałem także drukować na drukarce Adobe PDF i PrimoPDF, tylko pogorszyło się. Podczas sprawdzania plików PDF w Internecie okazuje się, że ten problem występuje we wszystkich takich kodowanych plikach PDF w formacie Unicode (i prawdopodobnie we wszystkich złożonych skryptach wschodnioazjatyckich). Czy to problem w specyfikacjach PDF?
Sprawdź plik PDF tutaj http://www.rajbhasha.nic.in/pdf/dolebook-4.pdf
Skopiuj dowolny tekst i dopasuj do oryginału, zobaczysz, że znaki są zastępowane innymi znakami, wkradła się niepotrzebna biała spacja.
Teraz promujemy Unicode, ponieważ ułatwi to kopiowanie i wyszukiwanie / indeksowanie. Ten problem całkowicie to niszczy. Jakieś pomysły?
xpdf. Spojrzałem na plik PDF mutool, który używa specjalnych czcionek, które nie używają kodowania Unicode. Potrzebujesz innego programu do pisania (zamiast programu InDesign CC) i takiego, który tworzy pliki PDF z kodowaniem Unicode (nie, nie znam żadnej opcji dla Windows 7). To pytanie zawiera szczegółowe informacje techniczne na temat Unicode w PDF, wydaje się możliwe, ale niełatwe.
/ToUnicodemapowań, ale z jakiegoś powodu nie działają. Nie wiem jeszcze, co poszło nie tak.