Zachowuję rękopis napisany przez mojego ojca. Pliki danych znajdują się na dyskietce 5.25 ". Z powodzeniem odczytałem pliki z dysków, ale żadne z nas nie wie, w jakim formacie jest język znaczników. Jest używany przez wydawców książek na początku lat 90.
Oto kilka wierszy z jednego z plików.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
Czy ktoś może zidentyfikować używany język znaczników?
Mam zarówno te oryginalne pliki, jak i opublikowaną książkę. Nie byłoby mi bardzo trudno zrozumieć, co oznaczają kody. Ale jeśli format może zostać zidentyfikowany, może być dostępny jakiś automatyczny tłumacz na coś nowszego (RTF, XML itp.).
Edytować
To jak zagadka do rozwiązania! Oto jak zaczyna się stół:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Zrobiłem trochę Googlinga dla takich terminów jak begtab
i setbgut
. W tym ostatnim pojawił się dokument PDF, który wydaje się zawierać literówkę, ale literówka jest setbgut
znacznikiem prawie dokładnie takim, jak ten z moich plików.
http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (wyszukaj setbgut
)
Wygląda na to, że ten dokument badawczy został opracowany przy użyciu tego samego oprogramowania. Wprowadziłem go do programu Acrobat, a właściwości mówią, że został wygenerowany przez Xyvision Parlance Publisher (XPP). Oto najlepsze, jakie dotychczas o nich znalazłem: http://www.isgmlug.org/n2-1/n2-1-49.htm
Edytuj 2
OK, teraz rozumiem. XPP to język znaczników podobny do SGML. W rzeczywistości literatura handlowa XPP reklamuje, jak „łatwo” jest wziąć istniejący dokument SGML i dodać własne zastrzeżone znaczniki. Niestety XPP sprzedano kilka lat temu General Dynamics. Automatyczne tłumaczenie dokumentu, powiedzmy, HTML jest trudne bez DTD. Jednak, jak zauważyli inni, większość tagów łatwo jest rozgryźć. Niektóre z nich, takie jak odniesienia bibliograficzne i wartości po średniku w znacznikach, takich jak <rrh;1>
i <lp;&-1q>
nadal mi umykają. Będę musiał porównać plik z fizyczną wersją papierową obok siebie, aby wszystko zdekodować.
lrh
i rrh
biegną głowami, odpowiednio w lewo i w prawo. xlrh
i xrrh
wyjdź z trybu głowicy biegowej. cn
wyśrodkowuje liczbę gdzie-jako ct
wyśrodkowuje tytuł. ital
przechodzi w tryb kursywy, a med
wraca do trybu średniego. %
rozpoczyna nowy akapit, w którym odwrotny ukośnik kontynuuje akapit. Nie potrafię odgadnąć pozostałych i wprowadziłem kilka wyszukiwanych haseł, ale żadne nie ujawniło formatu ...