Co to za język znaczników? (ok. 1991)


19

Zachowuję rękopis napisany przez mojego ojca. Pliki danych znajdują się na dyskietce 5.25 ". Z powodzeniem odczytałem pliki z dysków, ale żadne z nas nie wie, w jakim formacie jest język znaczników. Jest używany przez wydawców książek na początku lat 90.

Oto kilka wierszy z jednego z plików.

\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\

Czy ktoś może zidentyfikować używany język znaczników?

Mam zarówno te oryginalne pliki, jak i opublikowaną książkę. Nie byłoby mi bardzo trudno zrozumieć, co oznaczają kody. Ale jeśli format może zostać zidentyfikowany, może być dostępny jakiś automatyczny tłumacz na coś nowszego (RTF, XML itp.).

Edytować

To jak zagadka do rozwiązania! Oto jak zaczyna się stół:

<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>

Zrobiłem trochę Googlinga dla takich terminów jak begtabi setbgut. W tym ostatnim pojawił się dokument PDF, który wydaje się zawierać literówkę, ale literówka jest setbgutznacznikiem prawie dokładnie takim, jak ten z moich plików.

http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (wyszukaj setbgut)

Wygląda na to, że ten dokument badawczy został opracowany przy użyciu tego samego oprogramowania. Wprowadziłem go do programu Acrobat, a właściwości mówią, że został wygenerowany przez Xyvision Parlance Publisher (XPP). Oto najlepsze, jakie dotychczas o nich znalazłem: http://www.isgmlug.org/n2-1/n2-1-49.htm

Edytuj 2

OK, teraz rozumiem. XPP to język znaczników podobny do SGML. W rzeczywistości literatura handlowa XPP reklamuje, jak „łatwo” jest wziąć istniejący dokument SGML i dodać własne zastrzeżone znaczniki. Niestety XPP sprzedano kilka lat temu General Dynamics. Automatyczne tłumaczenie dokumentu, powiedzmy, HTML jest trudne bez DTD. Jednak, jak zauważyli inni, większość tagów łatwo jest rozgryźć. Niektóre z nich, takie jak odniesienia bibliograficzne i wartości po średniku w znacznikach, takich jak <rrh;1>i <lp;&-1q>nadal mi umykają. Będę musiał porównać plik z fizyczną wersją papierową obok siebie, aby wszystko zdekodować.


To nie jest TeX, RTF ani SGML. Czy wiesz, czy został napisany ręcznie, czy wygenerowany przez edytor tekstu?
Kevin Reid,

1
Prawdopodobnie odręcznie. Znaczniki są zbyt zwięzłe, aby można je było wygenerować komputerowo. Być może został napisany przez program komputerowy, który pozwala użytkownikowi na bardzo precyzyjną kontrolę nad kodami formatującymi - co byłoby o krok od ręcznego kodowania.
Barry Brown,

1
Rozszerzenie nazwy pliku bardzo by pomogło.
Joel Coehoorn

szybkie przekreślanie wyklucza XyWrite i wordstar (używa kodów kropkowych). Może jego słowo jest doskonałe?
Journeyman Geek

4
lrhi rrhbiegną głowami, odpowiednio w lewo i w prawo. xlrhi xrrhwyjdź z trybu głowicy biegowej. cnwyśrodkowuje liczbę gdzie-jako ctwyśrodkowuje tytuł. italprzechodzi w tryb kursywy, a medwraca do trybu średniego. %rozpoczyna nowy akapit, w którym odwrotny ukośnik kontynuuje akapit. Nie potrafię odgadnąć pozostałych i wprowadziłem kilka wyszukiwanych haseł, ale żadne nie ujawniło formatu ...
Tamara Wijsman,

Odpowiedzi:


4

Znalazłem ten plik PDF w Xyvision Production Publisher (który prawdopodobnie został użyty). Uwaga w obszarze FinalPages wyświetla HTML jako format wyjściowy.

Jeśli mógłbyś w jakiś sposób uruchomić kopię jakiejś wersji tego oprogramowania, być może będziesz w stanie wypluć trochę HTML. To może, ale nie musi być trudniejsze niż inżynieria wsteczna znaczników dokumentów. Na samym dole tej strony jest nieco więcej informacji na temat eksportu HTML .

wprowadź opis zdjęcia tutaj


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.