Tagging Konventionen

Inhaltsverzeichnis

Überschriften
Absätze
Blockjoker
Inline-Strukturen
Anmerkungen
Listen
Inhaltsverzeichnis, Index
Abbildungen
Tabellen
Tabulatoren
Verweise, Register, Leseprobe
Semantikmodule
Zusammenfassung

pagina Light-DTD im Vergleich zur parsX DTD

Um ein qualitätssicheres Arbeiten zu gewährleisten, wird ein Regelwerk benötigt, nach dem die XML-Dokumente aufgebaut werden müssen. Dieses Regelwerk wird in Form einer Document Type Definition (DTD) bereitgestellt. Darin werden alle vorgesehenen Elemente und Attribute mit ihren möglichen Positionen, Ausprägungen und Vorkommen genau definiert.

Die parsX DTD ist medienneutral aufgebaut und berücksichtigt dabei die Anforderungen von Buchproduktionen. Dadurch bedingt entstehen Strukturen, die sich nur eingeschränkt für die Bearbeitung in Adobe InDesign eignen.

Die pagina Light-DTD für die Arbeit mit dem parsX 3 Plugin verfolgt das Ziel, eine XML-Datenstruktur bereitzustellen, mit der innerhalb von Adobe InDesign komfortabel gearbeitet werden kann. Strukturänderungen und Attribute müssten sonst in Adobe InDesign mühsam über die Strukturansicht durchgeführt werden. Diese Arbeitsschritte sollen möglichst minimiert werden.

Dies bezieht sich im Wesentlichen auf die folgenden generellen Punkte:

Generell gilt dabei:

Bsp.: Einschub 1 parsX DTD

<kapitel>
	<einschub typ="1">
		<abs>Einschub 1 Absatz 1</abs>
		<abs>Einschub 1 Absatz 2</abs>
		<abs>Einschub 1 Absatz 3</abs>
	</einschub>
</kapitel>

Bsp.: Einschub 1 pagina Light-DTD

<kapitel>
	<einschub1 px_position="first">Einschub 1 Absatz 1</einschub1>
	<einschub1>Einschub 1 Absatz 2</einschub1>
	<einschub1 px_position="last">Einschub 1 Absatz 3</einschub1>
</kapitel>

Bsp.: u1 parsX DTD

<kapitel>
	<u-block1>
		<u-vor>u-vor in u1</u-vor>
		<u1>
			<u-zaehler>1.</u-zaehler>
			<u-text>Kapitel</u-text>
		</u1>
		<untertitel>Untertitel zur u1</untertitel>
	</u-block1>
</kapitel>

Bsp.: u1 pagina Light-DTD

<kapitel>
	<u1_u-vor>u-vor in u1</u1_u-vor>
	<u1><u-zaehler>1.</u-zaehler>	Kapitel</u1>
	<u1_untertitel>Untertitel zur u1</u1_untertitel>
</kapitel>

Dieser Aufbau hat den Nachteil, dass Strukturinformationen von Container-Elementen verloren gehen könnten, da diese Informationen am ersten Kindelement des jeweiligen Containers durch Adobe InDesign "hindurchgeschleust" werden müssen. Teilweise kann nicht die volle Komplexität der parsX DTD abgebildet werden.

Anhand der Fehlermeldungen bei der Transformation wird ersichtlich, ob die Dateien eindeutig transformierbar sind (Siehe Import).

Zur besseren Übersicht werden in diesem Dokument die Bezeichnungen

verwendet.

Beim Import der XML-Light mit dem parsX 3 Plugin wird automatisch die jeweilige Light-DTD importiert. So kann die XML-Struktur innerhalb von Adobe InDesign jederzeit auf ihre Gültigkeit überprüft werden. Da die DTD aufwärtskompatibel zur parsX DTD ist, ist sichergestellt, dass die Dokumente wieder in valide pagina XML-Instanzen überführt werden können. 

Da die Light-DTD nicht die volle Komplexität der parsX DTD abbilden kann, kann es bei der Transformation zu Datenverlusten kommen. Diese werden durch Fehlermeldungen während der Transformation dokumentiert. Die abschließende Rückwandlung der validen, exportierten XML-Daten in pagina-XML nach dem Beenden der Satzarbeiten zurück zur parsX DTD stellt dagegen kein Problem dar.

Elemente der pagina Light-DTD

Das Wurzel-Element der Light-DTD lautet zur einfachen Unterscheidung der beiden Instanzen <projekt_indd>. Im Gegensatz zur parsX DTD beinhaltet <projekt_indd> als einziges Kindelement lediglich <werk>. Das Element <projekt_indd> beinhaltet verschiedene Attribute, die zur Steuerung des Imports bzw. für die pagina XML-Plugin-Funktionen benötigt werden.

Da die Metadaten für den Satz kaum Bedeutung haben und innerhalb von Adobe InDesign nur schwer zu pflegen sind, werden sie während der Transformation "parsX-2-light Transformation (für InDesign)" in eine "_LIGHT_META.xml"-Datei ausgelagert. Diese Datei mit den ausgelagerten Metadaten kann beim Export der XML-Datei mit dem parsX 3 Plugin wieder referenziert werden.

Die Kindelemente von <werk> sind identisch zur parsX DTD. Auch hier erfolgt eine Aufteilung in <titelei>-, <vorspann>-, <hauptteil>-, <nachspann>-Elemente. Die Attribute @distinctElementStart bzw. @distinctElementEnd werden für die Auswertung der Elemente in Adobe InDesign benötigt.

Die Verflachung der Elemente wird vor allem bei der Umsetzung von Attributen deutlich. Das Attribut @typ (zum Beispiel in Kombination mit den Elementen <einschub>, <infokasten> usw.) wird mit dem dazugehörigen Element zu einem neuen Element verbunden. So wird <einschub typ="1"> in der Light-DTD zu <einschub1>.

Einschübe bis <einschub typ="15"> werden in der Light-DTD genau wie Absätze als Blocklevel-Elemente umgesetzt.

Infokästen bis <infokasten typ="15"> können in der Light-DTD die Elemente <u-zwischen>, <abs>, <liste_geordnet>, <liste_ungeordnet>, <liste_manuell>, <liste_definition> und <leerzeile> enthalten. Ein <abs> in einem <infokasten typ="1"> wird in der Light-DTD bspw. zu <infokasten1_abs>, <u-zwischen typ="1"> in einem <infokasten typ="3"> wird z.B. in der Light-DTD zu <infokasten3_u-zwischen1>. Die Elemente <liste_geordnet>, <liste_ungeordnet>, <liste_manuell>, <liste_definition> und <leerzeile> in einem Infokasten bleiben unverändert.

Das Element <einschub_vor> ist in der Light-DTD nicht vorgesehen, möchten Sie dennoch einen Einschub vor eine Überschrift setzen, wird dieser zu einem normalen <einschub> transformiert. Hier muss darauf geachtet werden, dass kein einfacher Einschub mit dem gleichen Typ verwendet wird.

Ebenso wird mit Listen verfahren, auch sie werden als Blocklevel-Elemente behandelt. In der Light-DTD sind jeweils fünfzehn geordnete und fünfzehn ungeordnete Listen möglich. Manuelle und Definitionslisten <liste_manuell> und <liste_definition> sind in der Light-DTD ebenfalls möglich. Ein Listenpunkt darf ein oder mehrere Absätze beinhalten.

Beginnt ein Absatz mit einer Initiale und ist daher in der parsX DTD mit <abs><inititale>T</initale>estinhalt</abs> ausgezeichnet, erhält diese Formatierung in der Light-DTD ein eigenes Element und wird zusammengefasst zu <abs_initiale>Testinhalt</abs_initiale>. In den Absatzformatoptionen "Initialen und verschachtelte Formate" kann die Anzahl der Zeilen und die Anzahl der Zeichen, die die Initiale umfassen soll, angegeben werden. Enthält das Element </initiale> das Attribut @quelle, dann kann optional beim XML-Import die Option "Initiale als grafische Initiale (Import einer Bilddatei)" ausgewählt werden.

Folgt ein Absatz <abs> nach Überschriften, Leerzeilen, Infokästen, Einschüben, Listen oder Tabellen, wird dieser in der Light-DTD automatisch mit dem Element <abs_ohne_einzug> und dadurch bereits beim Import typografisch korrekt gesetzt. Ob im Layout ein Erstzeileneinzug gewünscht ist oder nicht, muss bei der Einrichtung der Absatzformatoptionen eingestellt werden.

Für Absätze innerhalb der <titelei> gibt es seit parsX 3 eigene Elemente: <titelei_abs>, <titelei_abs_ohne_einzug> und <titelei_abs_initiale>. Seit der Version 3.1 gibt es zusätzlich noch semantisierte <titelei_abs>-Elemente. Diese neuen Elemente sind: <titelei_abs-titel>, <titelei_abs-untertitel>, <titelei_abs-gattung>, <titelei_abs-autor>, <titelei_abs-co-autoren>, <titelei_abs-herausgeber>, <titelei_abs-uebersetzer>, <titelei_abs-illustrator>, <titelei_abs-kurztext>, <titelei_abs-bio>, <titelei_abs-impressum>, <titelei_abs-copyright>, <titelei_abs-isbn>, <titelei_abs-verlag>, <titelei_abs-widmung>, <titelei_abs-zwischentitel>

Das Überschriftenmodell wird in der Light-DTD deutlich vereinfacht. Statt der Blockstruktur aus der parsX DTD werden die Inhalte dieser Elemente in Adobe InDesign unter <u1> bis <u7> zusammengefasst. Die bei <u-block>-Elementen möglichen <u-vor>- und <untertitel>-Elemente werden verflacht und heißen dann <u1_u-vor> bzw. <u1_untertitel>.

Für <u-zwischen>-Elemente sind in der Light-DTD fünfzehn Typen vorgesehen (<u-zwischen1> bis <u-zwischen15>).

Auch Inline-Elemente werden zusammengefasst: War eine Textstelle in der parsX DTD mit den beiden Tags <fett> und <kursiv> getaggt, entsteht daraus in der Light-DTD das zusammengesetzte Element <fett_kursiv>. Da Adobe InDesign nicht über die Möglichkeit verfügt, einem Textabschnitt mehrere Zeichenformate zuzuweisen, wird über diese Methode ein neues Zeichenformat mit kombinierten Formatierungsattributen definiert und anschließend über das Plugin automatisch zugewiesen. Die Zeichenformatoptionen in den automatisch generierten Zeichenformaten müssen anhand der Satzvorgabe vorgenommen werden.

Für alle Textauszeichnungen, die nicht über die normalen Inline-Elemente (<kursiv>, <fett>, <hoch>, <durchgestr>, ... ) abgebildet werden können, gibt es die Möglichkeit diese Texte über sogenannte Inline-Joker-Elemente zu taggen.

Während die parsX DTD die manuelle (Um-)Platzierung von Abbildungen ohne Verschieben der Quellangaben erlaubt, müssen die Abbildungen in der Light-DTD bereits an der richtigen Stelle im Text platziert sein. Die Konstruktion mit <abb_aufruf> wird in der Light-DTD nicht unterstützt. Für die Positionierung von Abbildungen innerhalb eines Absatzes kann das Element <abb_inline> verwendet werden.

Für Infokästen sind fünfzehn Typen vorgesehen (<infokasten1> bis <infokasten15>). Sie werden als Objektformate sowie entsprechende Absatzformate umgesetzt. Infokästen enthalten in der Light-DTD als Kindelemente nur Absätze, Leerzeilen, Listen und <u-zwischen>-Elemente.

Die Elemente <inhaltsverzeichnis> und <index> entfallen vollständig. Deren Inhalte können in Adobe InDesign sowie im EPUB automatisch generiert werden.

<fussnote>-Elemente der parsX DTD werden in der Light-DTD mit Hilfe der Adobe InDesign-Fußnotenfunktion umgesetzt. Beschränkungen bei den Fußnoten ergeben sich aus den Möglichkeiten der Adobe InDesign-Fußnotenfunktion. So sind z.B. nur bestimmte Nummerierungen bei den Fußnotenzeichen möglich, Adobe InDesign-Fußnoten können keine XML-Elemente enthalten, Fußnoten in Tabellenzellen sind erst ab Adobe InDesign CC 2019 möglich.

<endnote>-Elemente der parsX DTD werden in der Light-DTD über <endnote-aufruf> und <endnote>-Elemente umgesetzt. Je nach Auswahl beim Import werden die <endnote>-Elemente in einem <endnoten_container> am Ende der Kapitel der ersten Ebene im Hauptteil oder im Nachspann umgesetzt. Bei Endnoten im Nachspann:

am Ende des Buchs bzw. eines entsprechenden Nachspannkapitels umgesetzt. Endnoten sind nur im <hauptteil> möglich. Zur Arbeit mit Endnoten stehen eigene pagina XML-Funktionen zur Verfügung.

Marginalien werden in der Light-DTD nicht unterstützt. Auch die Semantikmodule werden für den XML-Satz mit Adobe InDesign nicht umgesetzt und ihre Inhalte bei der Transformation zur Light-DTD verworfen.

In der Light-DTD sind externe und interne Verweise möglich. Bei den internen Verweisen ergeben sich immer dann Einschränkungen, wenn der Verweis oder das Verweisziel aufgrund der Verflachung der XML-Struktur nicht in der Light-DTD umgesetzt werden kann.

Konstruktionen, die nicht in die Light-DTD übernommen werden können, führen während der Transformation zu Fehlermeldungen unterschiedlicher Schweregrade. Diese müssen ausgewertet und entsprechende Lösungswege gefunden werden. Eine ausführliche Beschreibung des Konvertierungsprozesses erhalten Sie in dem Abschnitt Import.