Änderungen von 1.1.3 ZU 2.0.0

Dieses Kapitel ist für Anwender geschrieben, welche die Vorgänger-Version parsX 1.1.3 bereits kennen. Es beschränkt sich auf die Änderungen, die bei der Entwicklung der neuen Version parsX 2.0.0 vorgenommen wurden. Anwender, welche die Vorgänger-Version noch nicht kennen, können sich in den nachfolgenden Kapiteln ELEMENTE und ANHANG in die Anwendung einarbeiten. Eine weitere Dokumentation ist hierzu nicht notwendig. Sämtliche benötigten Informationen sind in diesen Kapiteln zusammengestellt. Zur Veranschaulichung ist jedoch die Referenzumsetzung parsx_2.1.0_referenzumsetzung.xml hilfreich. Sie enthält Codebeispiele zu allen Strukturen der XML Anwendung.

VERSION

NEU: Das neue @version-Attribut kennzeichnet mit dem Wert "2.0" das Dokument als Instanz der parsX DTD in der Version 2.x. Das neue Attribut ist verpflichtend.

[Achtung]Achtung

HINWEIS:

Da das Attribut verpflichtend ist, kann eine Datei ohne das @version-Attribut nur eine Instanz der alten DTD sein. So lange es keine neuere Version der DTD gibt, ist als einziger Wert 2.0 zugelassen.

Das neue Framework 2.0 mit den Modulen InDesign PlugIn, E-Book-Konverter und DokuChecker, verarbeitet ausschließlich Dateien der Version 2.0. Zum Verarbeiten alter Dateien muss auch weiterhin der alte Framework benutzt werden. In der Regel werde die alten Daten jedoch vor der Verarbeitung einfach in die neue Version konvertiert, so dass keine Probleme durch Inkompatibilität entstehen.

META

ANPASSUNG: Es können nun mehrere <meta_ausgabe>-Elemente für verschiedene Publikationen angelegt werden. Weitere verlagsspezifische Metadaten innerhalb des Elements dienen dem Beschreiben des jeweiligen Publikationsformates. Sie können von jedem Verlag individuell festgelegt werden. Die Deklaration dieser individuellen Strukturen erfolgt nach Beauftragung in dem DTD-Modul meta.ent.

[Achtung]Achtung

ACHTUNG:

Mit Ausnahme des <meta_isbn>-Elementes dürfen die Metadaten des Publikationsformates ausschließlich vom Verlag ausgefüllt werden!

ANPASSUNG: <meta_e-bio>, <meta_e-kurztext> und <meta_e-copyright> erhalten Kapitel-Charakter. Sie dürfen nun neben einfachem Text auch Leerzeilen, Abbildungen und eine <u1>-Überschrift enthalten. Der Fließtext wird nun mit <e-abs>-Elementen strukturiert.

Des Weiteren sind die Elemente <meta_e-bio> und <meta_e-kurztext> nicht mehr verpflichtend. Sie sollen entfallen, sofern es zu dem Werk keine entsprechenden Inhalte gibt. Das Element <meta_e-copyright> ist dagegen weiterhin verpflichtend und muss immer ausgefüllt werden.

Alle texttragenden Elemente innerhalb von <meta> enthalten nun das vollwertige Inhaltsmodell von normalem Fließtext, wodurch auch die Angabe zur Ausrichtung, die Verwendung von Inlineauszeichnungen und das Einbringen von Verweisen möglich ist.

TITELEI

ANPASSUNG: Seiten zwischen der Impressumseite und dem Vorspann werden jetzt als Seite der Titelei getaggt. Eine Seite mit wiederholtem Werktitel kann so als "Zwischentitel" gekennzeichnet werden.

JOKERELEMENTE/TYPEN

NEU: Ein neuer Blockjoker <einschub_innen> ermöglicht die Verschachtelung von Einschüben in zwei Ebenen.

NEU: Ein weiterer neuer Blockjoker <fn-einschub> ermöglicht das Strukturieren von Einschüben in Fussnoten.

Die beiden neuen Einschübe werden analog zu <u-zwischen>, <infokasten>, <einschub_vor> und <einschub> im <blockjoker>-Element mit Fundstelle und Erläuterung in den Metadaten dokumentiert.

Einschübe und Infokästen dürfen nicht mehr innerhalb von <abs>-Elementen stehen. Mit <einschub_aufruf> und <infokasten_aufruf> kann analog zum <abb_aufruf> eine Position im Fließtext markiert werden, an die ein nachfolgender <einschub> bzw. <infokasten> im Satz verankert werden soll. Die Verbindung erfolgt über einen eindeutigen Bezeichner im @sprung- und im @sprungziel-Attribut der zusammengehörigen Elemente.

Neben den Blockjokern sind jetzt auch die meisten regulären Blockelemente typisierbar. So können beispielsweise auch von Kapiteln und Überschriften bis zu 15 abweichende Varianten der Formatierung festgelegt werden.

Die typisierten Elemente müssen mit dem neuen <typjoker>-Element innerhalb von <jokereinsatz> dokumentiert werden.

LESEPROBE/EBOOK

NEU: Inhaltsverzeichnisse, Kapitel, Akte, Aufzüge und Zwischenblätter können per Attribut als Leseprobe markiert werden. Soll die Leseprobe innerhalb eines Elements enden, kann auf Absatzebene ein <leseprobe_ende> gesetzt werden. Der weitere Inhalt des Kapitels nach diesem Element, wird nicht mehr in die Leseprobe aufgenommen. Das Unterbrechen der Leseprobe innerhalb eines Absatzes ist nicht zulässig.

Über ein neues Attribut @ebook bzw. @print, können Elemente für die Printausgabe oder das E-Book unterdrückt werden (print="nein" bzw. ebook="nein"). Die Attribute sind bereits durch einen Standardwert ja standardmäßig vorbelegt.

TOCTITEL

Im @toctitel-Attribut kann für ein Kapitel und für kapitelähnliche Strukturen, ein alternativer Titel festgelegt werden. Der Titel ist nicht Bestandteil des Inhaltes und taucht im Print nicht auf. Er wird jedoch bei der Produktion von E-Books herangezogen. An Stelle des üblichen Titels (dieser ergibt sich normalerweise aus der Überschrift oder aber aus einer Einstellung im config-File) wird der Inhalt des @toctitel-Attributes ausgegeben.

Das Festlegen eines TOC-Titels ist redaktionelle Aufgabe. So ist zum Beispiel das Kürzen einer sehr langen Überschrift denkbar, um eine bessere Darstellung im TOC des E-Books zu erreichen.

INLINE-AUSZEICHNUNGEN

NEU: Das neue Inline-Element <durchgestr> ermöglicht das Formatieren von Textteilen als durchgestrichen.

An Stelle der bisher eingesetzten PI werden Ziffern und Zifferfolgen nun mit einem Element <ziffer> ausgezeichnet.

NEU: Mit Hilfe des <fremd>-Elements können fremdsprachige Textpassagen gekennzeichnet werden. Die Codierung der Landessprache erfolgt mit zweistelligen Sprachcodes entsprechend der RFC 4646 Norm, wie beispielsweise "en" für Englische Texte.

NEU: Das <versal>-Element erhält ein Attribut @aussprache. Durch die Werte "wort" und "buchstabe" kann unterschieden werden, ob die Abkürzung buchstabiert wird (zum Beispiel KGB) oder als Wort ausgesprochen wird (NASA). Dies dient der Steuerung der Aussprache von Screenreadern.

ANPASSUNG: Durch Eine Änderung des Inhaltsmodells der Inlinesauszeichnungen, muss eine Textauszeichnung mit Initialen jetzt nicht mehr unterbrochen werden. So kann zum Beispiel ein <initiale>-Element innerhalb von <kursiv> stehen.

ABS

NEU: Ein neues @stumpf-Attribut dient beim Einsatz des Wertes ja dem Auszeichnen von Absätzen, die in Abweichung zur Satzanweisung stumpf dargestellt werden sollen. Beim Einsatz des Wertes nein, werden Absätze in Abweichung zur Satzanweisung mit hängendem Einzug dargestellt. Das Attribut darf nur gesetzt werden, wenn sich die Abweichung zur Satzanweisung nicht durch eine Regel beschreiben lässt. Die Darstellung von stumpfen Absätzen nach Überschriften, Tabellen und Listen bleibt also weiterhin Aufgabe des Satzsystemes.

NEU: Mit dem neuen @ebook-Attribut kann der Absatz im E-Book durch Setzen des Wertes nein ausgeblendet werde. Im neuen @print-Attribut kann der Absatz im Print durch Setzen des Wertes nein ausgeblendet werden. Die beiden Attribute werden durch einen Standardwert ja bereits vorbelegt.

ANPASSUNG: Absätze dürfen keine Infokästen oder Einschübe mehr enthalten. Stattdessen werden die neuen Elemente <einschub_aufruf>, bzw. <infokasten_aufruf> analog zu dem bereits bekannten <abb_aufruf>-Element eingesetzt.

Sowohl die neuen, wie auch die alten Attribute @sprungziel und @ausricht sind weiterhin optional.

ÜBERSCHRIFTEN

ANPASSUNG: Überschriften sind jetzt typisierbar:

Die Überschriften-Elemente <u1> bis <u7> stimmen in der Regel die logische Hierarchie des Werkes überein. Diese logische Hierarchie des Werkes, ergibt sich aus der Schachtelung der <kapitel>-Elemente. In seltenen Fällen weichen die Überschriften jedoch von der logischen Hierarchie ab 8etwa wenn vor <u1> "Erster Teil" eine <u2> "Vorbemerkung" kommt). Gibt es innerhalb einer logischen Überschriftsebene unterschiedliche Gestaltungen, wie zum Beispiel ein kleinerer Schriftgrad im Nachspann, oder die Kursivierung des Herausgebertitels, so können diese jetzt mit @typ unterschieden werden.

ANPASSUNG: <navtitel> können nun mit @pos für linke und rechte Seiten, sowie für die Mitte getrennt angegeben werden.

FUSS-/ENDNOTEN

ANPASSUNG: Tabellen stehen zwischen <fn-abs>-Elementen, statt wie bisher innerhalb von <fn-abs>.

ANPASSUNG: In Fuss- und Endnoten können nun auch Abbildungen, Gedichte und das neue Element <fn-einschub> verwendet werden.

INHALTSVERZ

ANPASSUNG: <inh-eintrag> muss nun immer mit dem Eintrag selbst beginnen, der aus Zähler, Text, und Seitenzahl besteht. Im Anschluss können weitere Untereinträge stehen. Eine Verschachtelung von Text und Untereinträgen wird so unterbunden.

LISTEN

ANPASSUNG: In geordneten und ungeordneten Listen stehen die Einträge nun direkt in der Liste. Das <le-zaehler> ist hier nicht mehr zulässig, da dieser in jedem Fall automatisch generiert wird.

NEU: Mit dem @start-Attribut kann in geordneten Listen ein Ausgangswert für den automatischen Zähler festgelegt werden, um unterbrochene Listen fort zu führen. Unabhängig vom Zählertyp, ist der Wert des @start-Attributes immer eine arabische Ziffer. Soll also beispielsweise die Zählung eine unterbrochende mit Kleinbuchstaben nummerierte Liste beim buchstaben "c" wieder aufgenommen werden, muss das @start-Attribut auf den Wert "3" gesetzt werden.

ANPASSUNG: In <liste_manuell> ist die Angabe des Zählers nun obligatorisch. Der Name des Listeneintrag wurde auf <lm-le> geändert (dies steht für Liste manuell Listeneintrag).

NEU: Im neuen @ebook-Attribut kann die Liste im E-Book mit dem Wert 'nein' ausgeblendet werden. Im neuen @print-Attribut kann die Liste im Print mit dem Wert 'nein' ausgeblendet werden. Beide Attribute sind durch den Standardwert ja bereits vorbelegt.

ANPASSUNG: Das alte @ID-Attribut wurde umbenannt in @sprungziel. Sowohl die neuen, wie auch die alten Attribute @typ und @sprungziel sind weiterhin optional.

NEU: Das neue <liste_definition>-Element dient dem Auszeichnen von zwei zusammengehörigen Inhalten, die dem Sinn nach der Form "Begriff - Beschreibung" entsprechen. Die Struktur der Definitionsliste entspricht im Wesentlichen der manuellen Liste, ist aber semantisch weiter gefasst.

NEU: Das Element <ld-le> dient dem Gruppieren eines Begriffs mit dessen Beschreibung. Dies steht für Liste definition Listen Element. Das Element <le-begriff> enthält den zu beschreibenden Begriff. das Element <le-eintrag> enthält die Beschreibung des Begriffs. Zum Taggen von Glossaren und ähnlichen Inhalten, wird je einem Begriff oder einer Jahres-, Seitenzahl etc. ein erklärender Text zugeordnet. Es muss in diesen Fällen nicht mehr eine Tabelle angelegt werden. Generell sollen zweispaltige Tabellen überprüft werden, ob sie ausschließlich zu Darstellungszwecken als Tabellen umgesetzt wurden. In diesem Fall bietet sich eine Strukturierung als Definitionsliste an.

ANPASSUNG: Alle Listen können jetzt typisiert werden.

INDEX

NEU: <index-eintrag> enthält ein <ix-text>-, und optional ein <ix-referenz>-Element, innerhalb dessen Inlineauszeichnungen und beliebig viele <ix-verweis>-Elemente zulässig sind.

<ix-referenz> dient als Container- Element zum Gruppieren aller <ix-verweis>-Elemente. So können z-B. Seitenverweise wie "15-16, 19ff., 123" getaggt und verlinkt werden.

<index-abschnitt> kann zuerst eine Überschrift haben, dann folgen Index-Einträge und am Schluss gegebenenfalls Unterabschnitte.

<index-eintrag> beginnt mit einem <ix-text> und kann am Ende weitere Untereinträge enthalten. Eine Mischung von Text und Untereinträgen wird so unterbunden.

Geändert in Version 3.0:

REGISTERMARKIERUNGEN

Die DTD sieht ein ganzes Set von Elementen zum Markieren von Registerfundstellen im Text, sowie deren Zuordnung zu Registerbegriffen vor. Das eigentliche Register wird als <index> umgesetzt (s. Kapitel 3.13).

Mit dem <reg_ort typ="1">-Element können durch die Typisierung mehrere Ortsregister aufgerufen werden. Die Dokumentation erfolgt über den <typjoker>. Analog dazu sind die Elemente <reg_sach> und <reg_pers> einzusetzen, um eine Fundstelle Sach- oder Personenregister zu zuweisen.

Ein neues Jokerelement <register typ="1"> löst die bisherigen Elemente <reg_1>, <reg_2> und <reg_3> ab. Es dient dem Zuweisen von Fundstellen zu weiteren Registern, die keine Orts-, Sach-, oder Personenregister sind. Als Jokerelement verfügt <register> immer über einen Typ, der mit Fundstelle und Beschreibung in <registerjoker> dokumentiert werden muss.

Das Attribut @nummer an den Register-Elementen dient der Synchronisierung mit einer Datenbank. Das Attribut wird bis auf Weiteres jedoch noch nicht eingesetzt.

Innerhalb von den vier verschiedenen Register-Elementen umschließt <reg_fundstelle> die zu markierende Stelle im Text und <reg_begriff1> bis <reg_begriff4> das zugehörige Schlagwort. Die Zahlen 1 bis 4 dienen dabei der Zuordnung eines Registerbegriffes zu maximal vier Hierarchien. Die Hierarchien werden also, anders als bei Kapiteln, nicht durch eine Verschachtelung erzeugt, um die Strukturierung zu erleichtern.

Mit <reg-querverweis> kann ein Querverweis auf andere Registerbegriffe markiert werden, der dann innerhalb des zu erstellenden Registers erscheint.

VERWEISSTRUKTUREN

<verweis> ist nun gleichwertiger Bestandteil der anderen Inlineauszeichnungen und kann somit in allen Texten verwendet werden. Somit ist das Element auch beispielsweise in <u-text>, <untertitel>, <u-vor>, <inline> und <ix-text> zulässig.

Fast alle Elemente, im Wesentlichen aber Container-Elemente, die nicht ausschließlich weitere Container enthalten, können über @sprungziel referenziert werden.

Durch die Verbindung zusammengehöriger @sprung- und @sprungziel-Paare kann nun praktisch jede Textstelle mit einer beliebigen andere Textstelle verlinkt werden.

Die ID heißt nun bei allen Elementen einheitlich @sprungziel, IDREF-Attribute heißen nun konsequent @sprung.

TABELLEN

Tabellen können nun auch innerhalb von Fuss- und Endnoten auf Ebene der <fn-abs>-Elemente stehen. Die Reihenfolge der gliedernden Elemente wurde entsprechend der XHTML-DTD auf <thead>, <tfoot>, <tbody> geändert.

Das redundante @nr-Attribut wurde aus <tabelle> entfernt. Tabellen zählen jedoch auch zu den typisierbaren Elementen. Typisierte Tabellen müssen mit Fundstelle und Beschreibung im <typjoker>-Element dokumentiert werden.

Im neuen @ebook-Attribut kann die ganze Tabelle im E-Book mit dem Wert 'nein' ausgeblendet werden. Im neuen @print-Attribut kann die Tabelle im Print mit dem Wert 'nein' ausgeblendet werden. Auch der Tabellentitel verfügt über diese Attribute, sodass auch lediglich der Titel ausgeblendet werden kann, die Tabelle selbst jedoch weiterhin auftaucht.

Sowohl die neuen, wie auch die alten Attribute @ausricht, @sprungziel, @typ, @pos und @format sind weiterhin optional.

ABBILDUNGEN

Abbildungen können nun auch in <meta_e-copyright>, <meta_e-bio> und <meta_e-kurztext> eingesetzt werden. auch in Fuss- und Endnoten sind sie nun auf <fn-abs>-Ebene zulässig.

Über das neue @thumbnail-Attribut können Abbildungen für eine besondere Verarbeitung durch den E-Book-Konverter markiert werden. Beim Produzieren von E-Books werden diese Abbildungen dann automatisch in ein kleineres Format umgewandelt. Das kleine Bild steht an der Stelle des Textaufrufes, ist jedoch mit dem hochauflösenden Bild verlinkt. Der Lesefluss wird somit bei Readern mit kleinem Display nicht gestört. Das hochauflösende Bild bleibt für den Leser aber dennoch verfügbar.

Das hochauflösende Bild befindet sich in einem Kapitel des Anhangs und ist mit einem Backlink wiederum mit der ursprünglichen Stelle des Bildaufrufs verknüpft. Diese Form der Umsetzung ist vergleichbar mit der von Fuss- und Endnoten.

GEDICHT

In Versen können nun neben <kontervers_def> auch Tabulatoren verwendet werden (z.B. in Zitaten).

<gedicht> kann nun auch in Tabellen (z.B. im Anmerkungsteil), sowie in Fuß- und Endnoten vorkommen.

DRAMENSATZ

<akt> ist im Drama nun die oberste Kapitelebene unterhalb des Hauptteils und enthält Aufzüge und Szenen der weiteren Hierarchieebenen. Sie erhalten somit den Status eines <kapitel>-Elements.

Als <aufzug> werden Abschnitte der mittleren Hierarchieebene getaggt (auch wenn sie die Überschrift "1. Szene" etc. haben).

<szene> umfasst, nach einer optionalen Überschrift, den Text von einem <regie>-Element bis zum nächsten.

<sprechertext> wird zum Container für den einem Sprecher zugeordneten Text und kann Absätze, Verse und Strophen enthalten.

<regie_inline> ist entsprechend nicht mehr in <sprechertext>, sondern in <abs>, <vers> und <strophe> zulässig.

Außerdem ist <regie_inline> in <sprecher> möglich.

<sprecher> und <sprechertext> müssen nun zwingen Paarweise eingesetzt werden.

<regie> darf nun über mehrere Absätze verfügen.

POPUP

Zusammenfassung

mit @popup="ja" markierte <einschub>-, <infokasten>- und <inline>-Elemente werden im E-Book als PopUp dargestellt.

Mit @popuptitel kann ein anzuzeigender Text (Anker) angegeben werden, sonst wird das erste Kindelement (z.B. <u-zwischen>) ausgewertet.

Der Inhalt des als PopUp markierten Elementes ist für den E-Book-Leser zunächst verborgen, lediglich der PopUp-Titel ist sichtbar. Sobald der Benutzer auf den Titel klickt, wird eine Aktion ausgelöst. Dies kann das Einblenden (Aufpoppen) des Inhalts, oder eine Verlinkung zum Inhalt an anderer Stelle sein.

Changelog