Um eine verlagsspezifische Trennbibliothek bzw. eine Ausnahmeliste in Antenna House einzubinden, ist eine Trennbiblliothek im XML-Format notwendig. Diese Datei muss in einem Ordner namens hyphenation
im ConfigSetting (cfg.Config/
) abgelegt werden. Zusätzlich muss im ConfigFile-Generator die entsprechende Option 'Verlagsstandard (im ConfigSetting)' in der Rubrik 'Silbentrennung' ausgewählt sein. Auch hier gilt, dass nur deutschsprachige Trennbibliotheken und Ausnahmelisten ausgewertet werden.
Die XML-Datei muss folgendermaßen aufgebaut sein:
<?xml version="1.0" encoding="ISO-8859-1"?> <hyphenation-info> <!-- optional --> <hyphen-char/> <!-- optional --> <hyphen-min/> <classes/> <!-- optional --> <exceptions/> <patterns/> </hyphenation-info>
<hyphen-char/>
. In <hyphen-char/>
kann durch das Attribut @value
das Trennzeichen, mit der die Trennungen in der exception-Liste dargestellt werden, notiert werden. Wird bspw. ein Bindestrich eingetragen, so ersetzt dies die Schreibung <hyphen pre-break="-"/>
.
<hyphen--min/>
. In <hyphen--min/>
kann angegeben werden, nach wie vielen Buchstaben eine Trennung erfolgen kann. Trägt man in den Attributen @before
und @after
eine "2"
ein, so kann auf alle zwei Buchstaben eine Trennung erfolgen. Allerdings überschreibt das ConfigSetting diese Einstellungen, wenn in diesem Angaben zur Silbentrennung stehen.
<classes/>
. In <classes/>
werden Zeichenklassen und Diakritika notiert. Diese Einstellung ist wichtig, weil ansonsten keine Trennungen im Text erzeugt werden, obwohl die Trennbibliothek richtig eingebunden wurde. Zudem werden die Zeichenklassen mit den verwendeten in den <exceptions/>
wie auch mit denen in den <patterns/>
verglichen. Wurden die entsprechend vorkommenden Klassen nicht definiert, werden die betroffenen Wörter im Text nicht getrennt.
<exceptions/>
. In <exceptions/>
kann eine Wortliste notiert werden, welche die gewünschten oder auch abweichenden Trennungen kennzeichnet. Sie wird mit einer Priorität 1 verarbeitet. Ist kein Hyphenation-Zeichen angegeben, dann ist es wichtig, dass die Trennung mit dem Element <hyphen>
markiert wird. Als Attribute kann in dem Element notiert werden, was vor und nach dem Trennzeichen stehen soll. Z.B. kann man bei dem Wort 'backen' folgende Trennung angeben: ba<hyphen pre="k" no="c"/>
ken (bak-ken).
<patterns/>
. In <patterns/>
werden die auf Liang basierenden Trennmuster notiert. Dabei steht der Punkt für ein Wortanfang bzw. -ende. Die ungeraden Zahlen symbolisieren Silbengrenzen, die geraden Zahlen stehen für ein Trennverbot an der Stelle.
Beispiel für eine verlagsspezifische Trennbibliothek:
<?xml version="1.0" encoding="ISO-8859-1"?> <hyphenation-info> <hyphen-char value="-"/> <hyphen-min before="2" after="2"/> <classes> aA bB cC dD eE fF gG hH iI jJ kK lL mM nN oO pP qQ rR sS tT uU vV wW xX yY zZ äÄ öÖ üÜ </classes> <exceptions> ba<hyphen pre="k" no="c"/>ken bet<hyphen pre="t"/>tuch Aa-chen </exceptions> <patterns> .a2 .ar2s2 .a2n1s .a1n1e .an1gr2 .an3k .as1t1 .ae1 .a1b1u .au2s3 .a2u1t ... </patterns> </hyphenation-info>