Um die Einhaltung der Konvention sicherzustellen, dass Weißraum-Zeichen als Entity in den Daten stehen sollten, druckbare Zeichen als Unicode-Zeichen, steht eine Transformation zur Verfügung:
Die in der Tabelle oben aufgeführten Zeichen werden als Entities codiert, alle übrigen als Unicode-Zeichen.
Die Transformation erzeugt keine neue Version, sondern überschreibt die vorhandene Datei (Input = Output). Sie lässt sich daher nicht (wie z.B. ein Schematron-Quickfix) mit Strg-Z rückgängig machen.
Das Ergebnis ist vollständig identisch mit der urprünglichen Version, nur dass die genannten Zeichen nun entsprechend der Konvention geschrieben sind. Für die Weiterverarbeitung als XML macht das keinen Unterschied.
Tipp | |
---|---|
Bei der Ausführung von Schematron-QuickFixes werden Entities in den bearbeiteten Textknoten aufgelöst (z.B. wird " |