Problem: Der DokuChecker zählt mehr/weniger Zeichen/Wörter als Microsoft Word oder andere Programme.
Hintergrund: Für die Zeichen- und Wortzählung im DokuChecker haben wir eigene Regeln definiert. Ggfs. weichen diese von den Zähl-Regeln in Word ab, das können wir leider nicht mit Gewissheit sagen, da die Word-Regeln nicht offengelegt sind. Grundsätzlich gilt jedoch: Es ist ganz normal, dass Sie unterschiedliche Zeichen- oder Wortumfänge erhalten, wenn Sie unterschiedliche Dateiformate mit unterschiedlichen "Engines" überprüfen.
Übrigens prüft auch Word unterschiedlich – je nachdem ob Sie die DOC-/RTF- oder XML-Datei in Word öffnen.
Folgende Regeln werden im DokuChecker angewendet:
Leerzeichen werden mitgezählt
Metadaten werden nicht berücksichtigt
(Hexadezimale) Character-Entities werden als 1 Zeichen gezählt
Tags werden nicht als Wortgrenze gewertet