Praxistipps Word: XML-tauglich?

(Montero Pineda, Manuel, Herkert, Steffen, Klevenz, Tobias, Kutscherauer, Nico: Praxistipps Word: XML-tauglich?, in: technische kommunikation, Heft 6, 2008).

Seit Office 2003 ist Microsoft Word in der Lage, XML-Dokumente zu bearbeiten. Dazu haben die Entwickler in Word einen Editor integriert, an dessen Ausstattung und Funktionsweise sich in Office 2007 nichts geändert hat.

Wer an den Leistungsumfang und die Zuverlässigkeit eines speziellen XML-Editors gewöhnt ist, wird sicherlich nicht auf den Word-Editor wechseln wollen. Schließlich fallen die Funktionen zur Bearbeitung von XML-Dokumenten sehr begrenzt aus und das Arbeiten ist nicht besonders anwenderfreundlich. Und nicht zuletzt besitzt der integrierte Parser eine Vielzahl an Fehlern, die für die XML-Bearbeitung schlichtweg inakzeptabel sind. Dennoch beschäftigt sich dieser Praxistipp mit der Verarbeitung von XML in Word, schließlich handelt es sich bei dem Microsoft Flaggschiff um eine in vielen Branchen etablierte Applikation. 

Die Oberfläche des XML-Editors, der in Word integriert ist.

Abb.: Die Oberfläche des XML-Editors, der in Word integriert ist.

Vorbereiten von Word

Vor dem Erstellen eines XML-Dokuments unter Word 2007 sollte der Anwender einige Einstellungen vornehmen. Zunächst muss die Registerkarte „Entwicklertools“ aktiviert werden. Hier befinden sich alle zur Bearbeitung von XML-Dateien weiterführenden Menüpunkte. Falls dieser Eintrag in der Multifunktionsleiste nicht verfügbar ist, kann er unter „Word-Optionen“ > „Häufig verwendet“ > „Entwicklerregisterkarte in der Multifunktionsleiste anzeigen“ angelegt werden.
Als Nächstes muss Word über ein Schema informiert werden, das der neu zu erstellenden Datei zuzuordnen ist. Ein XML-Schema ist das Regelwerk, dem ein XML-Dokument folgen muss. Es enthält Vorgaben, wo welche Elemente in welcher Reihenfolge erlaubt sind. Word unterstützt Schemata im Format XSD. Ein anderes Regelwerk, zum Beispiel das weitverbreitete DTD-Konzept, unterstützt Word hingegen nicht. Im Gegensatz zu anderen XML-Editoren liest Word Pfadangaben, die auf ein Schema verweisen, nicht direkt aus. Vielmehr ermittelt es das dazugehörige Schema beim Öffnen der XML-Datei anhand des Namensraums und des vorhandenen Wurzelelements. Dazu muss Word das Schema kennen. Das geschieht durch einen Eintrag in der „Schemabibliothek“. In diese Bibliothek kann der Anwender Schemata hinzufügen, löschen oder Aliasnamen bearbeiten.
Der Vollständigkeit halber sei erwähnt, dass der Anwender ein Schema nicht in Word bearbeiten kann. Für kleinere Änderungen reicht dem geübten Anwender sicherlich ein einfacher Texteditor aus, komplexere Eingriffe in die Schema-Datei lassen sich jedoch nur mit einem speziellen XML-Editor umsetzen. Ist das Schema in Word eingebunden und ausgewählt, erscheinen die zur Verfügung stehenden Elemente im Aufgabenbereich „XML-Struktur“. Den Aufgabenbereich findet man über die Schaltfläche „Entwicklertools“ > „Struktur“.

Aufgabenbereich XML-Struktur

Der Aufgabenbereich besteht aus zwei Teilen. Im oberen Teil wird der hierarchische Aufbau eines Dokuments anhand der benutzten Elemente angezeigt. Zusätzlich werden hier auch Verstöße gegen die im Schema angelegten definierten Regeln gekennzeichnet. Im unteren Teil werden alle Elemente aufgeführt, die dem Schema bekannt sind. Wenn das Kontrollkästchen vor „Nur untergeordnete Elemente des aktuellen Elements auflisten“ aktiviert ist, werden hier nur jene Elemente aufgeführt, die an der momentanen Cursor-Position im Dokument schemakonform sind.
Durch Klicken auf eines der aufgelisteten Elemente lässt es sich in das Dokument einfügen. Eine andere Möglichkeit zum Einfügen existiert nicht. Auf Dauer ist dieser Vorgang eine mühsame Angelegenheit.

Mühsam: das Einfügen eines neuen Elements in ein Dokument

Abb.: Mühsam: das Einfügen eines neuen Elements in ein Dokument

Word erkennt die zulässigen Elemente. Zusätzliche Bedingungen, die im Schema angelegt sind, zum Beispiel vorgegebene Abfolgen, werden bei der Darstellung jedoch nicht ausreichend gekennzeichnet. Die Folge: Der Anwender muss intuitiv die Struktur seines XML-Dokumentes kennen, um mit vertretbarem Aufwand XML-Dokumente erstellen zu können.
Noch mühseliger ist es, wenn zusätzlich Attribute angelegt werden sollen. Diese lassen sich nur über ein weiteres Dialogfeld hinzufügen, das der Anwender über einen Rechtsklick auf das betreffende Element erreicht. Immerhin erkennt Word dem Schema bekannte Attribute. Auch die entsprechenden Werte werden angezeigt, falls diese reglementiert sind. Bei der Darstellung hapert es jedoch.
Hat man Elemente um Attribute erweitert, so werden die Attribute im Dokument selbst nicht angezeigt, sondern über den Tooltipp. Dieser erscheint, wenn man den Cursor über das entsprechende Element in der XML-Struktur-Ansicht hält.

Parsen von Dokumenten

Neben der mühsamen Handhabung spricht auch das Parsen nicht gerade für Word als XML-Editor. Beim Parsen kann der Anwender das Dokument nach den Strukturen, die das Schema vorgibt, prüfen. 

Die Überprüfung, ob ein Dokument die durch das Schema vorgegebene Struktur einhält, läuft in Echtzeit ab. Tritt ein Fehler auf, wird dieser sofort angezeigt, im Dokument durch eine gezackte Linie, in der Strukturansicht durch ein Symbol. Je nach Art des Fehlers variiert das Symbol. Weiterhin erhält der Anwender eine Beschreibung des Fehlers, und zwar wenn der Cursor über das entsprechende Symbol in der Strukturansicht positioniert wird. Die Fehlerbeschreibung ist allerdings wenig hilfreich. Fehlt in einer Sequenz beispielsweise ein zwingend erforderliches Element, so wird nicht das fehlende Element genannt, sondern das Auftreten des nächstfolgenden Elements mit der Beschreibung „In diesem Kontext nicht zulässig“ angemerkt. Zugegeben, ein triviales Beispiel. Aber sobald ein bestimmtes Maß an Komplexität erreicht wird, kann der Anwender kaum erkennen, wo der Fehler liegt und wie dieser behoben werden kann. Darüber hinaus bricht die Fehlerbeschreibung zusammen, wenn mehrere Verletzungen der Schema-Regeln auf ein Mal auftreten. Erst beim Speichern erfährt der Anwender, ob ein Dokument valide ist.

Speichern der XML-Dateien

Will man die XML-Datei speichern, muss in Word 2007 unter „Speichern unter“ der Dateityp „Word 2003 XML-Dokument“ ausgewählt und der Haken bei „Nur Daten Speichern“ gesetzt werden. Setzt man diesen Haken nicht, wird eine WordML-Datei gespeichert, die die gesamte interne Word-Datenstruktur enthält.
Wird reines XML als WordML abgespeichert, werden sämtliche Hintergrundinformationen mit abgelegt, die einem typischen Word-Dokument entsprechen, wie Seitenränder und Layoutinformationen.

Eine XML-Datei speichern.

Abb.: Eine XML-Datei speichern.

Fazit

XML-Editoren lassen sich in zwei Gruppen unterteilen: 1. Editoren für Entwickler und 2. für Autoren. Für Entwickler ist Word völlig ungeeignet. Das Programm kann nur XML-Instanzen bearbeiten. Andere XML-basierte Anwendungen wie XSL-Stylsheets oder die schon genannten Schemata lassen sich nicht einmal öffnen.
Auch für Autoren bringt Word als XML-Editor kaum etwas. Zum Bearbeiten von Dateien, auch wenn sie nur wenig komplexe Strukturen aufweisen, fehlt eine klare Benutzerführung, die den Autor bei der Erstellung eines Dokuments unterstützt. Falls dem Autor die Regeln beziehungsweise zulässigen Strukturen des XML-Dokumentes nicht bekannt sind, ist er auf sich allein gestellt.
Bei der Darstellung der Daten bieten spezielle XML-Editoren wie Epic, oxygen Author oder XMetal wesentlich mehr Optionen. So lassen sich über die Benutzeroberfläche CSS-basierte Eigenschaften angeben, was die Ansicht der eigentlich unformatierten Daten sehr erleichtert. Bleibt festzuhalten: Die XML-Funktionen von Word richten sich nicht an Personen, die XML aufbereiten und pflegen. Die Überprüfung, ob ein Dokument valide ist, fehlt vollständig, ebenso das Einbinden von DTDs oder das Validieren auf Knopfdruck. 
Stellt sich die Frage: Für wen wurde der Editor konzipiert? Microsoft bleibt dem Anwendungsschwerpunkt Bürokommunikation treu. Einfache Automatisierungen lassen sich realisieren, um den Büroanwender bei der Arbeit zu unterstützen. Ohne weitere Implementierungen können vorgefertigte Formulare bearbeitet werden. Die einzelnen Elemente markieren hierbei Felder, die mit der „Smart-Documents“-Funktion und einer Datenbankanbindung befüllt werden können. Geht es jedoch darum, das XML-Potenzial vollständig auszuschöpfen, bleibt nur der Griff zum echten XML-Editor.

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema WordML bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:

Copyright © 2008 tcworld GmbH
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieser Artikel aus der Fachzeitschrift "technische kommunikation" (Heft 6, 2008) denselben Bestimmungen wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

tcworld GmbH, Rotebühlstraße 64, 70178 Stuttgart, info@tekom.de, www.tekom.de