antillesXML: Tools
Werkzeuge für spezielle Aufgaben
Hintergrund:
Im Programmbereich Tools werden verschiedene Werkzeuge zur
Filterung von Word-Dateien
Umwandlung von CSV- zu XML-Dateien
Ansicht von XML-Code mit Syntax Highlighting
automatisierten Transformation von ganzen Ordnern und
Dokumentation von Schema-Dateien
angeboten.
Word 2 Generic
Transformation von Word nach XML
Beispiele von Word nach XML
Das generierte XML für Auszeichnungen aus Word-Dateien
Tools → Word 2 Generic: Das generierte XML für Auszeichnungen aus Word-Dateien
<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns:d2t="http://www.data2type.de/word">
<head>
<doc-name>Auszeichnungen_word.xml</doc-name>
<uri>file:///C:/workspace/antillesXML/testFiles/Tools/Word2XML/source/Auszeichnungen_word.xml</uri>
<section-styles/>
</head>
<body>
<p type="Heading_20_1">Heading 1</p>
<p type="P1">Lore Ipsum <inline type="T1">Lore</inline> Ipsum</p>
<p type="Heading_20_2">Heading 2</p>
<p type="P1">Lore <inline type="T2">Ipsum</inline> Lore Ipsum</p>
</body>
</doc>
Die verschiedenen Absatz- und Zeichenformate aus Word bleiben erhalten, indem sie als type-Attribute an ein <p>
- oder ein <inline>
-Element angefügt werden.
Das generierte XML für Listen aus Word-Dateien
Tools → Word 2 Generic: Das generierte XML für Listen aus Word-Dateien
<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns:d2t="http://www.data2type.de/word">
<head>
<doc-name>Liste_word.xml</doc-name>
<uri>file:///C:/workspace/antillesXML/testFiles/Tools/
Word2XML/source/Liste_word.xml</uri>
<section-styles/>
</head>
<body>
<ol>
<li><p type="P1">Listenpunkt 1</p></li>
<li><p type="P1">Listenpunkt 2</p></li>
<li>
<ol>
<li><p type="P1">Listenpunkt 2.1</p></li>
<li><p type="P1">Listenpunkt 2.2</p></li>
</ol>
</li>
</ol>
</body>
</doc>
Listen werden auf eine einfache Grundstruktur reduziert, die an die vertraute Struktur aus HTML-Dokumenten angelehnt ist.
Das generierte XML für Tabellen aus Word-Dateien
Tools → Word 2 Generic: Das generierte XML für Tabellen aus Word-Dateien
<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns:d2t="http://www.data2type.de/word">
<head>
<doc-name>table_word.xml</doc-name>
<uri>file:///C:/workspace/antillesXML/testFiles/Tools/
Word2XML/source/table_word.xml</uri>
<section-styles/>
</head>
<body>
<table type="d2t:table">
<thead type="d2t:thead">
<tr type="d2t:tr">
<td type="d2t:td"><p type="P2">Name</p></td>
<td type="d2t:td"><p type="P2">Vorname</p></td>
</tr>
</thead>
<tbody type="d2t:tbody">
<tr type="d2t:tr">
<td type="d2t:td"><p type="P1">Müller</p></td>
<td type="d2t:td"><p type="P1">Michael</p></td>
</tr>
<tr type="d2t:tr">
<td type="d2t:td"><p type="P1">Mustermann</p></td>
<td type="d2t:td"><p type="P1">Marc</p></td>
</tr>
</tbody>
</table>
</body>
</doc>
Tabellen werden ebenfalls auf eine einfache Grundstruktur reduziert, die an die vertraute Struktur aus HTML-Dokumenten angelehnt ist.
Registerkarte: Single
Transformation von Word-Dateien nach XML
So generieren Sie aus einer Word-Datei ein vereinfachtes XML-Format.
- Erzeugung der Word-Datei
So bereiten Sie die Word-Datei für die Transformation vor.
Öffnen Sie die Word-Datei in Microsoft Word.
Beachten Sie, dass es sich hierbei um eine Word-Version 2003 oder höher handeln muss.
Wählen Sie im Menü Datei den Eintrag Speichern unter....
→ Der Speichern unter-Dialog erscheint.
Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.
Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.
Änderung des Dateiformats.
Wählen Sie in der Dropdown-Liste hinter Dateityp den Eintrag Word 2003 XML-Dokument.
Klicken Sie auf Speichern.
Schließen Sie die Datei in Word.
antillesXML kann nicht auf diese Datei zugreifen, solange diese in Word geöffnet ist, und gibt eine Fehlermeldung aus.
- Aufrufen des Fensters Word 2 Generic
Wählen Sie im Menü Tools den Eintrag Word 2 Generic.
→ Das Fenster Word 2 Generic erscheint.
→ Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.
- Auswahl des Eingangsdokuments
Sie benötigen eine als XML abgespeicherte Word-Datei als Eingangsdokument, dessen Content in eine vereinfachte XML-Struktur hin transformiert werden soll.
Klicken Sie auf die Schaltfläche
→ Der Öffnen-Dialog erscheint.
Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.
Klicken Sie auf Öffnen.
- Auswahl des Ausgangsdokuments
Sie benötigen eine XML-Datei als Ausgangsdokument, in der der Content der Word-Datei in einer vereinfachten XML-Struktur abgebildet werden soll.
Klicken Sie auf die Schaltfläche
→ Der Speichern unter-Dialog erscheint.
Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.
Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.
Klicken Sie auf Speichern.
- Ausführen der Transformation
Klicken Sie auf die Schaltfläche
→ Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.
Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.
Hintergrund
antillesXML bietet die Möglichkeit, Word-Dateien in ein vordefiniertes XML-Format zu transformieren. Die Word-Dateien können hierbei beliebige Inhalte und Formatvorlagen enthalten.
Das daraus erzeugte XML-Dokument konzentriert sich auf die wesentlichen Informationen wie Texte, Listen, Tabellen und Auszeichnungen.
Das XML-Format, in das die ursprüngliche Word-Datei transformiert wird, entspricht einer stark vereinfachten Version der Word-Datei. Viele oft unnötige und störende Strukturen werden bei diesem Prozess eliminiert. Es wird eine Fokussierung auf das Wesentliche vorgenommen.
Die generierte XML-Datei kann, bedingt durch die stark reduzierte Struktur, optimal für weitere Transformationsprozesse verwendet werden.
CSV 2 XML
Transformation von CSV-Dateien nach XML
Beispiel von CSV nach XML
Die CSV-Datei
Tools → CSV 2 XML: Die CSV-Datei
Name;Vorname;Anrede;Straße;PLZ
Müller;Michael;Herr;Müllerstr. 25;55435
Meier;Maja;Frau;Majastr. 45;44555
Die ursprüngliche, unformatierte CSV-Datei.
Das generierte XML-Format
Tools → CSV 2 XML: Das generierte XML-Format
<?xml version="1.0" encoding="UTF-8"?>
<csv>
<row>
<cell>Name</cell>
<cell>Vorname</cell>
<cell>Anrede</cell>
<cell>Strasse</cell>
<cell>PLZ</cell>
</row>
<row>
<cell>Müller</cell>
<cell>Michael</cell>
<cell>Herr</cell>
<cell>Müllerstr. 25</cell>
<cell>55435</cell>
</row>
<row>
<cell>Meier</cell>
<cell>Maja</cell>
<cell>Frau</cell>
<cell>Majastr. 45</cell>
<cell>44555</cell>
</row>
</csv>
Der Inhalt der CSV-Datei wurde in eine einfach strukturierte XML-Datei transformiert.
Registerkarte: Single
Transformation von CSV-Dateien nach XML
So generieren Sie aus einer CSV-Datei eine XML-Datei.
- Aufrufen des Fensters CSV 2 XML
Wählen Sie im Menü Tools den Eintrag CSV 2 XML.
→ Das Fenster CSV 2 XML erscheint.
→ Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.
- Auswahl des Eingangsdokuments
Sie benötigen eine CSV-Datei als Eingangsdokument, dessen Daten nach XML hin transformiert werden sollen.
Klicken Sie auf die Schaltfläche
→ Der Öffnen-Dialog erscheint.
Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.
Klicken Sie auf Öffnen.
- Auswahl des Ausgangsdokuments
Sie benötigen eine XML-Datei als Ausgangsdokument, in der die Daten der CSV-Datei aufbereitet werden soll.
Klicken Sie auf die Schaltfläche
→ Der Speichern unter-Dialog erscheint.
Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.
Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.
Klicken Sie auf Speichern.
- Auswahl des Trennzeichens
Wählen Sie, abhängig von den verwendeten Trennzeichen in der CSV-Datei, in der Dropdown-Liste vor Choose Separator die entsprechende Option.
- Ausführen der Transformation
Klicken Sie auf die Schaltfläche
→ Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.
Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.
Hintergrund
Das Dateiformat CSV beschreibt den Aufbau einer Textdatei zur Speicherung oder zum Austausch einfach strukturierter Daten.
Die Umwandlung von CSV-Dateien in eine XML-Struktur ist möglich, wenn
zur Trennung der Datensätze jeweils ein Zeilenumbruch stattfindet,
als Trennzeichen für die einzelnen Datenfelder in den Zeilen
ein Komma, oder
ein Semikolon
verwendet wird.
Weiterführende Links zu eingebetteten CSV-Dateien:
RFC 4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files
XML Syntax Highlighting
Syntax Highlighting von XML-Dateien
Registerkarte: Single
Syntax Highlighting von XML-Dateien
So generieren Sie aus einer XML-Datei eine Ansicht des XML-Codes in HTML mit Syntax Highlighting.
- Aufrufen des Fensters XML Syntax Highlighting
Wählen Sie im Menü Tools den Eintrag XML Syntax Highlighting.
→ Das Fenster XML Syntax Highlighting erscheint.
→ Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.
- Auswahl des Eingangsdokuments
Sie benötigen eine XML-Datei als Eingangsdokument, dessen Code visuell aufbereitet werden soll.
Klicken Sie auf die Schaltfläche
→ Der Öffnen-Dialog erscheint.
Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.
Klicken Sie auf Öffnen.
- Auswahl des Ausgangsdokuments
Sie benötigen eine HTML-Datei als Ausgangsdokument, in der der XML-Code visuell aufbereitet werden soll.
Klicken Sie auf die Schaltfläche
→ Der Speichern unter-Dialog erscheint.
Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.
Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.
Klicken Sie auf Speichern.
- Anzeige des Resultats im Browser
Aktivieren Sie das Kontrollkästchen vor Open Result in Standard Browser.
→ Das Ausgabedokument wird zusätzlich bei jedem Transformationsvorgang anschließend im Standardbrowser geöffnet.
- Ausführen der Transformation
Klicken Sie auf die Schaltfläche
→ Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.
Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.
Hintergrund
Umwandlung einer XML-Datei in eine HTML-Ansicht mit Syntax Highlighting.
Die generierte HTML-Datei enthält im Header den anpassbaren CSS-Code.
Der generierte HTML-Code kann in andere HTML-Seiten eingebettet werden, bspw. für Dokumentationszwecke.
Hotfolder
Automatisierte Transformationen von ganzen Ordnern
Registerkarte: XSLT
Automatisierte Transformationen von ganzen Ordnern
So transformieren Sie automatisiert Dateien mit XSLT in neue Ausgabedateien.
I. d. R. wird es sich hierbei bereits um XML-Dateien handeln.
- Aufrufen des Fensters Hotfolder
- Auswahl des Hotfolders
Sie benötigen einen Ordner als Hotfolder, der auf Änderungen überwacht werden soll, und dessen Dateien automatisiert transformiert werden sollen.
Abhängig von dem Anwendungszweck und dem verwendeten XSL-Stylesheet, kann es sich in dem Ordner um verschiedene Formen von verarbeitbaren Dateien handeln.
Klicken Sie auf die Schaltfläche
→ Der Ordner suchen-Dialog erscheint.
Wählen Sie den Pfad zu dem Hotfolder in Ihrem Dateisystem.
Klicken Sie auf OK.
- Auswahl des Ausgangsordners
Sie benötigen einen Ordner als Ausgangsordner, in dem die Ausgangsdokumente abgelegt werden.
Klicken Sie auf die Schaltfläche
→ Der Ordner suchen-Dialog erscheint.
Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.
Klicken Sie auf OK.
- Angabe der Stylesheet-Datei
Sie benötigen eine XSLT-Datei als Stylesheet, das die Dateien im Hotfolder in das neue Ausgabeformat transformiert.
Klicken Sie auf die Schaltfläche
→ Der Öffnen-Dialog erscheint.
Wählen Sie den Pfad zu dem Stylesheet in Ihrem Dateisystem.
Klicken Sie auf Öffnen.
- Aktivieren des Hotfolders
So starten Sie eine Hotfolder-Session.
Klicken Sie auf die Schaltfläche
→ Der Hotfolder ist aktiv und wird überwacht. Bei Änderungen in diesem Ordner werden die Transformationsprozesse automatisiert angestoßen und die Ausgangsdokumente an die von Ihnen gewählte Stelle geschrieben.
Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
Eventuelle Fehlermeldungen im Rahmen der Hotfolder-Session werden im Fenster Statistics in der Registerkarte Log angezeigt.
Ebenso werden Meldungen über den Beginn und das Ende der Hotfolder-Session ausgegeben.
- Deaktivieren des Hotfolders
So beenden Sie eine Hotfolder-Session.
Klicken Sie auf die Schaltfläche
→ Die Hotfolder-Session ist jetzt beendet.
Eine Meldung über das Ende der Hotfolder-Session wird im Fenster Statistics in der Registerkarte Log angezeigt.
Registerkarte: Parameters
Automatisierte Transformationen mit Parameter-Übergaben
So übergeben Sie Parameter an einen Hotfolder.
- Vorraussetzungen für die Übergabe von Parametern
Wählen Sie zuvor die Registerkarte XSLT im Fenster Hotfolder und wählen dort die benötigten Dateien bzw. Ordner für den Transformationsprozess.
Wählen Sie anschließend die Registerkarte Parameters.
- Übergabe der Parameter
Tools → Hotfolder → Parameters →
<xsl:param>
Parameter finden sich im XSLT-Stylesheet in folgender Form:
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:param name="collection"/>
<html>
<body>
<h1><xsl:value-of select="$collection"/></h1>
Hier wird ein Parameter als globales Element deklariert.
Das durch den XSLT-Prozessor übergebene Argument für den Parameter wird innerhalb des <h1>
-Elements abgerufen.
Weiterführende Links zum Element <xsl:param>:
data2type: XML-Technologien → XSLT → XSLT 2.0-Referenz → <param>
w3schools: XSLT → <xsl:param>
-Element
- Angabe der Parameter-Werte
Die Parameter-Namen des zuvor ausgewählten XSLT-Styesheets werden in der linken Spalte unter Parameter aufgelistet.
Tragen Sie den an den entsprechenden Parameter zu übergebenden Wert in der rechten Spalte unter Value ein.
Speichern der Parameter-Werte
Klicken Sie auf die Schaltfläche
→ Die Werte werden beim nächsten Transformationsprozess als Argumente an den XSLT-Prozessor übergeben.
Wechseln Sie wieder auf die Registerkarte XSLT und starten Sie die Transformation.
Tools → Hotfolder → Parameters →
<xsl:param>
Das Ergebnis der Parameter-Übergabe aus unserem Beispiel:
<html>
<body>
<h1>data2type</h1>Das bei der Transformation übergebene Argument findet sich als Überschrift im HTML-Code wieder.
Hintergrund
Ein Hotfolder ist ein überwachter Ordner im Dateisystem. Änderungen in diesem Ordner führen dazu, dass die jeweils hinterlegten Prozesse sofort automatisiert ausgeführt werden.
- Aktualisierung von Dateien.
- Hinzufügen von Dateien.
Änderungen im Hotfolder können sein:
- Transformation der Dateien im Hotfolder mit einem zugewiesenen XSLT-Stylesheet.
- Schreiben der Ausgabedokumente in einen Zielordner.
Die hinterlegten Prozesse beinhalten:
XSD Documentation
Dokumentation von Schema-Dateien
Registerkarte: Single
Dokumentation einzelner Schemata
So erzeugen Sie eine HTML-Dokumentation einer Schema-Datei.
- Aufrufen des Fensters XSD Documentation
Wählen Sie im Menü Tools den Eintrag XSD Documentation.
→ Das Fenster XSD Documentation erscheint.
Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.
- Auswahl des Eingangsdokuments
Sie benötigen eine Schema-Datei als Eingangsdokument, dessen Komponenten dokumentiert und visuell aufbereitet werden sollen.
Klicken Sie auf die Schaltfläche
→ Der Öffnen-Dialog erscheint.
Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.
Klicken Sie auf Öffnen.
- Auswahl des Ausgangsdokuments
Sie benötigen eine HTML-Datei als Ausgangsdokument, in der die Schema-Datei dokumentiert und visuell aufbereitet werden soll.
Klicken Sie auf die Schaltfläche
→ Der Speichern unter-Dialog erscheint.
Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.
Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.
Klicken Sie auf Speichern.
- Anzeige des Resultats im Browser
Aktivieren Sie das Kontrollkästchen vor Open Result in Standard Browser.
→ Das Ausgabedokument wird zusätzlich bei jedem Transformationsvorgang anschließend im Standardbrowser geöffnet.
- Ausführen der Transformation
Klicken Sie auf die Schaltfläche
→ Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.
Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.
<< zurück | vor >> |