antillesXML: Tools

Werkzeuge für spezielle Aufgaben

Word 2 Generic

CSV 2 XML

XML Syntax Highlighting

Hotfolder

XSD Documentation

Hintergrund:

Im Programmbereich Tools werden verschiedene Werkzeuge zur

  • Filterung von Word-Dateien

  • Umwandlung von CSV- zu XML-Dateien

  • Ansicht von XML-Code mit Syntax Highlighting

  • automatisierten Transformation von ganzen Ordnern und

  • Dokumentation von Schema-Dateien

angeboten.

 

Word 2 Generic

Transformation von Word nach XML

Beispiele von Word nach XML

Das generierte XML für Auszeichnungen aus Word-Dateien

ToolsWord 2 Generic: Das generierte XML für Auszeichnungen aus Word-Dateien

Abbildung von Auszeichnungen in einer Word-Datei

 

<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns:d2t="http://www.data2type.de/word">
    <head>
        <doc-name>Auszeichnungen_word.xml</doc-name>
        <uri>file:///C:/workspace/antillesXML/testFiles/Tools/Word2XML/source/Auszeichnungen_word.xml</uri>
        <section-styles/>
    </head>
    <body>
        <p type="Heading_20_1">Heading 1</p>
        <p type="P1">Lore Ipsum <inline type="T1">Lore</inline> Ipsum</p>
        <p type="Heading_20_2">Heading 2</p>
        <p type="P1">Lore <inline type="T2">Ipsum</inline> Lore Ipsum</p>
    </body>
</doc>

Die verschiedenen Absatz- und Zeichenformate aus Word bleiben erhalten, indem sie als type-Attribute an ein <p>- oder ein <inline>-Element angefügt werden.

Das generierte XML für Listen aus Word-Dateien

Tools → Word 2 Generic: Das generierte XML für Listen aus Word-Dateien

Abbildung von Listen innerhalb einer Word-Datei

<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns:d2t="http://www.data2type.de/word">
    <head>
        <doc-name>Liste_word.xml</doc-name>
        <uri>file:///C:/workspace/antillesXML/testFiles/Tools/
            Word2XML/source/Liste_word.xml</uri>
        <section-styles/>
    </head>
    <body>
        <ol>
            <li><p type="P1">Listenpunkt 1</p></li>
            <li><p type="P1">Listenpunkt 2</p></li>
            <li>
                <ol>
                    <li><p type="P1">Listenpunkt 2.1</p></li>
                    <li><p type="P1">Listenpunkt 2.2</p></li>
                </ol>
            </li>
        </ol>
    </body>
</doc>

Listen werden auf eine einfache Grundstruktur reduziert, die an die vertraute Struktur aus HTML-Dokumenten angelehnt ist.

Das generierte XML für Tabellen aus Word-Dateien

Tools → Word 2 Generic: Das generierte XML für Tabellen aus Word-Dateien

Abbildung einer Namensliste innerhalb einer Word-Datei

<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns:d2t="http://www.data2type.de/word">
    <head>
        <doc-name>table_word.xml</doc-name>
        <uri>file:///C:/workspace/antillesXML/testFiles/Tools/
            Word2XML/source/table_word.xml</uri>
        <section-styles/>
    </head>
    <body>
        <table type="d2t:table">
            <thead type="d2t:thead">
                <tr type="d2t:tr">
                    <td type="d2t:td"><p type="P2">Name</p></td>
                    <td type="d2t:td"><p type="P2">Vorname</p></td>
                </tr>
            </thead>
            <tbody type="d2t:tbody">
                <tr type="d2t:tr">
                    <td type="d2t:td"><p type="P1">Müller</p></td>
                    <td type="d2t:td"><p type="P1">Michael</p></td>
                </tr>
                <tr type="d2t:tr">
                    <td type="d2t:td"><p type="P1">Mustermann</p></td>
                    <td type="d2t:td"><p type="P1">Marc</p></td>
                </tr>
            </tbody>
        </table>
    </body>
</doc>

Tabellen werden ebenfalls auf eine einfache Grundstruktur reduziert, die an die vertraute Struktur aus HTML-Dokumenten angelehnt ist.

 

Registerkarte: Single

Transformation von Word-Dateien nach XML

So generieren Sie aus einer Word-Datei ein vereinfachtes XML-Format.

  • Erzeugung der Word-Datei

    So bereiten Sie die Word-Datei für die Transformation vor.

    1. Öffnen Sie die Word-Datei in Microsoft Word.

      Beachten Sie, dass es sich hierbei um eine Word-Version 2003 oder höher handeln muss.

    2. Wählen Sie im Menü Datei den Eintrag Speichern unter....

      → Der Speichern unter-Dialog erscheint.

    3. Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.

    4. Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.

    5. Änderung des Dateiformats.

      Fenster Speichern unter - Dateityp Word 2003 XML-Dokument

      Wählen Sie in der Dropdown-Liste hinter Dateityp den Eintrag Word 2003 XML-Dokument.

    6. Klicken Sie auf Speichern.

    7. Schließen Sie die Datei in Word.

      antillesXML kann nicht auf diese Datei zugreifen, solange diese in Word geöffnet ist, und gibt eine Fehlermeldung aus.

  • Aufrufen des Fensters Word 2 Generic
    1. Wählen Sie im Menü Tools den Eintrag Word 2 Generic.

      → Das Fenster Word 2 Generic erscheint.

    2. → Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.

      Fenster Word 2 Generic mit aktiver Registerkarte Single
  • Auswahl des Eingangsdokuments

    Sie benötigen eine als XML abgespeicherte Word-Datei als Eingangsdokument, dessen Content in eine vereinfachte XML-Struktur hin transformiert werden soll.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zum Öffnen des Eingangsdokuments

      → Der Öffnen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.

    3. Klicken Sie auf Öffnen.

  • Auswahl des Ausgangsdokuments

    Sie benötigen eine XML-Datei als Ausgangsdokument, in der der Content der Word-Datei in einer vereinfachten XML-Struktur abgebildet werden soll.

    1. Klicken Sie auf die Schaltfläche 

      → Der Speichern unter-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.

    3. Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.

    4. Klicken Sie auf Speichern.

  • Ausführen der Transformation
    1. Klicken Sie auf die Schaltfläche Schaltfläche zum Starten der Transformation

      → Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.

      Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
      Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.

Hintergrund

antillesXML bietet die Möglichkeit, Word-Dateien in ein vordefiniertes XML-Format zu transformieren. Die Word-Dateien können hierbei beliebige Inhalte und Formatvorlagen enthalten.

Das daraus erzeugte XML-Dokument konzentriert sich auf die wesentlichen Informationen wie Texte, Listen, Tabellen und Auszeichnungen.

Das XML-Format, in das die ursprüngliche Word-Datei transformiert wird, entspricht einer stark vereinfachten Version der Word-Datei. Viele oft unnötige und störende Strukturen werden bei diesem Prozess eliminiert. Es wird eine Fokussierung auf das Wesentliche vorgenommen.

Die generierte XML-Datei kann, bedingt durch die stark reduzierte Struktur, optimal für weitere Transformationsprozesse verwendet werden.

 

CSV 2 XML

Transformation von CSV-Dateien nach XML

Beispiel von CSV nach XML

Die CSV-Datei

Tools → CSV 2 XML: Die CSV-Datei

Name;Vorname;Anrede;Straße;PLZ
Müller;Michael;Herr;Müllerstr. 25;55435
Meier;Maja;Frau;Majastr. 45;44555

Die ursprüngliche, unformatierte CSV-Datei.

Das generierte XML-Format

Tools → CSV 2 XML: Das generierte XML-Format

<?xml version="1.0" encoding="UTF-8"?>
<csv>
   <row>
      <cell>Name</cell>
      <cell>Vorname</cell>
      <cell>Anrede</cell>
      <cell>Strasse</cell>
      <cell>PLZ</cell>
   </row>
   <row>
      <cell>Müller</cell>
      <cell>Michael</cell>
      <cell>Herr</cell>
      <cell>Müllerstr. 25</cell>
      <cell>55435</cell>
   </row>
   <row>
      <cell>Meier</cell>
      <cell>Maja</cell>
      <cell>Frau</cell>
      <cell>Majastr. 45</cell> 
      <cell>44555</cell>
   </row>
</csv>

Der Inhalt der CSV-Datei wurde in eine einfach strukturierte XML-Datei transformiert.

 

Registerkarte: Single

Transformation von CSV-Dateien nach XML

So generieren Sie aus einer CSV-Datei eine XML-Datei.

  • Aufrufen des Fensters CSV 2 XML
    1. Wählen Sie im Menü Tools den Eintrag CSV 2 XML.

      → Das Fenster CSV 2 XML erscheint.

    2. → Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.

      Fenster CSV 2 XML mit aktiver Registerkarte Single
  • Auswahl des Eingangsdokuments

    Sie benötigen eine CSV-Datei als Eingangsdokument, dessen Daten nach XML hin transformiert werden sollen.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl eines Eingangsdokuments

      → Der Öffnen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.

    3. Klicken Sie auf Öffnen.

  • Auswahl des Ausgangsdokuments

    Sie benötigen eine XML-Datei als Ausgangsdokument, in der die Daten der CSV-Datei aufbereitet werden soll.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl eines Ausgangsdokuments

      → Der Speichern unter-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.

    3. Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.

    4. Klicken Sie auf Speichern.

  • Auswahl des Trennzeichens

    Abbildung zur Auswahl des Trennzeichens

    Wählen Sie, abhängig von den verwendeten Trennzeichen in der CSV-Datei, in der Dropdown-Liste vor Choose Separator die entsprechende Option.

  • Ausführen der Transformation

    Klicken Sie auf die Schaltfläche Schaltfläche zum Starten der Transformation

    → Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.

    Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
    Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.

Hintergrund

Das Dateiformat CSV beschreibt den Aufbau einer Textdatei zur Speicherung oder zum Austausch einfach strukturierter Daten.

Die Umwandlung von CSV-Dateien in eine XML-Struktur ist möglich, wenn

  • zur Trennung der Datensätze jeweils ein Zeilenumbruch stattfindet,

  • als Trennzeichen für die einzelnen Datenfelder in den Zeilen

    • ein Komma, oder

    • ein Semikolon

verwendet wird.

 

Weiterführende Links zu eingebetteten CSV-Dateien:

RFC 4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files

 

XML Syntax Highlighting

Syntax Highlighting von XML-Dateien

Registerkarte: Single

Syntax Highlighting von XML-Dateien

So generieren Sie aus einer XML-Datei eine Ansicht des XML-Codes in HTML mit Syntax Highlighting.

  • Aufrufen des Fensters XML Syntax Highlighting
    1. Wählen Sie im Menü Tools den Eintrag XML Syntax Highlighting.

      → Das Fenster XML Syntax Highlighting erscheint.

    2. → Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.

      Fenster XML Syntax Highlighting mit aktiver Registerkarte Single
  • Auswahl des Eingangsdokuments

    Sie benötigen eine XML-Datei als Eingangsdokument, dessen Code visuell aufbereitet werden soll.

    1. Klicken Sie auf die Schaltfläche 

      → Der Öffnen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.

    3. Klicken Sie auf Öffnen.

  • Auswahl des Ausgangsdokuments

    Sie benötigen eine HTML-Datei als Ausgangsdokument, in der der XML-Code visuell aufbereitet werden soll.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl des Ausgangsdokuments

      → Der Speichern unter-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.

    3. Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.

    4. Klicken Sie auf Speichern.

  • Anzeige des Resultats im Browser

    Ansicht Anweisung zum Anzeigen des Resultats im Browser

    Aktivieren Sie das Kontrollkästchen vor Open Result in Standard Browser.

    → Das Ausgabedokument wird zusätzlich bei jedem Transformationsvorgang anschließend im Standardbrowser geöffnet.

  • Ausführen der Transformation

    Klicken Sie auf die Schaltfläche Schaltfläche zum Ausführen der Transformation

    → Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.

    Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.

    Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.

Hintergrund

Umwandlung einer XML-Datei in eine HTML-Ansicht mit Syntax Highlighting.

  • Die generierte HTML-Datei enthält im Header den anpassbaren CSS-Code.

  • Der generierte HTML-Code kann in andere HTML-Seiten eingebettet werden, bspw. für Dokumentationszwecke.

Hotfolder

Automatisierte Transformationen von ganzen Ordnern

Registerkarte: XSLT

Automatisierte Transformationen von ganzen Ordnern

So transformieren Sie automatisiert Dateien mit XSLT in neue Ausgabedateien.

I. d. R. wird es sich hierbei bereits um XML-Dateien handeln.

  • Aufrufen des Fensters Hotfolder
    1. Wählen Sie im Menü Tools den Eintrag Hotfolder.

      → Das Fenster Hotfolder erscheint.

    2. → Die Registerkarte XSLT ist standardmäßig beim ersten Aufruf bereits ausgewählt.

      Sollte dies nicht der Fall sein, wählen Sie jetzt die Registerkarte XSLT.

      Fenster Hotfolder mit aktiver Registerkarte XSLT

  • Auswahl des Hotfolders

    Sie benötigen einen Ordner als Hotfolder, der auf Änderungen überwacht werden soll, und dessen Dateien automatisiert transformiert werden sollen.

    Abhängig von dem Anwendungszweck und dem verwendeten XSL-Stylesheet, kann es sich in dem Ordner um verschiedene Formen von verarbeitbaren Dateien handeln.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl des Hotfolders

      → Der Ordner suchen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Hotfolder in Ihrem Dateisystem.

    3. Klicken Sie auf OK.

  • Auswahl des Ausgangsordners

    Sie benötigen einen Ordner als Ausgangsordner, in dem die Ausgangsdokumente abgelegt werden.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl des Ausgangsordners

      → Der Ordner suchen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.

    3. Klicken Sie auf OK.

  • Angabe der Stylesheet-Datei

    Sie benötigen eine XSLT-Datei als Stylesheet, das die Dateien im Hotfolder in das neue Ausgabeformat transformiert.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Angabe der Stylesheet-Datei

      → Der Öffnen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Stylesheet in Ihrem Dateisystem.

    3. Klicken Sie auf Öffnen.

  • Aktivieren des Hotfolders

    So starten Sie eine Hotfolder-Session.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zum Starten einer Hotfolder-Session

      → Der Hotfolder ist aktiv und wird überwacht. Bei Änderungen in diesem Ordner werden die Transformationsprozesse automatisiert angestoßen und die Ausgangsdokumente an die von Ihnen gewählte Stelle geschrieben.

      Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
      Eventuelle Fehlermeldungen im Rahmen der Hotfolder-Session werden im Fenster Statistics in der Registerkarte Log angezeigt.
      Ebenso werden Meldungen über den Beginn und das Ende der Hotfolder-Session ausgegeben.

  • Deaktivieren des Hotfolders

    So beenden Sie eine Hotfolder-Session.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zum Beenden einer Hotfolder-Session

      → Die Hotfolder-Session ist jetzt beendet.

      Eine Meldung über das Ende der Hotfolder-Session wird im Fenster Statistics in der Registerkarte Log angezeigt.

 

Registerkarte: Parameters

Automatisierte Transformationen mit Parameter-Übergaben

So übergeben Sie Parameter an einen Hotfolder.

  • Vorraussetzungen für die Übergabe von Parametern
    1. Wählen Sie zuvor die Registerkarte XSLT im Fenster Hotfolder und wählen dort die benötigten Dateien bzw. Ordner für den Transformationsprozess.

    2. Wählen Sie anschließend die Registerkarte Parameters.

      Fenster Hotfolder mit aktiver Registerkarte Parameters
  • Übergabe der Parameter

    Tools → Hotfolder → Parameters → <xsl:param>

    Parameter finden sich im XSLT-Stylesheet in folgender Form:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:param name="collection"/>
  <html>
   <body>
    <h1><xsl:value-of select="$collection"/></h1>

Hier wird ein Parameter als globales Element deklariert.

Das durch den XSLT-Prozessor übergebene Argument für den Parameter wird innerhalb des <h1>-Elements abgerufen.

Weiterführende Links zum Element <xsl:param>:

data2type: XML-Technologien → XSLT → XSLT 2.0-Referenz → <param>
w3schools: XSLT → <xsl:param>-Element

  1. Angabe der Parameter-Werte

    Listenansicht der Parameter innerhalb des Fensters Hotfolder

    Die Parameter-Namen des zuvor ausgewählten XSLT-Styesheets werden in der linken Spalte unter Parameter aufgelistet.

    Ansicht zur Eintragung der entsprechenden Werte innerhalb des Fensters Hotfolder

    Tragen Sie den an den entsprechenden Parameter zu übergebenden Wert in der rechten Spalte unter Value ein.

  2. Speichern der Parameter-Werte

    Klicken Sie auf die Schaltfläche Schaltfläche zur Übergabe der Parameter-Werte

    → Die Werte werden beim nächsten Transformationsprozess als Argumente an den XSLT-Prozessor übergeben.

  3. Wechseln Sie wieder auf die Registerkarte XSLT und starten Sie die Transformation.

    Tools → Hotfolder → Parameters → <xsl:param>

    Das Ergebnis der Parameter-Übergabe aus unserem Beispiel:

    <html>
    <body>
    <h1>data2type</h1>

    Das bei der Transformation übergebene Argument findet sich als Überschrift im HTML-Code wieder.

 

Hintergrund

Ein Hotfolder ist ein überwachter Ordner im Dateisystem. Änderungen in diesem Ordner führen dazu, dass die jeweils hinterlegten Prozesse sofort automatisiert ausgeführt werden.

    Änderungen im Hotfolder können sein:

  • Aktualisierung von Dateien.
  • Hinzufügen von Dateien.

    Die hinterlegten Prozesse beinhalten:

  • Transformation der Dateien im Hotfolder mit einem zugewiesenen XSLT-Stylesheet.
  • Schreiben der Ausgabedokumente in einen Zielordner.

XSD Documentation

Dokumentation von Schema-Dateien

Registerkarte: Single

Dokumentation einzelner Schemata

So erzeugen Sie eine HTML-Dokumentation einer Schema-Datei.

  • Aufrufen des Fensters XSD Documentation
    1. Wählen Sie im Menü Tools den Eintrag XSD Documentation.

      → Das Fenster XSD Documentation erscheint.

    2. Die Registerkarte Single ist standardmäßig beim ersten Aufruf bereits ausgewählt.

      Fenster XSD Documentation mit aktiver Registerkarte Single

  • Auswahl des Eingangsdokuments

    Sie benötigen eine Schema-Datei als Eingangsdokument, dessen Komponenten dokumentiert und visuell aufbereitet werden sollen.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl des Eingansdokuments

      → Der Öffnen-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Eingangsdokument in Ihrem Dateisystem.

    3. Klicken Sie auf Öffnen.

  • Auswahl des Ausgangsdokuments

    Sie benötigen eine HTML-Datei als Ausgangsdokument, in der die Schema-Datei dokumentiert und visuell aufbereitet werden soll.

    1. Klicken Sie auf die Schaltfläche Schaltfläche zur Auswahl des Ausgangsdokuments

      → Der Speichern unter-Dialog erscheint.

    2. Wählen Sie den Pfad zu dem Ausgangsordner in Ihrem Dateisystem.

    3. Vergeben Sie einen eindeutigen Namen für das Ausgangsdokument unter Dateiname.

    4. Klicken Sie auf Speichern.

  • Anzeige des Resultats im Browser

    Ansicht zur Anzeige des Results im Browser

    Aktivieren Sie das Kontrollkästchen vor Open Result in Standard Browser.

    → Das Ausgabedokument wird zusätzlich bei jedem Transformationsvorgang anschließend im Standardbrowser geöffnet.

  • Ausführen der Transformation

    Klicken Sie auf die Schaltfläche Schaltfläche zum Ausführen der Transformation

    → Das Ausgangsdokument wurde an die von Ihnen gewählte Stelle geschrieben.

    Das Resultat der Transformation wird zusätzlich im Fenster Statistics in der Registerkarte Results angezeigt.
    Eventuelle Fehlermeldungen im Rahmen der Transformation werden im Fenster Statistics in der Registerkarte Log angezeigt.

   

<< zurück vor >>