Warum nimmt man Perl und XML?

(Auszug aus "Perl & XML" von Erik T. Ray & Jason McIntosh)

Zunächst und vor allem ist Perl mit seinen Dateihandles, seinen Here-Dokumenten, seinen Möglichkeiten zur Stringbearbeitung und den in die Syntax integrierten regulären Ausdrücken ideal zur Bearbeitung von Text. Wer irgendwann im Leben schon einmal Code zur Stringbearbeitung in einer Low-Level-Sprache wie C geschrieben und dann dieselbe Aufgabe in Perl gelöst hat, der weiß, welche Umgebung besser für Textverarbeitung geeignet ist. In seinem Kern ist XML immer noch Text, und damit ist Perl das ideale Werkzeug, um mit XML umzugehen.

Darüber hinaus wird Perl seit der Version 5.6 allmählich mit auf Unicode basierenden Codierungssystemen vertraut, vor allem mit UTF-8. Diese Zeichensätze haben in XML eine besondere Bedeutung. Wir werden uns in "XML-Grundlagen: Lesen und Schreiben" noch genauer mit Zeichensätzen beschäftigen.

Der zweite Grund besteht im Comprehensive Perl Archive Network (CPAN), einer unerschöpflichen Quelle von Modulen, die frei einsetzbar sind. Diese Quelle existiert auf der ganzen Welt in unzähligen Duplikaten, den Mirrors. »Selbst ist der Mann«, werden viele an dieser Stelle denken, aber jeder, der ein Projekt in Perl programmiert, sollte zunächst einmal dieses kostenlose Kaufhaus voller fertiger Lösungen überprüfen, bevor man das Rad wieder neu erfindet. Auf die Dauer wird das mit Sicherheit Zeit und Aufwand sparen. Warum sollte man sich seinen eigenen XML-Parser schreiben, wenn es auf CPAN welche gibt, die zudem noch alle getestet und gut konfigurierbar sind? CPAN ist kein Einrichtungsgeschäft, sondern eher ein Wühltisch; Beiträge kommen von vielen Leuten und praktisch völlig unkontrolliert. Es gibt viele Perlen, aber wichtiger ist: Wann immer eine neue Technologie aufkommt, wird man in kurzer Zeit auch Software zu diesem Thema auf CPAN finden. Ganz besonders gut trifft sich das im Falle des ständig durch neue Standards ergänzten XML.

Als XML noch neu war, sprossen Module, die sich damit beschäftigen, wie Pilze aus dem Boden. Jedes Modul brachte seine eigene Programmierschnittstelle und seinen eigenen Stil. Alles war innovativ und gut brauchbar, aber nichts austauschbar. Neuerdings gibt es einen Trend hin zu einer einheitlichen Schnittstelle, die die Ersetzung eines Moduls durch ein anderes erleichtert. Wenn man mit dem einen SAX-Parser nicht zufrieden ist, nimmt man eben den anderen. Trotz der mangelnden Kontrolle findet also Zusammenarbeit statt, und die CPAN-Gemeinschaft weiß ihre Strömungen zu lenken.

Der dritte Vorzug von Perl liegt in seinen flexiblen, objektorientierten Möglichkeiten der Programmierung, die speziell im Bereich XML gut passen. Ein XML-Dokument ist eine hierarchische Struktur, die aus einem einzelnen Element, dem Stammelement, wächst. Dieses Element kann andere Elemente als Kinder enthalten, die ihrerseits Kindelemente enthalten können usw. Man kann alle diese Elemente, aus denen das Dokument besteht, sehr gut als Objekte einer einheitlichen Klasse darstellen, die alle derselben Programmierschnittstelle unterliegen. Die Art und Weise, wie XML-Markup seinen Inhalt einkapselt, entspricht weitgehend der Art, wie Objekte ihren Quelltext und ihre Daten einkapseln, so daß sich diese beiden Technologien gut ergänzen. Wir werden noch sehen, daß die meisten XML-Prozessoren durch Objekte gut modularisierbar sind. Es gibt Parser-Objekte, Factory-Objekte, die Parser erzeugen, und das Ergebnis eines Aufrufs des Parsers sind auch wieder Objekte. Das Resultat ist ein klarer, portabler Quelltext.

Als viertes sollten wir die Verbindung zwischen Perl und dem Web nicht vergessen. Java und JavaScript bekommen den Ruhm, aber wir wissen ganz gut, daß auf den meisten Servern irgendwo heimlich, still und leise ein Perl-Interpreter arbeitet.

Anmerkung: Ähnlich der Tatsache, daß in fast allen Firmen irgendwo eine kleine, alte Box steht, auf der dann kein Windows, sondern Linux läuft – es darf nur keiner dem Management sagen. – Anm. d. Ü.

Viele Bibliotheken, die dynamische Webinhalte produzieren, sind sehr einfach an XML anpaßbar. Die Entwickler, die diese Bibliotheken im Verlauf vieler Jahre aufgebaut haben, warten ungeduldig darauf, ihr Know-how in den XML-Bereich einzubringen.

Letzten Endes wählt man eben die Programmiersprache, die am besten zu den eigenen Bedürfnissen paßt. Perl ist ideal für die Arbeit mit XML. Natürlich sollte Ihnen unser Wort dafür nicht genügen, aber probieren Sie es doch einfach selbst einmal aus.

  

  

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Perl & XML bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:

Copyright © 2003 O'Reilly Verlag GmbH & Co. KG
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "Perl & XML" denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

O’Reilly Verlag GmbH & Co. KG, Balthasarstraße 81, 50670 Köln, kommentar(at)oreilly.de