Feed-Formate und andere XML-Formate

(Auszug aus "Newsfeeds mit RSS und Atom" von Heinz Wittenbrink, erschienen bei Galileo Press, 2005)

Syndikationsformate sind keine Nachrichtenformate

Dass RSS nicht einfach als Nachrichtenformat bezeichnet werden kann, zeigt ein Vergleich mit expliziten Nachrichtenformaten, wie sie von Nachrichtenagenturen und kommerziellen Verlagen verwendet werden. Hier setzt sich zunehmend die Kombination NITF/NewsML durch. NITF steht für "News Industry Text Format" und ist ein XML-Dialekt, um die inhaltlichen Bestandteile von Nachrichten, z. B. Überschriften, Einführungstexte, Namen von Personen und Organisationen, auszuzeichnen. NewsML ist ein Format für den "Mantel" von Nachrichten mit Informationen über Veröffentlichungsdaten, die Rechtesituation u. Ä. NewsML und NITF liegt ein Modell von Nachrichten in einem journalistischen Sinn zugrunde. Für Feed-Formate spielt diese Semantik keine wichtige Rolle. Ihre Semantik ist wesentlich abstrakter.

NewsML/NITF sind weder Formate für die Information über den Zustand einer – veränderlichen – Webressource noch Formate für Feeds, also für Dokumente, die unterschiedliche Informationsobjekte zusammenfassen.

Von NewsML und NITF unterscheidet sich RSS dadurch, dass alle RSS-Botschaften sich auf Ressourcen im WWW beziehen, die durch einen URI identifizierbar sind. Für ein RSS-Dokument ist charakteristisch, das es mit einer kompletten Ressource verknüpft ist und dass die einzelnen Informationsobjekte ebenfalls Links enthalten oder enthalten können. Im Kern ist ein RSS-Dokument nichts anderes als eine einfache (zweistufige) Hierarchie von Links, die mit einem Titel und einer Beschreibung versehen sind. Dieses Raster ist so allgemein, dass es sich auf jede Ressource im Web bezieht, die überhaupt identifizierbar ist, also einen URI besitzt, benennbare Bestandteile hat und sich zeitlich verändert.

Unterscheidung von Botschaftsformaten

Unterscheiden kann man RSS aber auch von den Botschaftsformaten, die in den letzten Jahren für maschinenlesbare Daten entwickelt wurden. Bekannte Formate dieser Art sind XML-RPC und SOAP. Diese Formate dienen im Wesentlichen dazu, Daten im Web austauschen, die in der Regel nie ein Mensch zu Gesicht bekommt. Mit XML-RPC werden Programmfunktionen auf entfernten Rechnern angesprochen. SOAP ist ein Format für den Umschlag von beliebig komplexen Botschaften (ebXML), zum Beispiel von Dokumenten, die bei E-Business-Prozessen ausgetauscht werden.

Es ist sicher kein Zufall, dass der amerikanische Entwickler Dave Winer sowohl RSS wie auch XML-RPC und SOAP maßgeblich beeinflusste. Es handelt sich bei diesen drei XML-Vokabularen um Formate für das Messaging im Web. Gemeinsam ist ihnen, dass sie außer dem HTTP-Protokoll selbst keine weiteren Vermittlungstechnologien brauchen; auch SOAP und XML-RPC kann man als End-to-end-Technologien bezeichnen. Insbesondere für Winer stellen XML-RPC und SOAP komplementäre Technologien zu RSS dar, mit deren Hilfe sich komplette Publikationslösungen erstellen lassen.

RSS ist ein Format für Dokumente, deren Adressaten Menschen sind, während SOAP ein Format für Daten ist, die von Maschinen verarbeitet werden sollen. Durch die Erweiterungsmöglichkeiten können alle neuen RSS-Versionen tatsächlich als Umschläge für beliebige Daten verwendet werden. Dabei bleibt aber doch die Semantik von RSS erhalten: Die Botschaften informieren über den Zustand einer Webressource, die sich als Sammlung gleich strukturierter Informationsobjekte modellieren lässt.

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Newsfeeds mit RSS und Atom bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an: