Aggregierung von Feeds und OPML

(Auszug aus "Newsfeeds mit RSS und Atom" von Heinz Wittenbrink, erschienen bei Galileo Press, 2005)

In einem RSS 2.0-Dokument kann nur ein Element des Typs channel Nachkomme eines Elements des Typs rss sein. So repräsentiert das Dokument immer genau eine Webressource.

Damit stellen sich die Fragen, ob und wie die Inhalte mehrerer Feeds zusammengefasst werden können. Diese Frage ist nicht akademisch, denn aggregierte Feeds spielen angesichts wachsender Informationsmengen eine immer wichtigere Rolle. In einem aggregierten Feed können z. B. Informationen zu einem Thema, die aus verschiedenen Quellen stammen, zusammengefasst werden.

RSS kennt kein Element, das die Aufgabe eines Meta- oder "Über"-Channels erfüllen würde. Es ist nicht möglich, mehrere Elemente namens channel in ein Element rss einzubetten. Es ist auch verboten, das Element channel rekursiv zu verwenden, also ein Element channel in ein anderes Element channel einzubetten. (Bei der Diskussion von Atom schlug Roy Fielding tatsächlich rekursive Feeds vor, er konnte sich damit aber nicht durchsetzen.)

RSS 2.0 besitzt ein Element mit dem Namen source, mit dem man angeben kann, aus welcher Quelle ein item stammt. Dieses Element lässt sich benutzen, um Elemente aus mehreren Quellen in einem Feed zu kombinieren. source hat aber nur die Funktion einer Quellenangabe, es sagt nichts darüber, ob und wie die Quelle verändert wurde.

Lösungsansatz in RSS 2.0: Outline Processing Markup Language (OPML)

Um mehrere Feeds zu einer Einheit zusammenzufassen, gibt es im Umkreis der RSS 2.0-Techniken ein anderes Mittel, nämlich die Outline Processing Markup Language (OPML). Auch diese Sprache wurde von Dave Winer entwickelt. (Outlines, also Dokumentgliederungen, waren der Ausgangspunkt vieler Entwicklungen von UserLand. Auch ein RSS 1.0-Dokument hat die Struktur eines Outlines, das auf tieferen Ebenen mit Material gefüllt werden kann.)

In der Praxis wird OPML immer verwendet, wenn man Informationen über eine Menge von Feeds austauschen will. Benutzer von Bloglines und NetNewsWire können z. B. eine Liste der Feeds, die sie abonniert haben, als OPML-Dokument exportieren. OPML ist auf der Seite Outline Processing Markup Language ausführlicher beschreiben. Natürlich können Sie in einem OPML-Dokument auch Atom- und RSS 2.0-Feeds auflisten.

Lösungsansatz in RSS 1.0: MOD_AGGREGATION

RSS 1.0 hat ein eigenes Erweiterungsmodul für aggregierte Feeds, nämlich mod_aggregation. Es dient dazu, "aggregator-added information about the original source of the RSS item" aufzunehmen. Bei RSS 1.0 wurde diese Funktion außerdem in das (nicht offizielle) Modul MOD_LINK aufgenommen. Hier bezieht sich das Attribut aber eindeutig auf die Quelle für ein einzelnes item. Es wird auch vorgeschlagen, das Attribut für die Angabe der Herkunft eines Items in einem Aggregator zu verwenden. Zu den beiden Modulen siehe mod_aggregation und mod_link unter den vorgeschlagenenen RSS 1.0-Modulen.

Lösungsansatz in Atom: Aufnahme von Metadaten des Ursprungsfeeds in den Eintrag

Atom geht einen anderen Weg und erlaubt es, die Metainformationen für einen Feed innerhalb eines einzelnen Eintrags zu wiederholen, wenn dieser Eintrag in einen anderen Feed integriert wird. So können Feeds aggregiert werden, deren Bestandteile die Informationen über ihren Ursprungsfeed mit sich führen. In älteren Versionen von Atom entsprach ein Element atom:origin weitgehend dem RSS-Element source.

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Newsfeeds mit RSS und Atom bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an: