Identifikation und Beschreibung des Inhalts

(Auszug aus "Newsfeeds mit RSS und Atom" von Heinz Wittenbrink, erschienen bei Galileo Press, 2005)

Das Element guid

Das Element guid ist in seiner Bedeutung mit link verwandt. Es dient in erster Linie dazu, ein item eindeutig zu identifizieren, und in zweiter Linie dazu, auch ein link zu diesem item herzustellen. guid ermöglicht es, einen einzelnen Eintrag permanent zu identifizieren. Der Inhalt von guid kann sich, muss sich aber nicht von dem Inhalt von link unterscheiden. link darf im Gegensatz zu guid einen kurzlebigen Verweis enthalten, z. B. den URI der Startseite eines Weblogs mit einem Fragment-Identifizierer.

guid soll einen "global eindeutigen Identifizierer" aufnehmen, wobei es dem Produzenten des Feeds überlassen bleibt, sicherzustellen, dass der Identifizierer tatsächlich eindeutig ist. Den bekanntesten Fall eines solchen Identifizierers bilden die Permalinks, die inzwischen von den meisten Weblog-Content-Management-Systemen zur Verfügung gestellt werden. Ein Permalink ist der URI, unter dem ein Weblog-Eintrag dauerhaft archiviert wird.

Die RSS-Spezifikation stellt ausdrücklich fest, dass es sich bei dem Inhalt von guid nicht um einen URL handeln muss. Allerdings soll RSS-verarbeitende Software davon ausgehen, dass es sich um einen URL handelt. Um diese Interpretation zu verhindern, muss mit dem Attribut isPermaLink und dem Wert false explizit angegeben werden, dass es sich um ein anderes Konstrukt handelt.

Die Definition des Elements guid wurde von den Verfechtern des Atom-Standards besonders heftig kritisiert, weil sie ungenau ist. Es wird einerseits nicht festgelegt, wie der Inhalt dieses Elements zu bilden ist. Es gibt also auch keinen verbindlichen Mechanismus, um sicherzustellen oder zu überprüfen, ob in diesem Element tatsächlich eindeutige Identifizierer verwendet werden. Viel problematischer ist, dass der Datentyp des Elements nicht festgelegt ist. Damit kann es sich ebenso um einen URI wie um einen String handeln. URIs und Strings haben aber unterschiedliche Identitätsbedingungen, denn ein URI-Parser kann zwei unterschiedliche Zeichenketten als denselben URI verstehen.

guid ist ein optionales Element. Viele RSS-Feeds verzichten darauf. In älteren Versionen kommt es nicht vor. Zu guid siehe auch die Seite Das Element guid der RSS 2.0-Referenz.

Das Element rating

Bei der Einführung von rating ging es vor allem darum, Auskunft darüber zu geben, ob der Inhalt eines Feeds jugendfrei ist oder nicht. Dazu kann man angeben, wie die Inhalte des Kanals entsprechend der Platform for Internet Content Selection (PICS) einzustufen sind. Zu rating siehe auch die Seite Das Element rating der RSS 2.0-Referenz.

Kategorisierung mit category

Mit dem Element category kann man einen Eintrag einer Kategorie zuordnen. Den Inhalt des Elements bildet der Name der Kategorie. Natürlich hat eine solche Zuordnung nur bedingt Sinn, wenn die Kategorie nicht zu einem System von Kategorien und ihren Benennungen gehört, das eine gewisse Verbindlichkeit besitzt, also zu einer Taxonomie. Innerhalb eines RSS-Dokuments lässt sich auf ein solches Kategoriensystem durch das optionale Attribut domain des Elements category verweisen. Der Wert von domain ist ein String, mit dem man das gewählte Kategoriensystem eindeutig identifizieren kann. Dabei kann es sich um einen URI handeln.

Den Inhalt von category bildet eine durch Schrägstriche getrennte Liste, die auf die hierarchische Stelle innerhalb der gewählten Taxonomie verweist. Ein Element des Typs item kann beliebig viele Kind-Elemente des Typs category enthalten. So ist es möglich, einen Beitrag verschiedenen Kategorien in derselben oder auch in verschiedenen Taxonomien zuzuordnen. Zu category siehe auch die Seite Das Element category der RSS 2.0-Referenz.

Quellenangabe mit source

Das Element source dient dazu, die Quelle anzugeben, der eine Nachricht entnommen wurde, wenn es sich dabei um einen anderen RSS-Feed handelt. Es enthält den Namen des Ursprungs-channel, dem ein Element entnommen wurde.

Dieses Element lässt sich am besten verstehen, wenn man von der gängigen Praxis in Weblogs ausgeht, Meldungen aus anderen Blogs zu zitieren, also vom klassischen Fall der Content Syndication. In diesem Fall wird bei einer Meldung mit source angegeben, woher die Nachricht stammt. Dabei soll der Textinhalt von source identisch mit dem Inhalt des title des zitierten Kanals (nicht also mit dem Titel eines seiner item-Elemente) sein.

Bei der Verwendung von source ist das Attribut url obligatorisch. Der Wert dieses Attributs wird (mit einer der rätselhaftesten Formulierungen der gesamten RSS 2.0-Spezifikation) als "XML-ization" der Quelle der Nachricht angegeben, also wohl als RSS-Feed der entsprechenden Quelle. Das Beispiel der Spezifikation (<source url="http://static.userland.com/tomalak/links2.xml">Tomalak's Realm</source>) zeigt, dass der URI des ganzen channel, nicht der URI der einzelnen Meldung – also ein Permalink auf die Meldung – gemeint ist.

source stammt aus RSS 0.92 und wurde für Software entwickelt, die zugleich als Weblog-Tool und als Aggregator dient, also für Programme, die es erlauben, Weblog-Einträge zu lesen und ausgehend von ihnen eigene Einträge zu posten. Mit dem Inhalt von source wird dann eine Angabe der Quelle generiert. Erst später wurde das Element guid eingeführt. Es wurde dann vorgeschlagen, den Inhalt von guid als Wert von source zu verwenden, wenn es sich dabei um einen Permalink handelt. Allerdings ist source eindeutig so definiert, dass der Titel der Quelle den Inhalt bildet und der Wert des Attributs link der URI des ganzen Feeds ist, nicht eines einzelnen Eintrags. Zu source siehe auch die Seite Das Element source der RSS 2.0-Referenz.)

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Newsfeeds mit RSS und Atom bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an: