Das Modul Easy News Topics

(Auszug aus "Newsfeeds mit RSS und Atom" von Heinz Wittenbrink, erschienen bei Galileo Press, 2005)

In den letzten Jahren ist immer wieder versucht worden, die Themen von Newsfeeds eindeutiger und verbindlicher zu definieren als mit dem Element category. (Wobei es auch category zulässt, sich auf eine Nomenklatur zu beziehen.) Einen interessanten Versuch in dieser Richtung legten Matt Mower und Paolo Valdemarin mit Easy News Topics (abgekürzt ENT) vor. Das Element category reicht ihnen nicht aus, weil es nicht erlaubt, die angegebenen Themen an eine Systematik zu binden. Der Namensraum für das ENT-Modul ist: "http://www.purl.org/NET/ENT/1.0/".

Diese Erweiterung hat zwei Hauptziele:

Sie soll es möglich machen, die Themen von Einträgen so zu bezeichnen, dass intelligente Aggregatoren thematische Feeds erstellen können. Aggregatoren können dazu z. B. Feeds, die mit den ENT-Auszeichnungen ausgestattet sind, filtern und neu kombinieren. Dieses Ziel verfolgen allerdings auch alle anderen Entwickler, die bisher Erweiterungen für Topics oder Kategorien vorgeschlagen haben – mit bisher mäßigem Erfolg, denn keines dieser Systeme wurde in nennenswertem Ausmaß implementiert.

In ihrem zweiten Ziel unterscheiden sich die Entwickler von Easy News von anderen Systemen mit ähnlichen Aufgaben: Durch Verlinkung sollen es die Easy News-Elemente erlauben, mächtigere und flexiblere Standards zu nutzen.

Die ENT-Entwickler gehen davon aus, dass sich andere Module mit ähnlichen Zielen nicht durchgesetzt haben, weil sie zu komplex und damit für die meisten Anwender zu schwierig sind.

Die Elemente des Moduls Easy News Topics

Das Modul definiert nur zwei Elemente, nämlich cloud und topic. Dabei ist eine beliebige Anzahl von Elementen des Typs topic Inhalt von cloud.

Das Element cloud gibt eine Quelle für Topics an, und zwar in Form eines URI. Dieser URI kann auf ein RDF-Dokument, eine OPML-Liste oder eine Topic Map verweisen, die weitere Informationen über die Topics enthält. Topic Maps sind ein Standard für Metainformationen, der sich in seinen Funktionen mit RDF überschneidet. Eine Topic Map funktioniert wie ein Index für eine beliebige Anzahl von Quellen. Dabei werden nicht Wörter, sondern Begriffe oder Konzepte indiziert, eben Topics. Im Falle dieser Seite, könnte z. B. RSS-Erweiterungen ein solcher Topic sein. Eine Topic Map ist ein XML-Dokument mit Informationen darüber, an welchen Stellen von Dokumenten Topics vorkommen. In der Topic Map-Terminologie handelt es sich dabei um "Okkurenzen" von Topics. Darüber hinaus werden in einer Topic Map aber auch die Beziehungen zwischen Topics beschrieben. Die Erweiterungen von RSS 2.0 stehen z. B. in einer Beziehung zu dem Topic Erweiterungen, die man als "Unterklasse/Überklasse" bezeichnen kann. Auf diese Weise lassen sich semantische Netze aufbauen, die eine große Zahl von unterschiedlichen Quellen beschreiben. Weitere Informationen zu dieser hochinteressanten Technik finden Sie auf der Topic Maps-Seite der "Cover Pages".

ENT verlangt nicht, dass sich unter dem URI tatsächlich ein Dokument findet. Es ist der Anwendung überlassen, wie mit einer Ressource umgegangen wird, die sich unter dem angegebenen URI befindet. Das Element identifiziert das Vorkommen (englisch: "occurence") eines Topics im Sinne des Topic Map-Standards.

cloud hat drei Attribute, wobei das Attribut href obligatorisch und die beiden Attribute infoRef und description optional sind:

href Verweist auf den URI der Quelle der Topics.
infoRef Kann einen URI aufnehmen, unter dem sich Informationen über diese Quelle finden, also etwa eine für Menschen lesbare Dokumentation.
description Dient demselben Zweck wie die gleichnamigen RSS 2.0-Elemente und kann eine kurze Beschreibung der cloud enthalten, die eventuell von einem Useragent dargestellt wird.

In dem Element topic wird eine "benannte Repräsentation eines Subjekts" angegeben. Der topic kann einfach als Zeichenkette (PCDATA) angegeben werden. In Verbindung mit cloud ermöglicht er es aber, das Thema des Eintrags eindeutig zu identifizieren.

id Muss ein Fragment-Identifizierer im Sinn der geltenden Definition von URIs (bzw. IRIs, ihrer internationalisierten Version) sein. Er darf innerhalb der gewählten cloud nur einmal vorkommen. Zwei Topic-IDs eines Dokuments dürfen hingegen durchaus gleich sein, da sie sich auf ihren jeweiligen Cloud-href beziehen und in dieser Kombination wieder einzigartig (unique) sind und im Sinne einer XML Topic Map (XTM) interpretiert werden können.
classification Enthält den Typ des Topics. Dieses Attribut kann nur sinnvoll verwendet werden, wenn als Cloud ein System angegeben ist, das eine Klassifikation unterstützt.
href Nimmt den URI einer für Menschen lesbaren "Seite" auf, die sich auf den Topic bezieht.

Der Entwurf enthält u. a. das folgende Beispieldokument:

<item>
   <title>
   <link>http://www.example.org/blog/2003/04/08.html#a855</>
   <guid>http://www.example.org/blog/2003/04/08.html#a855</guid>
   <pubDate>Tue, 08 Apr 2003 10:28:59 GMT</pubDate>
   <description>Here is the text of the item.</>
   <ent:cloud ent:href="http://matt.blogs.it/topics/resources/topicRoll.opml">
      <ent:topic ent:id="sf_giants">San Franscisco Giants</ent:topic>
   </ent:cloud>
   <ent:cloud ent:href="http://www.examples.com/mlb.xtm">
      <ent:topic ent:id="barry_bonds" ent:classification="player">Barry Bonds</ent:topic>
      <ent:topic ent:id="ray_durham" ent:classification="player">Ray Durham</ent:topic>
      <ent:topic ent:id="felipe_alou" ent:classification="manager">Felipe Alou</ent:topic>
   </ent:cloud>
</item>

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Newsfeeds mit RSS und Atom bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an: