Die Metadaten der Publikation

(Auszug aus "E-Books mit ePUB ─ Von Word zum E-Book mit XML" von Dr. Victor Wang)

Jede professionelle Publikation muss die wesentlichen Angaben wie Titel, Autor, Herausgeber, Verlag etc. mit sich führen. Diese Aufgabe übernehmen die Metadaten der Gesamtpublikation, für die das Open Publication Format die Syntax vorgibt. OPF stützt sich hierbei auf den Metadaten-Standard Dublin Core. Die entsprechenden Elementnamen tragen alle das Präfix dc des Dublin-Core-Namensraums, zum Beispiel <dc:title>. Nur in den Fällen, in denen es kein passendes Element in Dublin Core gibt, können eigene Metadaten deklariert werden. Diese sollten dann in XHTML-Syntax mit Hilfe des Elements <meta> geschrieben werden. Außerdem ergänzt OPF einige Attribute, die dann mit dem Präfix opf gekennzeichnet werden.

Betrachten wir als Beispiel die bibliografischen Angaben des folgenden Titels:

Autor Albert Einstein
Titel Über die spezielle und die allgemeine Relativitätstheorie
Verlag Springer Berlin Heidelberg
Auflage 24
Erscheinungsjahr 2009
ISBN 978-3-540-87776-9
DOI 10.1007/978-3-540-87777-6

Tabelle: Metadaten des Einstein-Beispiels

Das Metadatenelement innerhalb von <package> sieht in diesem Fall wie folgt aus:

<package unique-identifier="BestellNr87776" version="2.0" xmlns="http://www.idpf.org/2007/opf">      ①
  <metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">    ②
    <dc:title>Über die spezielle und die allgemeine Relativitätstheorie</dc:title>
    <dc:creator opf:role="aut" opf:file-as="Einstein, Albert">Albert Einstein</dc:creator>           ③
    <dc:language>de</dc:language>
    <dc:identifier opf:scheme="ISBN" id="BestellNr87776">978-3-540-87776-9</dc:identifier>           ④
    <dc:identifier opf:scheme="DOI">10.1007/978-3-540-87777-6</dc:identifier>                        ④
    <dc:publisher>Springer Berlin Heidelberg</dc:publisher>
    <dc:date opf:role="publication">2009</dc:date>
  </metadata>
   . . .
</package> 

Code-Beispiel: Dublin-Core-Metadaten des Einstein-Beispiels

Als unique-identifier wurde "BestellNr87776" in ①, abgeleitet aus der Bestellnummer der ISBN, gewählt. Wie beschrieben, muss der Inhalt dieses Attributs mit dem id-Attribut des Elements <dc:identifier> in ④ korrespondieren.

Wichtig ist die klare Trennung der Namensräume, da in der OPF-Datei Elemente aus verschiedenen Quellen zusammentreffen. Während das Wurzelelement <package> selbst den OPF-Namensraum xmlns:opf="http://www.idpf.org/2007/opf" in ① definiert, werden alle Metadaten in ② in das Element <dc:metadata> geschrieben und dabei dem Dublin-Core-Namensraum xmlns:dc="http://purl.org/dc/elements/1.1/" zugeschlagen.

In zwei Fällen wird die Dublin-Core-Grammatik um zwei eigene OPF-Attribute erweitert: In ③ wird das Element <dc:creator> um das Attribut opf:role="aut" ergänzt. Diese Erweiterung dient der genaueren Qualifizierung, welche Rolle die genannte Person innehat, nämlich die eines Autors.

Die zweite OPF-Erweiterung befindet sich in ④ im Element <dc:identifier> und auch hier geht es, parallel zu dem oben genannten unique-identifier, um die Angabe der Identität der Publikation. Im Beispiel sind sogar zwei identifier-Angaben zu finden, deren Bedeutung das OPF-Attribut opf:scheme festlegt: Im ersten Fall handelt es sich um eine ISBN-Nummer (opf:scheme="ISBN"), im zweiten um eine DOI (opf:scheme="DOI").

   

Im Folgenden werden nun die 15 Dublin-Core-Elemente beschrieben. Beginnen wir zunächst mit den drei Elementen, die OPF zwingend fordert: einen Titel, einen eindeutigen Bezeichner sowie eine Sprachangabe.

Titel <dc:title> (Pflichtangabe)

Eine ePUB-Publikation muss naheliegenderweise einen Titel besitzen, daher ist dieses Element zwingend vorgeschrieben. Offen hingegen lässt die Spezifikation, wie mit verschiedenen Titeln, beispielsweise einem zweiten fremdsprachlichen Titel, umzugehen ist. Es wird angenommen, dass das Lesegerät mindestens den ersten Titel anzeigt.

Eindeutiger Bezeichner <dc:identifier> (Pflichtangabe)

Auch der eindeutige Bezeichner ist innerhalb der Metadaten unverzichtbar. Wie eingangs bzw. im oben gezeigten Einstein-Beispiel gesehen, ist der Zusammenhang zwischen dem Attribut id von <dc:identifier> und dem Attribut unique-identifier von <package> zu beachten:

<package unique-identifier="BestellNr87776" version="2.0" xmlns:opf="http://www.idpf.org/2007/opf">
  <metadata xmlns:dc="http://purl.org/dc/elements/1.1/">
    ...
    <dc:identifier opf:scheme="ISBN" id="BestellNr87776">978-3-540-87776-9</dc:identifier>
  </metadata>   
  ...
</package> 

Sprachangabe <dc:language> (Pflichtangabe)

Die Metadaten müssen schließlich mindestens eine Angabe enthalten, welche die Sprache der ePUB-Publikation festlegt. Diesem Zweck dient das Element <dc:language>, dessen Werte dem unter XML/XHTML genannten Sprachattribut xml:lang entsprechen. Für deutsche Publikationen lautet dieser Wert beispielsweise einfach de. In der folgenden Übersicht sind einige der gängigsten Sprachen aufgeführt.

Angabe Sprache
de Deutsch
en Englisch
en-us Englisch – USA
en-gb Englisch – Großbritannien
es Spanisch
fr Französisch

Tabelle: Werte von <dc:language> für einige Sprachen

Mehrere Sprachangaben sind möglich, jedoch sollen Lesegeräte mindestens die erste auswerten.

Über die drei genannten Pflichtelemente hinaus sind die folgenden zwölf Dublin-Core-Elemente optional.

Autorenangaben <dc:creator>/<dc:contributor>

Dublin Core unterscheidet den Autor von anderen an der Publikation mitwirkenden Personen. Für Hauptautoren ist das Element <dc:creator> reserviert, während alle weiteren mitwirkenden Personen in <dc:contributor> geschrieben werden. Die etwas künstlich anmutende Unterscheidung zwischen den beiden Elementen wird klarer, wenn man sich das qualifizierende Rollen-Attribut opf:role ansieht. Die OPF-Spezifikation hat dieses Attribut ergänzt und legt eine umfangreiche Liste von möglichen Rollen fest, von denen hier nur einige wesentliche genannt seien:

  • aut: Autor, der den Inhalt hauptsächlich verantwortet
  • edt: Herausgeber/Editor, z. B. eines Sammelwerkes
  • ill: Illustrator
  • nrt: Erzähler in einem Hörbuch
  • red: Redakteur
  • trl: Übersetzer

Ein Hauptautor wird auf diese Weise mittels <dc:creator opf:role"aut"> definiert; für weitere Mitwirkende, beispielsweise einen Übersetzer, könnte das Element <dc:contributor opf:role"trl"> Verwendung finden. Sind mehrere gleichrangige Autoren vorhanden, so wird das jeweilige Element wiederholt. Die dargestellte Reihenfolge der Autorenangaben sollte vom Reader übernommen werden.

Bei der zweiten Ergänzung durch OPF handelt es sich um das optionale Attribut opf:file-as, das für eine normalisierte, leichter recherchierbare und maschinenlesbare Autorenangabe gedacht ist.

<dc:creator opf:role="aut" opf:file-as="Goethe, Johann Wolfgang von">Johann Wolfgang von Goethe</dc:creator> 

In der Regel ist dies eine für die Sortierung optimierte Angabe, die den Nachnamen voranstellt.

Datumsangaben <dc:date>

Für eine Publikation sind in der Regel bestimmte Datumsangaben nötig. Am wichtigsten ist hierbei vermutlich das Publikationsdatum, das Aufschluss über den inhaltlichen Stand eines Titels gibt. Auch hier ergänzt OPF die Dublin-Core-Spezifikation um ein optionales Attribut opf:event, welches das Datum genauer qualifiziert. Folgende Werte sind zulässig:

  • publication: das eigentliche Publikationsdatum, in der Regel das Erscheinungsjahr

  • creation: das Datum der erstmaligen Erzeugung, denkbar als Zeitstempel für die Datenerzeugung für ePUB

  • modification: ein Änderungsdatum, das zum Beispiel verschiedene Versionsstände innerhalb eines Publikationszyklus (im klassischen Print würde man dies die Auflage nennen) beschreiben könnte

Die Datumsangaben können entweder als vierstellige Jahresangabe (JJJJ) oder in der normalisierten Form JJJJ-MM bzw. JJJJ-MM-DD angegeben werden.

Thema/Schlagwort <dc:subject>

Eine thematische Zuordnung oder ein Schlagwort kann mittels des Elements <dc:subject> erfasst werden.

Format <dc:format>

Das Format-Element ist für den Medientyp gedacht. OPF nennt den MIME-Medientyp als mögliches Vokabular.

Quelle <dc:source>

Angabe einer eventuell vorhandenen Quelle, aus der die ePUB-Publikation erzeugt wurde, beispielsweise ein Datenbankexport.

Beschreibung <dc:description>

Eine zusätzliche Beschreibung der Publikation, denkbar ist hier eine Art Zusammenfassung (Abstrakt) oder ein dem Inhaltsverzeichnis vergleichbarer Text.

Typ <dc:type>

Eine Angabe zur Klassifizierung der Publikation. Diese Angabe sollte einer anerkannten Werteliste entnommen werden. Die Dublin Core Initiative empfiehlt hierzu eine spezielle standardisierte Typenliste, das so genannte "DCMI Type Vocabulary". Folgt man dieser Liste, so sollte hier in der Regel der Wert Text verwendet werden, der für alle Arten der schriftlichen Publikationen gedacht ist.

Publizierendes Organ/Verleger <dc:publisher>

Dieses Element markiert das publizierende Organ, das eine einzelne Person, eine Organisation, eine Firma oder ein Verlag sein kann.

Rechte <dc:rights>

Angaben über bestehende Rechte an der Publikation, in der Regel Urheberrechte. Wie alle hier genannten Angaben handelt es sich jedoch um ein reines Metadatum, das keinerlei Auswirkung auf den technischen Zugriff auf die Publikation bzw. dessen Beschränkung hat.

Beziehung <dc:relation>

Dieses Metadatum soll Angaben aufnehmen, die auf unterstützende externe Ressourcen verweisen, beispielsweise eine Online-Adresse, die weitere Angaben über die ePUB-Publikation enthält. Die Angabe sollte auf einem eindeutigen und anerkannten Identifikationssystem (z. B. einem URI) beruhen.

Abdeckung/Geltungsbereich <dc:coverage>

Dieses Metadatum dient der Beschreibung einer räumlichen oder zeitlichen Beschränkung des Geltungsbereiches der Publikation. Vorstellbar ist beispielsweise, dass die Publikation nur innerhalb eines bestimmten Zeitraums gilt und angewendet werden kann.

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema ePub bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:

Copyright © mitp 2011
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "E-Books mit ePUB" denselben Bestimmungen wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

Verlagsgruppe Hüthig Jehle Rehm GmbH, Im Weiher 10, 69121 Heidelberg, kundenbetreuung(at)hjr-verlag.de