Dateiaufteilung von OPS-Daten

(Auszug aus "E-Books mit ePUB ─ Von Word zum E-Book mit XML" von Dr. Victor Wang)

Hinter der an sich semantischen Frage nach der Gliederung verbirgt sich auch ein technisches Problem, nämlich ob und wie weit die OPS-Daten in Einzeldateien gesplittet werden.

Zunächst erscheint diese Frage verwunderlich, denn natürlich wäre es, eine einzige OPS-Datei zu erzeugen und weiterzuverarbeiten. Warum sollten also OPS-Daten auf verschiedene Dateien aufgeteilt werden?

In der Praxis – und dies hat mit technischen Limitierungen der verarbeitenden Lesesoftware bzw. Lesegeräten zu tun – stößt man bei zu großen Dateien auf Performancegrenzen. Bei umfangreichen Buchtiteln, die durchaus weit über 1.000 Seiten Umfang haben können, werden die erzeugten XML-Daten rasch mehrere Megabyte groß, vor allem dann, wenn eine tiefere semantische Struktur zugrunde liegt. Diese XML-Daten benötigen dann relativ viel Speicher und dies überfordert häufig die Lesesoftware.

Aus diesem Grund wird in der Regel – und dies nicht erst seit Erfindung von E-Book-Formaten – eine Aufteilung der XML-Daten vorgenommen. Und hier kommt nun die Frage der Gliederung wieder ins Spiel, denn was liegt näher, als eben diese als Kriterium heranzuziehen?

Die Dateiaufteilung (oder auch das Datei-Splitting) folgt dann einer vorgegebenen Logik. Im einfachsten Fall wird bei jeder Gliederungsebene eine neue Datei geschrieben, das Ergebnis sind dann so viele Einzeldateien, wie es Gliederungsebenen gibt. In unserem Beispiel würde der Ausschnitt der Gliederung wie in der folgenden Abbildung illustriert aussehen.

 

Dateiaufteilung auf jeder Gliederungsebene

Abbildung: Dateiaufteilung auf jeder Gliederungsebene

Häufig ist diese Dateiaufteilung aber aufgrund der hohen Datei-Anzahl bzw. der dann zu kleinen Gliederungseinheiten nicht gewünscht. Stattdessen wird eine bestimmte Gliederungsebene festgelegt, bei der die Dateiaufteilung erfolgen soll. Nehmen wir nun an, dass das Beispiel auf der zweiten Ebene aufgeteilt werden soll (siehe folgende Abbildung).

 

Dateiaufteilung bis zur Ebene 2 der Gliederung

Abbildung: Dateiaufteilung bis zur Ebene 2 der Gliederung

Aufmerksame Leser werden ein Problem bei beiden Konzepten der Dateiaufteilung erkannt haben: Bei direkt aufeinanderfolgenden Gliederungsebenen, wenn also kein Text zwischen zwei Überschriften folgt, enthält die OPS-Datei im Grunde nur noch die jeweilige Überschrift der oberen Gliederungsebenen. In den Beispielen trifft dies in beiden Fällen auf den "Teil III" und im ersten Fall auch auf den "Abschnitt 11" zu. Dieses Problem lässt sich durch die Wahl einer möglichst hohen Gliederungsebene als Aufteilungspunkt reduzieren. Alternativ könnte beispielsweise – auch im Sinne einer benutzerfreundlicheren Navigation – ein kurzes Inhaltsverzeichnis eingefügt werden, von dem aus auf die folgenden Unterkapitel gesprungen wird.

   

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema ePub bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:

Copyright © mitp 2011
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "E-Books mit ePUB" denselben Bestimmungen wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

Verlagsgruppe Hüthig Jehle Rehm GmbH, Im Weiher 10, 69121 Heidelberg, kundenbetreuung(at)hjr-verlag.de