EPUB3 und KF8 verstehen

Tekst
Loe katkendit
Märgi loetuks
Kuidas lugeda raamatut pärast ostmist
EPUB3 und KF8 verstehen
Šrift:Väiksem АаSuurem Aa

Andreas Kämmerle

EPUB3 und KF8 verstehen

Die E-Book-Formate EPUB3 und KF8 –

Möglichkeiten und Anreicherungen im Vergleich

pagina E-Books


Buchnavigation

•Buch lesen

•Haupttitel

•Inhaltsverzeichnis

•Informationen zu Andreas Kämmerle

•Informationen zum Buch

•Impressum

Inhaltsverzeichnis

  1 Einleitung

 2 EPUB 32.1 Publications 3.02.1.1 Der metadata-Container2.1.2 Der manifest-Container2.1.3 Das spine-Element2.1.4 Das bindings-Element2.2 Content Documents 3.02.2.1 HTML 5-Inhaltsdokumente2.2.2 Das HTML-Navigationsdokument2.2.3 MathML2.2.4 SVG2.2.5 JavaScript2.2.6 CSS2.3 Media Overlays 3.02.4 Open Container Format 3.02.4.1 Der abstrakte Container2.4.2 Der physische ZIP-Container2.4.3 Font-Verschlüsselung2.5 Unterschiede zu EPUB 22.6 EPUB erzeugen und validieren

 3 Kindle Format 83.1 Die Paketdatei OPF3.1.1 Der metadata-Container3.1.2 Der manifest-Container3.1.3 Das spine-Element3.1.4 Das guide-Element3.2 Die NCX-Navigationsdatei3.3 HTML-Inhaltsdokumente3.4 Das HTML-Inhaltsverzeichnis3.5 CSS3.6 KindleGen und Kindle Previewer

 4 Vergleich der Formate4.1 Die „Seite“4.2 Umbruch4.2.1 Seitenumbruch4.2.2 Hurenkinder und Schusterjungen4.2.3 Zeilenumbruch4.2.4 Satzarten4.3 Absätze4.4 Die Schriftart4.5 Auszeichnungen4.6 Initialen4.7 Festabstände4.8 Überschriften4.9 Listen4.10 Kästen4.11 Tabellen4.12 Text und Bild4.13 Marginalien4.14 Fußnoten4.15 Kolumnentitel und Pagina

  5 Einführung in Fixed Layout 5.1 Fixed Layout-Metadaten 5.2 Fixed Layout-Inhaltsdokumente 5.3 Fixed Layout-CSS

  6 Fazit

  Anhang Literaturverzeichnis Abkürzungsverzeichnis Das EPUB 3-Attribut epub:type Übersicht der Format-Eigenschaften Übersicht der Layoutunterstützung

[zurück]

1 Einleitung

Das Jahr 2012 wird als das Jahr in die Geschichte der Mediennutzung eingehen, in dem sich E-Books am Markt neben dem gedruckten Buch endgültig etabliert haben werden. Auch wenn die Verkaufszahlen der Produkte dieser jungen Technologie noch lange nicht die des großen Bruders Print erreicht haben und vielleicht nie erreichen werden, so ist die kritische Masse an Lesegeräten ebenso längst erreicht wie auch eine sozialpsychologische Akzeptanz in den für die Verlagen wichtigsten Käufer- und Leserschichten. Grund genug für die Publikums- und Fachverlage, ihre Inhalte künftig „crossmedial“, das heißt in mehreren Ausgabekanälen, zu publizieren.

„Crossmedial“ heißt dabei nicht zwingend „multimedial“ – der erste Schritt der Verlage ins digitale Publizieren ist in der Regel der, die selben Inhalte in derselben Anordnung vom Buch ins E-Book zu überführen. Das ist aufwändig genug, sehen sich viele Verlage doch zunächst der Aufgabe gegenüber, die Inhalte überhaupt in einer wieder verwertbaren, digitalen Form vorzuhalten – von einem integrierten Produktionsworkflow für Print und E-Book noch gar nicht zu reden.

Doch ist dies nur der erste Schritt, der die technischen und konzeptionellen Möglichkeiten der neuen Medien noch nicht adäquat berücksichtigt. Im gleichen Maße, wie sich das Mediennutzungsverhalten der Bevölkerung verändert (Interaktion, Zugriff auf vernetzte Information, Video-Einbindung in redaktionellem Kontext und vielem mehr), wächst auch der Druck, Verlagsinhalte diesen neuen Nutzungsgewohnheiten gemäß aufzubereiten.

Mit den beiden neuen E-Book-Standards EPUB 3 und KF 8 ist hierfür erstmalig die technologische Grundlage gegeben. Die „Enriched E-Books“ können kommen. Nicht weniger – aber auch nicht mehr. Denn unstrittig ist, dass viele Verlagsinhalte sich überhaupt nicht für eine derartige Anreicherung eignen. So soll auch mit dem vorliegenden Buch nicht der Eindruck vermittelt werden „nur ein Enriched E-Book ist ein gutes E-Book“. Eine solche Aussage würde verkennen, dass sich viele Leser dem E-Book schlicht aus Komfortgründen – Mobilität, Gewicht, Zugänglichkeit, Skalierbarkeit der Schrift etc. – zuwenden.

Doch wäre es ein Fehler, die neuen Möglichkeiten deswegen als Spielerei oder überflüssigen Ballast abzutun. Denn so, wie es Inhalte gibt, die sich nicht für ein Enriched E-Book eignen, so gibt es andere, bei denen der Nutzen unmittelbar erkennbar ist. Hier entstehen derzeit neue Märkte und neue Möglichkeiten der Produktentwicklung für Verlage. Die Entscheidung für die neuen Formate und deren Einsatz muss also in erster Linie aus Lektorat und Vertrieb kommen.

Spezifische Probleme der E-Book-Produktion

Weshalb aber ist im E-Book-Markt das Einhalten von Standards so wichtig? Hier kommen wir auf das gravierendste, spezifische Problem bei E-Books zu sprechen: Die Darstellung der Inhalte – präziser, die Berechnung, wie die Inhalte dargestellt werden – erfolgt erst auf dem Zielgerät, also auf dem jeweiligen E-Book-Reader des Kunden. Der Verlag hat also keine vollständige Kontrolle darüber, wie die Inhalte dargeboten werden. Das ist bei der Produktion von gedruckten Medien anders: Ist hier das erste Exemplar korrekt, so gilt das auch für die gesamte Auflage.

Für den Leser darf dieses Problem nicht zutage treten. Er hat zunächst einmal die berechtigte Erwartung, ein fehlerfreies und ansprechend umgesetztes Produkt für sein spezifisches Ausgabegerät zu erhalten. Das Interesse des Verlages muss darüber hinaus gehen. Es gilt, eine möglichst konsistente Darstellung auf allen Lesegeräten sicherzustellen. Wo das nicht ohne Weiteres möglich ist, muss die Optimierung für verschiedene Lesegeräte kostengünstig und automatisiert möglich sein. Der Verlag muss also bei der Produktion von E-Books immer alle gängigen Ausgabegeräte im Blick behalten. Das ist nur darüber zu gewährleisten, dass man sich an einen der Standards hält, die wiederum von den Lesegeräten unterstützt werden.

Aus der Veröffentlichung neuer Lesegeräte, der Nachfrage nach digitaler Literatur und der damit verbundenen, technologiegetriebenen Marktentwicklung haben sich zunächst verschiedene offene und proprietäre E-Book-Formate entwickelt. Aus dieser Vielfalt haben sich heute, neben dem klassischen PDF, die Formate EPUB und Mobipocket als die E-Book-Formate mit den vielversprechendsten Zukunftsaussichten etabliert.

Der offene EPUB-Standard, der unter Beteiligung von Software- und Medienunternehmen entstand, hat sich als das zentrale E-Book-Format für die Verlagswelt etabliert und wird von zahlreichen Ausgabemedien unterstützt. Daneben stellt das proprietäre Mobipocket-Format, das von den Amazon Kindle-Lesegeräten unterstützt wird, aufgrund der Marktposition und der Vertriebs-Infrastruktur des Online-Händlers den größten Konkurrekten im Bereich der reflowable[1] E-Book-Formate dar.

 

Das EPUB-Format wurde 2007 vom International Digital Publishing Forum entworfen. Das IDPF hat sich zum Ziel gesetzt, technische Standards für das elektronische Publizieren zu definieren. Zu den Mitgliedern der Organisation, speziell der EPUB Working Group, gehören unter anderem Hersteller von E-Reader-Geräten, Software-Unternehmen sowie Verlage und Dienstleister. Entsprechend existiert heute eine Vielzahl an Lesesoftware, -geräten und Autorenwerkzeuge, die das Format unterstützen, allen voran sei die kostenlose Software Adobe Digital Editions und die App iBooks für Apples iPhone und iPad zu nennen.

Bei EPUB handelt es sich um einen freien, internationalen Industriestandard, dessen technische Spezifikationen veröffentlicht sind. Das Format setzt selbst wiederum auf bestehenden Standards und Technologien auf. Diese offene und plattformübergreifende Struktur ermöglicht eine Integration in bestehende Publikationsprozesse.

Allerdings muss festgehalten werden, dass der EPUB-Standard von den bestehenden Leseanwendungen oft eigenwillig und nur unvollständig interpretiert und dargestellt wird. Dieses Problem, das auf die rasche Verbreitung des Formats zurückzuführen ist, wird sich mit den neuen Generationen von Lesegeräten hoffentlich von selbst lösen.

Mobipocket ist das proprietäre Format der Kindle-Plattform von Amazon. Der dahinter stehende französische Hersteller Mobipocket SA wurde im Jahr 2005 von Amazon übernommen. In einer leicht modifizierten Version wird das Format von den Kindle-Lesegeräten, sowie den kostenlosen Leseanwendungen, die für zahlreiche Betriebssysteme existieren, genutzt.

Es handelt sich hierbei um ein binäres und komprimiertes Endformat, das bezüglich der Inhaltsdaten jedoch auch auf bestehenden Standards basiert. Mobipocket weist jedoch, speziell was die Darstellungsmöglichkeiten betrifft, im Vergleich zu EPUB einen deutlich eingeschränkten Feature-Umfang auf.

Dass das Format so erfolgreich ist, liegt zu einem großen Teil an dem intelligenten Vertriebskonzept von Amazon. Der Online-Händler hat schon früh den Mehrwert eines weitreichenden digitalen Ökosystems erkannt und mit der geschlossenen Kindle-Architektur für eine feste Bindung der eigenen Kunden im Bereich E-Books gesorgt. Mit eigener Lese-Hardware (dem Kindle-Reader), die direkt auf das Angebot von Amazon zugreifen kann und somit für eine extrem geringe Hemmschwelle beim Kauf sorgt, wird das Konzept konsequent abgerundet.

Veröffentlichung von EPUB 3 und KF 8

Im Oktober 2011 wurde die finale Version der Spezifikation zum neuen EPUB-Standard in der Version 3 von der EPUB-Arbeitsgruppe des IDPF verabschiedet. Zeitgleich kündigte der Online-Händler Amazon Ende Oktober 2011 die Veröffentlichung des neuen E-Book-Formats Kindle Format 8 für seine Kindle-Plattform an, welches das aktuelle Mobipocket-Format ersetzen wird.

EPUB 3 ist eine weitreichende Überarbeitung des EPUB-Standards, die wesentliche Verbesserungen für komplexe, angereicherte und interaktive E-Books liefert. Die entscheidenden Neuerungen lassen sich in die Bereiche Layout, Multimedia-Fähigkeit, Sprachunterstützung sowie verbesserte Zugänglichkeit zusammenfassen. Dabei setzt das IDPF verstärkt auf den Ansatz, bestehende Technologiestandards in EPUB 3 zusammenzuführen.

Mit der Ankündigung des neuen Formats KF 8 seitens Amazon als Antwort auf EPUB 3 bleiben die Erwartungen, die Kindle-Reader würden zukünftig das EPUB-Format unterstützen, bis auf Weiteres unerfüllt. Die Frage, weshalb Amazon nach wie vor auf ein eigenes, proprietäres Format setzt, lässt sich durch die Erhaltung des Wettbewerbsvorteils des Anbieters auf dem bestehenden E-Book-Markt erklären – auch weiterhin können mit den Kindle-Geräten ausschließlich E-Books im Mobipocket- bzw. KF 8-Format, die über das eigene Online-Portal erworben werden, gelesen werden.

Die beiden neuen Formate EPUB 3 und KF 8 basieren im Wesentlichen auf denselben Kerntechnologien HTML 5 und CSS. Die Unterstützung dieser aktuellen Webstandards macht das hohe Innovationspotential des E-Book-Marktes deutlich. Die Formate bieten mit der Unterstützung multimedialer und interaktiver Elemente erstmals Möglichkeiten, die über die Darstellung von gedruckten Inhalten auf unterschiedlichen Displays hinausgehen. Langfristig werden Fortschritte und Innovationen im Bereich der Webanwendungen für E-Books nutzbar.

Bedeutung für die Verlagsbranche

Mittelfristig wird die Veröffentlichung der neuen E-Book-Formate deutliche Auswirkungen auf den Markt haben. Bis zu einer vollständigen Implementierung durch eine überwiegende Anzahl von Lesegeräten werden noch einige Monate vergehen – eine zeitnahe Umsetzung der weiterentwickelten Standards durch zentrale Leseanwendungen ist jedoch absehbar.

In jedem Fall müssen sich die Verlage damit auseinandersetzen, die neuen technologischen Entwicklungen konzeptionell zu nutzen, um die Digitalisierung aktiv voranzutreiben und sich am Markt zu platzieren. Verlage, die über die klassischen Printformate hinaus als professionelle Informationsanbieter wahrgenommen werden wollen, müssen sich bereits jetzt mit der Planung und Umsetzung neuer Features auseinandersetzen. Nur so kann es gelingen, zum richtigen Zeitpunkt mit neuen Produktformen an den Märkten präsent sein zu können, sobald sich diese etabliert haben.

Für einen Verlag, der erst mit dem Aufbau eines E-Book-Programmes beginnt, wäre es daher naheliegend, gleich die zukunftsträchtigen Formate EPUB 3 und KF 8 einzusetzen oder zumindest konzeptionell zu berücksichtigen – auch für Titel, die keine multimedialen Erweiterungen erfahren sollen.

Die überarbeitete EPUB-Spezifikation bietet im Vergleich zum neuen Kindle-Format eine umfangreichere Implementierung von Features, die die digitalen Möglichkeiten voll ausnutzen. In der derzeitigen Umstellungsphase kommen die Verlage jedoch nicht an einer Doppelstrategie für den Einsatz beider Versionen sowohl des EPUB- als auch des Kindle-Formats (EPUB 2/EPUB 3 und Mobipocket/KF 8) vorbei.

Aktuell stehen die Verlage im Spannungsfeld zwischen der Entwicklung neuer Produktformen und der einfachen Zweitverwertung in neuen Medienformen. Also der sinnvollen Nutzung aller digitalen Möglichkeiten und der Umsetzung der Strukturen und Bestandteile des klassischen gedruckten Buches.

Das beginnt für viele Verlage zunächst mit der systematischen Digitalisierung der Inhalte, um überhaupt den E-Book-Markt bedienen zu können und führt damit zwangsläufig zur Betrachtung der Strukturen vorhandener oder neuer Printpublikationen, die in diesem Zusammenhang als wichtige Grundlagenarbeit von besonderem Interesse für die E-Book-Produktion sind.

Zum Aufbau dieses Buches

Dieses Buch setzt sich mit den neuen E-Book-Formaten EPUB 3 und KF 8 unter der Berücksichtigung der genannten Anforderungen der Verlagsbranche auseinander. Dabei werden in einer grundlegenden Vorbetrachtung zunächst die beiden E-Book-Formate in ihrem Umfang analysiert und Umsetzungsbeispiele gegeben.

Es folgt ein Vergleich der Standards, der die Übertragung von Buchstrukturen in das digitale Format untersucht. Hierauf aufbauend wird eine Referenzübersicht entwickelt, die einen praxisnahen Überblick über die Unterstützung verlagsrelevanter Anforderungen durch die neue Generation der E-Book-Standards gibt.

[zurück]

2 EPUB 3

Grundsätzlich basiert das EPUB-Format auf den Internettechnologien HTML und CSS. Dabei ist die Auszeichnungssprache HTML die Technologie für die Strukturierung der Inhaltsdaten, während die Formatierungssprache CSS für die Darstellung der HTML-Daten verantwortlich ist. Der EPUB-Standard beinhaltet jedoch weit mehr als eine Sammlung von Definitionen für Struktur und Layout von Inhaltsdaten. Neben dieser wichtigsten Festlegung sind im EPUB-Standard auch alle anderen Aspekte, wie ein EPUB aufgebaut ist, verbindlich geregelt.

Bei dem EPUB-Format handelt es sich um einen speziellen ZIP-Container, der eine feste Struktur von Dateien beinhaltet. Die Dateiendung des Formats lautet .epub. Das Umbenennen dieser Dateiextension in .zip ermöglicht das Extrahieren des Inhalts mit einer ZIP-Anwendung.


Abb. 2.1 Typischer Aufbau eines EPUB 3-Containers

Die Art und Anzahl der Dateien, speziell innerhalb des OPS-Ordners, der die eigentlichen Inhaltsdateien enthält, variiert je nach Inhalt und Umfang des EPUBs. Die grundsätzlichen Bestandteile und die Verzeichnisstruktur des Formats sind jedoch festgelegt.

Der EPUB 3-Standard umfasst vier Substandards, die jeweils für unterschiedliche Aufgabenbereiche stehen. Jeder dieser XML-Standards ist von der Organisation IDPF in einem eigenen Spezifikationsdokument definiert. Am 11. Oktober 2011 erreichten die EPUB 3-Spezifikationen nach eineinhalb Jahren Arbeit der EPUB Working Group ihren finalen Stand als „Recommended Specification“. Sie sind unter http://idpf.org/epub/30 abrufbar. Die einzelnen Dokumente gliedern sich wie folgt:

 „Publications 3.0“ beschreibt die Metadaten und Dateistruktur innerhalb des EPUB-Containers

 „Content Documents 3.0“ definiert die Inhalte einer EPUB-Publikation

 „Media Overlays 3.0“ beschreibt die Struktur für die Synchronisierung von Text und Audio

 „Open Container Format 3.0“ definiert das Dateiformat und den ZIP-Prozess

2.1 Publications 3.0

Die „Publications 3.0“-Spezifikation definiert ein zentrales XML-Format zur Speicherung von Metadaten und Angaben über die Struktur der elektronischen Publikation. Sie finden ihren Niederschlag in einer verpflichtenden XML-Datei mit der Endung .opf. OPF steht für „Open Packaging Format“ und ist ein begriffliches Relikt aus der vorherigen EPUB-Version 2.

Die Metadaten enthalten Informationen über die Inhalte des E-Books, wie zum Beispiel Titel, Autor und Erscheinungsjahr, die sich von Ausgabemedien oder durch Suchanfragen auswerten lassen und somit einen Mehrwert bei der Distribution bieten können.

Die in der Spezifikation enthaltene Beschreibung zur Struktur des Dokuments umfasst eine vollständige Auflistung der im Archiv gespeicherten Inhaltsdateien, deren logische Reihenfolge (Serialisierung) und den Verweis auf das Navigationsdokument.

Darüber hinaus definiert die OPF-Spezifikation grundsätzliche Minimalanforderungen an den Inhalt, denen valide EPUB-Dokumente entsprechen müssen. Dazu gehören zwingend benötigte Dateien sowie die Bereitstellung von Fallback-Lösungen für Inhalte, die nicht verpflichtend von allen Ausgabemedien unterstützt werden müssen.


Abb. 2.2

Die OPF-Datei muss in einem EPUB zwingend vorhanden sein und kann wie in Abbildung 2.2 dargestellt auf oberster Ebene innerhalb des Inhaltsordners liegen. Fehlt diese Datei, ist das EPUB-Dokument invalide. Der Name der Datei sowie ihr Ablageort im EPUB-Verzeichnis kann beliebig gewählt werden (Referenzierung erfolgt über die container.xml-Datei, siehe Kapitel 2.4.1), die Extension muss allerdings .opf lauten.

1<package xmlns="http://www.idpf.org/2007/opf" version="3.0" unique-identifier="buchID">

2 <metadata xmlns:dc="http://purl.org/dc/elements/1.1/">

3 […]

4 </metadata>

5 <manifest>

6 […]

7 </manifest>

8 <spine>

9 […]

10 </spine>

11 <bindings>

12 […]

13 </bindings>

14</package>

 

Listing 2.1 Das Grundgerüst der OPF-Datei

Die OPF-Datei ist ein XML-Dokument und beginnt mit dem Wurzelelement package, das die Metadaten und Strukturinformationen umschließt. Die zwei Attribute version, mit dem Wert der aktuellen EPUB-Version 3.0, und unique-identifier, eine eindeutige ID, die dem Attribut-Wert id des Elements dc:identifier im metadata-Container entspricht (siehe Kapitel 2.1.1), sind verpflichtend. Das Element besitzt zudem die Namespace-Deklaration http://www.idpf.org/2007/opf. Das Wurzelelement umfasst ein Set an Container-Elementen, die jeweils Informationen zu einem der zuvor genannten Aspekte der Dokumentstruktur umfassen.

 metadata enthält die Metadaten der Publikation

 manifest listet unsortiert alle eingebundenen Dokumentressourcen

 spine legt die Lesereihenfolge der Inhaltsdateien fest

 bindings (optional) steuert den skriptbasierten Umgang mit Dateitypen, die durch das Ausgabemedium nicht unterstützt werden

2.1.1 Der metadata-Container

Die Metainformationen eines EPUB-E-Books wurden mit der EPUB-Version 3 um einige Bereiche erweitert. Hierzu gehört die Verfeinerung der bestehenden Metadaten und die Unterstützung weiterer Metadaten-Standards.

Die Metaangaben von EPUB 3 basieren analog zur Vorgängerversion auf dem Dublin Core Element Set (DCMES), das 15 Elemente zur Beschreibung einer Publikation umfasst.[2] Durch die Verwendung des Namespaces http://purl.org/dc/elements/1.1 am metadata-Element [1] kann auf dieses Elementset zugegriffen werden. Ergänzt wird dieses Metadaten-Set durch das meta-Element, welches eine Detaillierung der Dublin-Core-Elemente ermöglicht sowie zusätzliche Metadaten-Standards unterstützt.

Der minimale Umfang an Metadaten umfasst die Elemente dc:identifier, dc:title und dc:language sowie den property-Attributwert dcterms:modified für das meta-Element. Die Dublin Core Metadata Terms (DCTERMS) gehören zu den vom Standard reservierten Präfixen des meta-Elements. Sie stellen eine Ergänzung des DCMES dar und enthalten verfeinernde wie auch zusätzliche Elemente. Das folgende Beispiel stellt ein solches minimales Set an Metadaten für eine EPUB-Publikation dar:

1<metadata xmlns:dc="http://purl.org/dc/elements/1.1/">

2 <dc:title>EPUB 3 und KF 8 verstehen</dc:title>

3 <dc:language>de</dc:language>

4 <dc:identifier id="bookurl">http://www.pagina-online.de/epub</dc:identifier>

5 <meta property="dcterms:modified">2012-10-10T12:00:00Z</meta>

6</metadata>

Listing 2.2

Eine vollständige Übersicht über die Dublin-Core-Elemente zur Verwendung in EPUB gibt die nachstehende Tabelle.


Element Vorkommen Bedeutung
dc:title verpflichtend Publikationstitel
dc:language verpflichtend Sprache (Werte entsprechend RFC5646)
dc:identifier verpflichtend Eindeutige Bezeichnung (z. B. ISBN), mehrere möglich
dc:contributor optional Mitwirkende
dc:coverage optional Zeitlich oder räumlich einschränkender Geltungsbereich
dc:creator optional Autor(en)
dc:date optional Erscheinungsdatum
dc:description optional Inhaltliche Beschreibung
dc:format optional Medientyp
dc:publisher optional Herausgeber bzw. Verlag
dc:relation optional Externe Ressource, auf die sich die Publikation bezieht
dc:rights optional Hinweise zu Urheberrechten
dc:source optional Angabe der Quelle, aus der die Publikation erzeugt wurde
dc:subject optional Thematisches Schlagwort
dc:type optional Klassifizierung der Publikationsart

Tab. 2.1 Das Dublin Core Elementset

Mit Hilfe des wiederholbaren meta-Elements können diese Metainformationen nun weiter ausdifferenziert werden. Es besitzt zwingend das Attribut property, dessen Wert einer definierten Eigenschaft entsprechen muss. Es wird unterschieden zwischen vordefinierten Eigenschaften, reservierten und neu definierten Präfixen. Der genaue Umgang mit diesen Attributwerten wird im Abschnitt „4.2 Vocabulary Association Mechanisms“ der Spezifikation beschrieben. Soll mit dem meta- Element ein Dublin Core-Element näher beschrieben werden, wird das refines-Attribut benötigt. Mit der folgenden Zeile wird ein Titel als Untertitel des E-Books klassifiziert:

<meta refines="#titel" property="title-type">subtitle</meta>

Listing 2.3 Spezifizierung der Dublin Core-Metadaten

Mit dem optionalen scheme-Attribut kann zudem ein bestehendes Schema wie das ONIX-Datenformat, auf welchem der Elementinhalt aufbaut, referenziert werden.

Mit Hilfe des meta-Elements lassen sich beispielsweise komplexe Titelstrukturen klassifizieren. Die Metaangaben einer Publikation mit dem Haupttitel „EPUB 3 und KF 8 verstehen“, dem Untertitel „Möglichkeiten und Anreicherungen“ und dem vollständigen Titel (zum Beispiel für die Archivierung) können wie folgt umgesetzt werden:

1<dc:title id="titel1">EPUB 3 und KF 8 verstehen</dc:title>

2<meta refines="#titel1" property="title-type">title</meta>

3<meta refines="#titel1" property="display-seq">1</meta>

4<dc:title id="titel2">Möglichkeiten und Anreicherungen</dc:title>

5<meta refines="#titel2" property="title-type">subtitle</meta>

6<meta refines="#titel2" property="display-seq">2</meta>

7<dc:title id="titel3">Die Möglichkeiten und Anreicherungen von EPUB 3 und KF 8</dc:title>

8<meta refines="#titel3" property="title-type">fulltitle</meta>

9<meta refines="#titel3" property="display-seq">3</meta>

Listing 2.4 Metadaten-Auszeichnung einer komplexen Titelstruktur

Zusätzlich zu den Möglichkeiten der näheren Beschreibung bestehender Dublin-Core-Elemente, lassen sich mit dem meta-Element für sich selbst stehende Metainformation ergänzen. In diesem Fall wird das refines-Attribut weggelassen. Ein Beispiel ist die bereits genannte dcterms:modified-Eigenschaft mit dem vordefinierten dcterms-Präfix, die eine Versionierung der EPUB-Publikation ermöglicht (in Verbindung mit dem Unique Identifier ergibt sich eine eindeutige Identität für unterschiedliche Versionen derselben Publikation). Auf diesem Weg kann auf bestehende Metadaten-Strukturen zurückgegriffen werden, die bereits im Verlag für die Distribution eingesetzt werden, und die EPUB-Publikation um diese Angaben ergänzt werden. Weitere nativ unterstützte Metadaten-Standards neben DCTERMS sind MARC, das von Amazon eingesetzte ONIX sowie XSD. Da die Dublin Core-Elemente bereits die wichtigsten Angaben zu einer Publikation enthalten, wird die Implementierung weiterer Metadaten-Standards in der Verlagsbranche selten zum Einsatz kommen.

Mit dem prefix-Attribut am Wurzelelement package lassen sich zudem bestehende oder eigene Namespaces für die Anreicherung mit individuellen Metadaten wie beispielsweise verlagsinternen Angaben deklarieren.

1<package […] prefix="pa: http://www.pagina-online.de/">

2 <metadata xmlns:dc="http://purl.org/dc/elements/1.1/">

3 […]

4 <meta property="pa:bearbeiter">Andreas Kämmerle</meta>

5 […]

Listing 2.5 Definition von Metadaten über einen eigenen Namespace

Darüber hinaus ist es möglich, auf umfangreiche Pakete an Metainformationen außerhalb des EPUB-Containers zu verweisen. Ein externer Datensatz kann mit dem Element link referenziert werden. Mit dem rel-Attribut wird eine vordefinierte oder Namespace-basierende Eigenschaft (entsprechend dem meta-Element) deklariert, auf deren Datenquelle im Attribut href verwiesen wird. Direkt unterstützte externe Ressourcen sind MARC21, MODS, ONIX, XML Signature und das von Adobe eingesetzte XMP.

<link rel="xmp-record" href="http://pagina-online.de/xmp/beispiel.xml"/>

Listing 2.4 Link auf ein externes XMP-Metadatenset