Inhaltsverzeichnis

E-Book-Indexing

Stand der Dinge

Schaut man sich E-Books mit Indexen an, so fallen bei den Indexen folgende Dinge auf:

Eine typische Registerstelle in diesem Werk sieht folgendermaßen aus:

XML files, {XML export}, {XML export}, {XML examples}
  examples of, {XL examples}
  exporting to, {XML export}
  exporting from, {XML export} 

Zur besseren Erkennung sind hier die Links in geschweifte Klammern gesetzt.

Einige Regeln für Indexe zu E-Books:

Bei der Untersuchung der Fundstellen im obigen Beispiel kommt heraus, dass die gleichbenannten Locators zu Stellen im Text führen, die zwar nicht identisch sind, aber nahe beieinanderliegen; eventuell sind die zugehörigen Textmarken im gedruckten Werk auf unterschiedlichen Seiten gewesen, aber im E-Book wird nur eine diffuse Umgebung um die eigentlich richtige Stelle herum angesprungen, weswegen man den Eindruck hat, fast an derselben Stelle zu landen. Ergebnis: Das Register ist dermaßen redundant, dass es schon weh tut. Es hätte eigentlich folgendermaßen aussehen müssen:

XML files
  {examples of}
  {exporting to, exporting from} 

In der letzten Zeile sind die beiden Begriffe „exporting to“ und „exporting from“ zu einem einzigen Link zusammengefasst worden, denn beide führen zur selben Stelle, aber dem Leser wird auf diese Weise deutlich, dass es an dieser Stelle eben um beides geht. Allerdings kann man darüber streiten, ob es nicht sinnvoller wäre, beide Locators als separate Links aufzuführen, also:

XML files
  {examples of}
  {exporting from} 
  {exporting to}

Wahrscheinlich ist die zweite Variante tatsächlich besser.

Die Frage lautet, weshalb es bei der Erzeugung des Index für das obige E-Book zu solch eklatanten Fehlern gekommen ist. Es muss einen technischen Grund geben. Wahrscheinlich ist die Umsetzung des Index für die Printausgabe in den Index für das E-Book vollautomatisch gelaufen, und zwar nach einem primitiven Algorithmus.

Ideen für gute E-Book-Indexe

Während die obigen Punkte aus der Analyse eines Beispiel-Index stammen, sollen hier ein paar grundsätzliche Überlegungen beschrieben werden.

Sämtliche Überlegungen gelten für EPUB-2. Sobald EPUB-3 zum Standard auf den meisten Geräten geworden ist, erübrigen sich sehr wahrscheinlich etliche der Ideen, weil sie durch bessere Techniken ersetzt werden.

IDPF-Standard zum Indexing

https://idpf.org/epub/idx/epub-indexes.html

Verlinkungen

Eine der wichtigsten Fragen lautet: Wohin sollen Links in einem E-Book führen? Da es keine festen Seiten gibt, hat es keinen Sinn, aus einer evtl. vorliegenden ursprünglichen Seitenzahl einen Link auf die ursprüngliche Seite zu setzen in der Hoffnung, im E-Book würde man nicht zu weit weg von der eigentlichen Zielstelle landen.

Genau diesen Effekt, nämlich relativ weit weg von der Wunschstelle zu landen, findet man aber bei sehr vielen E-Book-Registern. Daraus kann umgekehrt nur geschlossen werden, dass genauso vorgegangen wurde, wie vorstehend beschrieben: die ursprüngliche Seite wurde als Sprungziel verwendet und danach wurde die Seitenzahl im Index gelöscht; der Link liegt auf dem Eintragstext.

InDesign-Indexe: Bei E-Book-Indexen, die mit InDesign erstellt wurden, werden immer die Seitenzahlen (bei Seitenbereichsangaben nur die Anfangsseitenzahlen) verlinkt. Und zwar zeigt sich, dass InDesign analog zu Acrobat immer an den Anfang (oder die Mitte?) der jeweiligen Seite verlinkt. Das heißt aber, es gibt keinen Link zur eigentlichen Fundstelle, sondern eben nur zur Seite allgemein. Problem: Mit Seite ist immer die Druckseite gemeint, die es aber auf dem E-Book-Reader nicht mehr gibt! Was muss man als Leser nun machen: vor- oder zurückblättern?, wenn vorblättern: um wieviele E-Book-Seiten?

Wie kann das Problem gelöst werden? Antwort: Die Verlinkung muss komplett anders vorgenommen werden. Es darf nicht auf Seiten verlinkt werden, sondern das Linkziel muss die spezifische Textstelle sein, an der sich das Stichwort aus dem Indexeintrag befindet.

Technisch gesehen hat ein Linkanker immer die Syntax

<a id=„Anker_n“></a>

wobei n eine Laufnummer ist, durch die die id des Ankers eindeutig wird: Anker_01, Anker_02 usw. Die id könnte aber auch auf andere Weise eindeutig gemacht werden. Sie kann zum Beispiel dem Namen einer Textmarke entsprechen, die in Word (oder einem anderen Quellprogramm) vergeben wurde. Textmarken müssen immer eindeutig sein.

Die restliche Syntax des Ankers erklärt sich von selbst.

Dient Word als Quellprogramm, können per Makro vor alle XE-Feldern eindeutige Textmarken gesetzt werden.

Word-Textmarken können in der Hyperlink-Funktion von Word als Zielanker verwendet werden. Darüber hinaus werden Textmarken in der Form <a name=„Textmarkenname“></a> in HTML umgewandelt; diese Anker werden 1:1 an EPUB übergeben. Damit sie auch im EPUB als Zielanker für Verlinkungen dienen können, muss im EPUB-Programm per Suchen/Ersetzen die Syntax <a id=„Textmarkenname“></a> erzeugt werden; es ist also nur „name“ gegen „id“ auszutasuchen!

Zum Erzeugen der Textmarken in Word sind sechs Schritte nötig:

  1. Vor jedem XE-Feld wird ein Namenstext eingefügt, der aus Buchstaben und dem SEQ-Feld besteht, also z. B. „index_{ SEQ „index“ \n }“. Im ersten Namenstext muss manuell der Schalter \r 1 in das SEQ-Feld eingetragen werden: „index_{ SEQ „index“ \r 1 }“. Dies dient als Startwert für die Nummerierung.
  2. Nun wird das gesamte Dokument markiert und per F9 werden die Felder aktualisiert. Jetzt sind alle Namenstexte eindeutig.
  3. Jetzt werden alle SEQ-Felder fixiert (also in normalen Text umgewandelt).
  4. Nun vor den Namenstexten Textmarken erzeugt, deren Namen mit den Namenstexten identisch sind. Wichtig: die Textmarken dürfen keinen Textbereich umfassen, sondern müssen für sich allein stehen: ][
  5. Jetzt werden die Namenstexte in der letzten Indexebene aller XE-Felder eingebaut (also immer Doppelpunkt gefolgt vom jeweiligen Namenstext).
  6. Im letzten Schritt werden die Namenstexte vor den XE-Feldern gelöscht. Vor jedem XE-Feld steht aber eine Textmarke.

Damit alles effektiv abläuft, sollten die einzelnen Makros von einem übergeordneten Gesamtmakro aus aufgrufen werden.

Damit ist zweierlei erreicht:

  1. Alle Zielanker sind erzeugt (die Textmarken vor den XE-Feldern).
  2. Die Information, wohin später verlinkt werden soll, liegt bei jedem Eintrag vor: nämlich zur Textmarke mit dem jeweiligen (eindeutigen) Namen.

Schlagworte

Hier tut sich gleich eine weitere Frage auf: Was ist mit Schlagworten? Schlagworte sind Begriffe, die einem Text zugewiesen werden; sie tauchen so geschrieben im Text nicht auf. Wohin soll also ein Link gehen? Anders ist die Situation bei Stichworten, denn ihr Kennzeichen ist gerade, genauso geschrieben im Text vorzukommen.

Aus meiner Sicht muss die Verwendung von Schlagworten grundsätzlich überdacht werden. Was ist z. B. mit Texten, die keine „vernünftigen“ Stichworte als „Anker“ haben und die nur durch Schlagworte prägnant beschrieben werden können? In einem gedruckten Werk wird man vom Register zu einer bestimmten Seite geführt und kann sich relativ rasch ein Bild davon machen, um was es auf der Seit geht. Mit anderen Worten, man kann gut nachvollziehen, weshalb die Seite auf diese Weise und nicht anders verschlagwortet wurde. Bei einem E-Book ist die Situation aber vollkommen anders. Es ergeben sich gleich mehrere Fragen:

Die letzten beiden Punkte betreffen nicht nur Schlagworte, sondern auch Stichworte. Es handelt sich um Grundmerkmale von Verlinkungen.

Einsatz von Textmarken

Aus dem Vorstehenden geht hervor, dass beim Einsatz von Schlagworten (also Begriffen, die so geschrieben nicht im Text vorkommen), Textmarken als Ziel der Verlinkung genommen werden sollten. Der Leser landet dann immer am Beginn der Textmarke und kann zumindest erwarten, dass die folgenden Absätze etwas mit dem Schlagwort zu tun haben.

Seitenbereichsangaben

Seitenbereichsangaben, also Angaben wie 201-203, lassen sich nicht vernünftig in EPUB umsetzen.

Man könnte zwar daran denken, den Bereich komplett hervorzuheben, aber das bringt dem Leser nicht viel, weil der Druckseitenbereich 201-203 auf dem E-Book-Reader abhängig von den gewählten Anzeigevoreinstellungen über viele (u. U. 10 oder mehr) Bildschirmseiten laufen kann. Bereits nach den ersten Blättern-Aktionen weiß man als Leser nicht mehr, wo innerhalb des hervorgehobenen Bereichs man sich befindet.

Aus meiner Sicht wäre es besser, den Leser immer nur an den Beginn des Bereichs zu führen und ihm zu überlassen, wie weit er blättern möchte. Eine Hervorhebung ist nicht nötig, weil - wie vorstehend beschrieben - eher irritierend.

Eine Hervorhebung ist aus meiner Sicht nur sinnvoll, wenn es sich beim Indexbegriff um ein Schlagwort handelt und der Locataor nur aus einem einfachen Seitenverweis besteht. Siehe oben.

Bereichsangaben: die Rückkehr von f und ff

Eine Konsequenz ist, dass Bereichansangaben, die im Druckbereich eines der Qualitätskennzeichen von Registern sind, bei E-Books keinen Sinn mehr haben. Denn für einen Bereich bei einem E-Book gilt:

Selbst wenn man von Seiten-Bereichen wegginge hin zu Bereichen, die über Absätze definiert wären, könnte das Phänomen, beim Sprung zu einem Bereich immer an seinem Anfang zu landen, ohne zu wissen, über wie viele Bildschirmseiten er sich erstreckt, nicht umgangen werden. Besser wäre es daher, beim Eintrag lediglich einen Hinweis auf die besondere Bedeutung des Begriffs zu geben (z. B. Hervorhebung durch Fettschrift, farbige Schrift oder Schrifthinterlegung oder zurück zum guten alten f und ff!) und somit von vornherein nur den Sprung zu einer bestimmten Stelle im Auge zu haben.

Die f- und ff-Angaben würden sich natürlich nicht auf Seiten beziehen, sondern auf die bei E-Books einzig mögliche Einheit Absatz.

Nutzung von Merkmalen

Aus dem Problem des nicht zielgerechten Springens vom E-Book-Index zum Text ergibt sich die Überlegung, jeden Index-Eintrag mit Zusatzinfos zu versehen, die es dem Leser erleichtern, nach dem Sprung die Orientierung zu finden. Mann könnte, wie es ja auch bei gedruckten Indexen manchmal gehandhabt wird, bei jedem Eintrag Merkmale mitführen, wie z.B. B für Bild oder T für Tabellentext (oder auch f. und ff., siehe vorstehenden Abschnitt). Im Grunde könnten ähnliche Merkmale genommen werden, wie sei bei QuIndex zum Einsatz kommen:

Neue, speziell für E-Books einzusetzende Merkmale wären die f- und ff-Kennzeichnung.

Praxistests zeigen, dass die feine Unterteilung der Überschrifthierarchien überflüssig ist, denn wenn man auf dem Reader auf einer Seite landet und dort eine Überschrift (oder sogar mehrere) sieht, kann man mit der Information, zu welcher Überschriftordnung die Zielstelle gehört, nicht viel anfangen. Dagegen ist die Info sehr hilfreich, dass die Zielstelle grundsätzlich eine Überschrift ist und nicht der übliche Text.

D.h., die folgenden Merkmale sollten verwendet werden:

f und ff wären zusätzlich zu den anderen Merkmalen zu verwenden!

f stünde würde für einen weiteren Absatz, ff für zwei oder mehr weitere Absätze.

Die Merkmale müssten bei der Festlegung der Indexeinträge in Word gleich miteingegeben werden, und zwar am besten in eckigen oder spitzen Klammern.

Mögliche Spezialwege

Inhaltsverzeichnisse: ihre besondere Technik

Was bei fast allen E-Books mitgeliefert wird, ist das Inhaltsverzeichnis. Die Verlinkung von Inhaltsverzeichnissen scheint eine der ersten und wichtigsten Anforderungen an E-Books gewesen zu sein und ist technisch gesehen ein Standardverfahren. Die Frage lautet: kann dieses Standardverfahren auch für die Umsetzung von Indexen genutzt werden? Wie wir unten sehen werden, geht genau das!
Eine wichtige Konsequenz aus der Nutzung von Inhaltsverzeichnistechniken ist, dass ein Index optisch ganz anders aussehen müsste, als wir es vom Gedruckten her gewohnt sind: jeder Indexeintrag müsste die komplette Information enthalten, d.h. vor allem, dass das Hauptthema immer mitgeführt werden müsste. Es würde dann auch nichts bringen, wenn mit Einzügen gearbeitet würde! Jeder Eintrag müsste linksbündig angeordnet sein. Das käme außerdem der Anforderung entgegen, die sich aus den Abmessungen von E-Book-Reader-Displays ergibt: Auf diesen kleinen Bildschirmen muss jeder Raum ausgenutzt werden, Einzüge würden einen Index vollkommen nutzlos werden lassen, insbesondere dann, wenn eine große Schrift eingestellt ist. Auch die Orientierung im Index kann nur dadurch sichergestellt werden, dass in jedem Eintrag das Hauptthema mitgeführt wird.

Lösung des Indexproblems durch Nutzung der Suchfunktion

Selbst wenn die Links aus dem Index heraus in der oben angegebenen Weise gesetzt sind und jeder Indexeintrag die komplette Information enthält (also das Hauptthema mitgeführt wird), besteht immer noch das Problem, dass man erst einmal zum Index gehen muss, um von hier den Sprung zum Ziel auszuführen. Und wenn man feststellt, dass es die falsche Stelle war oder dass man gerne zum selben Thema noch eine andere Stelle aufsuchen möchte, muss man wieder zum Index zurückgehen, um einen weiteren Sprung ausführen zu können. Was heißt „zurückgehen“? Nichts anderes, als zum Index zu Blättern oder mit die „Gehezu“-Funktion zu verwenden. Das ist allerdings recht mühsam und nutzt die Möglichkeiten des Mediums E-Book nicht aus. Eines der wesentlichen Merkmale aller digitalen Medien ist die Suchfunktion, die im Grunde so arbeitet wie die entsprechende Google-Funktion: man ruft die Suche auf, gibt einen Begriff ein, schickt die Suche ab und bekommt eine Liste von Fundstellen präsentiert.
Ich möchte behaupten: Nur wenn der Index voll und ganz in die vorgegebene Technik des Kindle- und EPUB-Formats integriert wird, wird er von den Anwendern genutzt. Dazu muss der Index in die Suchfunktion, die auf jedem Reader zur Verfügung steht, „eingebettet“ sein.
Der Index ist für die Suchfunktion ganz normaler Text, der wie auch das Inhaltsverzeichnis, bei der Suche mit abgedeckt wird. Das heißt, in der Fundliste sind auch Indexeinträge enthalten. Das Entscheidende: die Indexeinträge müssen als solche erkennbar sein! Dazu muss ihnen bereits bei der Indexerstellung ein Merkmal verpasst werden. Eine Möglichkeit bestünde zum Beispiel darin, jeden Eintrag mit einem Vorsatz wie „ind#“ oder auch nur „i#“ zu versehen würde.

Vorteile:

In jedem Fall würde man durch Antippen einer Index-bezogenen Fundstelle von der Fundliste aus im Index landen. Und wenn man dann hier den Begriff antippt, würde der Sprung zum eigentlichen Ziel im Text erfolgen. Bestünde der Wunsch, eine andere Stelle zum selben Thema anzuschauen, bräuchte nur wieder die Suche aufgerufen zu werden. Die Fundliste wäre sofort präsent und man könnte entscheiden, ob man z.B. einen Indexbegriff mit einem anderen Unterthema als Sprungquelle verwenden möchte. Man würde erneut im Index landen und von dort aus den Sprung zum neuen Ziel ausführen.

Nachteile: Praxistests zeigen, dass ein solcher Index

Fazit: Die Kennung der Einträge mit einem Vorsatz kann leider nicht angewandt werden.

Technische Erzeugung eines E-Book-Index

Wie kann aber aus einem in digitaler Form vorliegenden Index, der für die Printausgabe erstellt wurde, ein vernünftiger Index für das entsprechende E-Book werden? Vernünftig heißt: sowohl funktional als auch optisch ansprechend.
Alles Nähere dazu wird unter Index mit HyperLinks beschrieben.

Dazu wird das Programm AutoBookmark, ein Acrobat-Plug-In, verwendet. Einzelheiten sind dort zu finden.