Benutzer-Werkzeuge

Webseiten-Werkzeuge


indexing:html_indexer

HTML Indexer

Achtung: bei der Installation unbedingt den Blank im Namen des Verzeichnisses entfernen, in dem das Programm installiert wird. Sonst versteht das Programm nicht, wo die Dateien alle liegen. Insbesondere wird dem Browser u.U. ein falscher Pfad zum Starten des Ausgabe-Files übergeben.

Um vernünftig mit dem Programm arbeiten zu können, sind drei Dinge nötig:

  1. das Programm selbst
  2. ein Browser
  3. ein HTML-Editor

Welcher Browser und welcher HTML-Editor vom Programm beim Aufrufen der entsprechenden Befehle („View“ bzw. „Edit“) verwendet werden sollen, muss in den „Preferences“ eingestellt werden.

Vorbereitungen

Um einen Index anlegen zu können, muss dem Programm zunächst beigebracht werden, wo die zugehörigen html- oder Help-Dateien liegen. Dazu folgendermaßen vorgehen:

  1. Befehl „New“ wählen; damit wird ein neues Projekt angelegt
  2. im daraufhin aufgehenden Fenster das Verzeichnis wählen, in dem die Dateien, für die der Index erzeugt werden soll, liegen. Achtung: es müssen Dateien mit der Endung .html sein, nicht .htm. Zur Not bei einer .htm-Datei das „l“ dranhängen. Allerdings gilt das nur für das Erkennen der Dateien. Wenn sie im HTML-Indexer drin sind, muss das „l“ in der Dateinamenerweiterung weggenommen werden, weil das Programm anscheinend intern mit .htm arbeitet. Scheint ein Bug zu sein.
  3. nun mit dem Befehl „Add Files“ die Dateien explizit dem Projekt zuordnen (das kann und muss evtl. später jederzeit wiederholt werden)
  4. Projekt unter dem gewünschten Namen abspeichern (= Name der .html-Seite, die später den Index enthält)

Das Programm erzeugt sofort und vollautomatisch aus bestimmten Merkmalen der Dateien (wie z.B. Titel, Überschriften usw.) Indexeinträge. Diese können bearbeitet und/oder durch weitere Einträge ergänzt werden.

Erzeugen von Einträgen

Indexeinträge können auf dreifache Weise erzeugt werden:

  1. automatisch, indem das Programm alle Inhalte von Überschriften einer Webseite oder von auf der Webseite vorhandenen Textmarken (engl. „anchors“) in Einträge umsetzt
  2. manuell, indem innerhalb des Programms die Einträge eingegeben werden
  3. manuell, indem innerhalb des HTML-Editors Textmarken gesetzt werden (die dann anschließend automatisch vom Programm in Indexeinträge umgewandelt werden, siehe 1.)

Beim manuellen Vorgehen gemäß 2. sollte die zugehörige Web-Seite parallel im Browser geöffnet sein; denn sonst sieht man den Inhalt der Seite nicht und weiß nicht, welche Begriffe man vergeben soll.

Zum Setzen von Textmarken sollte ein WYSIWYG-HTML-Editor wie Frontpage verwendet werden; Textmarken lassen sich aber auch über einen ASCII-Editor entsprechend den HTML-Konventionen setzen (<name =„Markenname“>). Der Name der Textmarke wird vom HTML-Indexer in einen gleichlautenden Indexeintrag umgesetzt. D.h., sämtliche Überlegungen zur Wahl des Eintrags (wie: was soll Hauptthema, was Unterthema werden usw.) können/sollten bereits bei der Vergabe des Textmarkennamens angestellt werden. Allerdings kann der Eintrag später (im HTML-Indexer) problemlos bearbeitet und verändert werden.

Für Unterthemen gibt es kein Extra-Feld; ein Unterthema wird, durch Komma getrennt, direkt hinter das Hauptthema geschrieben.

Aufbau des Eintragsfensters

Das Fenster besteht aus drei Spalten:

  1. in der ersten Spalte stehen Merkmale: <H1, <H2 usw. für „Heading-Levels“ im Text; <Ti für „Title“, <A für „Anchor“, also für eine Textmarke
  2. die zweite Spalte enthält den eigentlichen Eintrag (mit Haupt- und Unterthema; ein Unterthema wird als solches deklariert, indem einfach zwischen ihm und dem Hauptthema ein Komma gesetzt wird)
  3. in der dritten Spalte steht der Locator, also der Ziel-URL (der zur Seite bzw.zur Textmarke geht)

Anschauen des Index

Angelegte Einträge können im Browser angesehen werden. Dazu einfach den Befehl „View - Output File“ wählen. Damit wird der unter „Preferences“ eingestellte Browser gestartet und der Index angezeigt.

Bearbeiten des Index

Dies geschieht üblicherweise an zwei Stellen:

  1. direkt im Programm: Eintrag für Eintrag indem jeder doppelgeklickt wird
  2. im HTML-Editor (der unter „Preferences“ voreingestellt wird), in dem der Gesamtcode jeder einzelnen Seite bearbeitet werden kann

Das Arbeiten im HTML-Editor ermöglicht zwei Dinge (die im HTML-Indexer selbst nicht gehen):

  1. das Anlegen neuer Textmarken
  2. Suchen/Ersetzen und somit das schnelle und konsistente Ändern mehrerer Einträge auf einmal

Wenn neue Textmarken angelegt wurden, muss die Seite vom HTML-Editor aus abgespeichert werden. abnschließend ist im HTML-Indexer die Seite aus der Liste der zugeordneten Dateien zu entfernen (einfach draufklicken, Delete-Taste) und gleich danach wieder zuzuordnen (siehe oben: „Vorbereitungen“).

Wird per HTML-Editor nicht eine Inhaltsseite der Web-Site geöffnet, sondern die Seite, die den Index enthält (die heißt üblicherweise „indexer.htm“), so sind sämtliche Einträge auf einmal zu sehen und können in der ASCII-Sicht mit Suchen/Ersetzen verändert werden. Aber aufgepasst: Dabei genau auf die HTML-Syntax achten!

indexing/html_indexer.txt · Zuletzt geändert: 2020/09/26 17:38 von 89.204.138.66