Benutzer-Werkzeuge

Webseiten-Werkzeuge


indexing:quindex

QuIndex

Austausch mit Cindex und Sky

Interessant ist v.a. ein formatierter Austausch.

  • Der ist mit Sky problemlos möglich, weil Sky Tab-begrenzte .txt-Dateien einladen und auch exportieren kann, und zwar mit den Codierungen für die Formatierungen; vor allem gut: Sky exportiert komplette Datensätze mit allen Feldern, also auch Felder, die nichts enthalten. Es entsteht eine echte Tabelle mit sytematischer Anordnung der Inhalte. Die Seitenzahlen, und das ist besonders wichtig, stehen alle im Feld „Page“ und sind nicht, wie bei Cindex-Exporten, mal hier, mal da. Da Sky Cindex-dat-Dateien importieren kann, eignet es sich als Vermittlungsprogramm zwischen Cindex und QuIndex.
  • Cindex 2 exportiert .dat-Dateien, die Formatierungscodes enthalten; sie können aber nicht direkt in QuIndex importiert, sondern müssen entweder manuell in Excel/Word oder automatisch in Sky zwischenaufbereitet werden; da Sky die Aufbereitung automatisch vornimmt, ist dieser Weg vorzuziehen.
  • Cindex 3 kann keine .dat-Dateien mehr exportieren, sondern nur noch .arc- oder .xml-Dateien. Beide Formate können mit halbautomatischen Verfahren (Excel/Words) so aufbereitet werden, dass ein Import in QuIndex möglich wird. Vorzuziehen ist jedoch das Zwischenschalten von Cindex 2 und Sky: Cindex 2 versteht das .arc-Format und kann .dat exportieren, das wiederum von Sky importiert werden kann. Von Sky aus ist dann ein problemloser austausch mit QuIndex möglich (s.o.).
  • In QuIndex existiert ein Script, mit dem .txt-Dateien exportiert werden können, die sich - nachdem die Endung in .dat umbenannt wurde - problemlos in Cindex und Sky importieren lassen. So ist der Kreis geschlossen.

Sortierte Anzeige und "Verschwinden" von Datensätzen

Wenn beim Kopieren von UT nach UT_sort der Datensatz nach Abschluss der Operation verschwindet (wirkt, wie wenn er gelöscht wurde) oder um mehrere Datensätze nach oben oder unten rutscht, keine Panik: Das kommt daher, dass die Datensätze in einer sortierten Anordnung angezeigt werden. Ab FileMaker 10 führt eine vorliegende Sortierung dazu, dass die Datensätze sofort auf der Basis dieser Sortierung neu einsortiert werden, sobald man etwas sortierrelevantes geändert hat. Eine Änderung an UT_sort ist sortierrelevant, daher die Verschiebung. Will man das verhindern, so muss man vor der Aktion eine unsortierte Anordnung herbeiführen.

Was in QuIndex überprüft werden kann

Die Stärke von QuIndex ist das Überprüfen von datensatzübergreifenden (also eintragsübergreifenden) Eigenschaften der Daten; dazu müssen Datensätze (also Einträge) miteinander verglichen werden. In Cindex und Sky (ebenso in Macrex) gibt es nur wenige Funktionen, die Datensätze miteinander vergleichen:

  • die Compress-Funktion, mit der doppelte und gelöschte Datensätze gefunden und entfernt werden können,
  • der Befehl „Reconcile“, mit dem der Beginn von Arrays überprüft wird; besteht ein Array nur aus einem Datensatz, wird ein evtl. vorhandenes Unterthema in das Main-Feld gezogen und vom Hauptthema durch Komma abgetrennt; hat ein Array mehrere Datensätze, bleiben die Unterthemen im Sub1-Feld. Damit Cindex die Entscheidung treffen kann, muss es durch den Vergleich mehrerer Datensätze Arrays grundsätzlich erkennen.
  • die Verweisprüfung; dabei muss Cindex in der Tat - ähnlich wie eine relationale Datenbank oder wie die Lookup-Funktion in Excel - einen Datensatz (von dem aus verwiesen wird) mit anderen Datensätzen vergleichen und Übereinstimmungen oder Abweichungen finden.

Diese Vergleichsfunktionenn sind sehr hilfreich und sollten genutzt werden; QuIndex kann dabei kaum helfen (höchstens bei der Verweisprüfung).

QuIndex kann dagegen weitere Vergleiche anstellen, die in Cindex und Sky nicht möglich sind. Dazu zählen:

  • das Bilden von Clustern auf der Basis von Wortstämmen
  • das Finden von inhaltlichen Redundanzen innerhalb von Clustern: dieselben Begriffe können innerhalb eines Clusters innerhalb oder außerhalb eines Arrays auftreten, was ein großer Fehler wäre.

Beispiel:

Absatz 104, 107
- Absätze zusammenhalten 113
- Absatzkontrolle 112
- Abstand 111
- Ausrichtung 105
- Einzug 106
- Hängender Einzug 108
- Initial 109
- Seitenwechsel 109, 114, 141
- Vertikale Ausrichtung 109
- Zeilen zusammenhalten 113
- Zeilenabstand 111
Absatzabstand 330
Absatzformate 104
Absatzkontrolle 112

Hier gibt es einen Cluster „Absatz“ mit dem Array „Absatz“ und weiteren einzelnen Einträgen außerhalb dieses Arrays. Im Array und außerhalb tauchen die Begriffe „Absatzabstand“ und „Absatzkontrolle“ auf, was natürlich nicht sein darf. Die Bereinigung solcher Fehler trägt wesentlich zur Qualität eines Registers bei. Das bereinigte Register würde folgendermaßen aussehen:

Absatz
- Absätze zusammenhalten 113
- Abstand 111, 330
- Ausrichtung 105
- Einzug 106
- - Erstzeilen- 107
- - hängender 108
- Formate 104
- Initial 109
- Kontrolle 112
- Seitenwechsel 109, 114, 141
- vertikale Ausrichtung 109
- Zeilen zusammenhalten 113
- Zeilenabstand 111

  • das Finden von Mehrzahl-/Einzahlfehlern, und zwar separat für Hauptthemen und Unterthemen
  • das Finden von Schreibweisenabweichungen (z.B. zusammen, getrennt, mit Bindestrich), und zwar separat für Hauptthemen und Unterthemen
  • das Finden von Array-Haupteinträgen, die einen oder mehrere Seitenverweise haben

Beispiele: Das obige „Absatz-Beispiel“ zeigt diesen Fall, ein weiteres Beispiel wäre das folgende:

Adiuretin 212–214, 332
– Analoga 150-151, 213–214
– Mangel 399–398
– Sekretion 212-213

Hier hat der Array-Haupteintrag die Seitenverweise 212-214 und 332; ihm folgen aber Untereinträge mit weiteren Seitenverweisen. Weshalb, kann man sich als Leser fragen, gibt es Seitenverweise direkt vom Hauptbegriff Adiuretin aus? Solche Stellen sind zwar nicht grundsätzlich verboten, aber problematisch, weil der Leser vermuten kann, der Indexer hätte sich keine Mühe gegeben, auch die Unterthemen zu den Seitenverweisen im Array-Haupteintrag zu finden. Die Aufgabe für den Indexer wäre also, nachzuschauen, welche Unterthemen evtl. sinnvoll und notwendig sind. Die Bearbeitung könnte auch darauf hinauslaufen, die vorhandenen Unterthemen aufzulösen und alle Seitenverweise direkt hinter dem Array-Haupteintrag zu bringen. Das heißt, diese Art der Bearbeitung trägt ganz wesentlich zur Konsistenz und Benutzerfreundlichkeit eines Registers bei.

  • Darüber hinaus liefert QuIndex Unterstützung bei der Überprüfung von Permutationen, also Double Postings, die durch Vertausch von Haupt- und Unterthema entstanden sind oder entstehen sollten: In speziell dazu vorhandenen Fenstern werden vorhandene oder fehlende Permuationen angezeigt, sodass der Indexer sehr bequem entscheiden kann, ob evtl. weitere Double Postings aufgenommen werden sollen.
indexing/quindex.txt · Zuletzt geändert: 2016/04/13 11:14 (Externe Bearbeitung)