Index

Worte für Index extrahieren

Beschreibung

Nach der Fertigstellung eines LaTeX-Dokumentes steht die Frage, welche Worte in den Index aufgenommen werden sollen. Um die Beantwortung zu erleichtern, kann das folgende Befehlskonstrukt helfen, indem es alle Worte aus der LaTeX-Quelle filtert und sortiert mit der Angabe der Häufigkeit ausgibt.

pdftotext -enc UTF-8 -raw datei.pdf
gawk '{for (i=1;i<=NF;i++) print $i}' datei.txt | sort | uniq -c

Index mit einem Buchstaben vor den Buchstabengruppen

Zur Erhöhung der Übersichtlichkeit soll im Index vor jeder Buchstabengruppe (alle Einträge mit »A«) der Buchstabe (»A«) erscheinen.

Dazu muss eine Stil-Datei erzeugt werden, um beim Aufruf von makeindex als Parameter übergeben werden. Die Stil-Datei (bspw. caphead.ist) hat folgenden Aufbau:

Ant-Builddatei für LaTeX-Dokumente

Das folgende Ant-Script fasst die Aufrufe zusammen, die bei der Erstellung eines komplexen LaTeX-Dokumentes benötigt werden:

  • Indexerstellung mittels makeindex (mehr)
  • Quellenverzeichnis (Bibliografie, Literaturverzeichnis) mit bibtex
  • Glossar, Symbol- und Abkürzungsverzechnis mit glossaries (mehr)

Das Script kann unter dem Namen build.xml abgelegt werden. Folgende Anpassungen sind erforderlich:

Inhalt abgleichen