Skip to main content
Resourcenbeitrag

Ressourcenbeitrag: Bibliotheca Augustana

Author
  • Marie Flüh orcid logo (Universität Hamburg)

Keywords: Textsammlungen

How to Cite:

Flüh, M., (2024) “Ressourcenbeitrag: Bibliotheca Augustana”, forTEXT 1(11). doi: https://doi.org/10.48694/fortext.3789

21 Views

12 Downloads

Published on
2024-11-29

Erstveröffentlichung: 29.04.2019 auf fortext.net

1. Kurzbeschreibung

Die Bibliotheca Augustana umfasst 15 verschiedene Fachbibliotheken, in denen Leben, Werke und Sekundärliteratur von insgesamt über 1000 Autor*innen – mit hohem ebenso wie eher niedrigem Kanonisierungsgrad – vorgestellt werden. Neben ausgewählten deutschsprachigen Texten und Übersetzungen ins Deutsche werden Ihnen lateinische, griechische, englische, französische, italienische und spanische Texte zur Verfügung gestellt.

Abb. 1: Die Startseite der Bibliotheca Augustana

Steckbrief

  • https://www.hs-augsburg.de/~harsch/augustana.html2

  • Im Jahr 1996 von Prof. em. Ulrich Harsch (Lehrgebiet: Kommunikationsdesign und Elektronisches Publizieren im Fachbereich Gestaltung an der Fachhochschule Augsburg) gegründetes digitales Langzeitarchiv, als Privatprojekt bis heute weitergeführt

  • 12 verschiedensprachige Bibliotheken mit jeweils unterschiedlichen Sammelschwerpunkten

  • Weitere Bestandteile der Bibliothek: Archiv digitalisierter Kunstwerke (Museum virtuale), Musikarchiv (Obeion virtuale), Filmarchiv (Cinematheca Virtualis)

  • Aufteilung der Bibliotheca Germanica: althochdeutsche (23 Texte) und altniederdeutsche Literatur (5 Texte), mittelhochdeutsche (36 Texte) und mittelniederdeutsche Literatur (13 Texte), frühneuhochdeutsche (83 Texte) und frühneuniederdeutsche Literatur (17 Texte), neuhochdeutsche (295 Texte) und neuniederdeutsche Literatur (20 Texte)

  • Texte der Bibliotheca Germanica entstammen dem 8. bis 20./21. Jhd., zahlenmäßig überlegen sind Texte aus der Zeit zwischen dem 17. und dem 21. Jhd.

  • Metadaten der Ressourcen in der Bibliotheca Germanica: Werktitel, Name, Datumsangabe des ersten Erscheinens, Epochenzugehörigkeit

  • Textsorten: fiktionale und nicht-fiktionale Texte, wissenschaftliche Abhandlungen, Epen und Erzählungen, Gedichte, Briefe, Vorträge und weitere Textformen und Dokumente

  • Enthält ausschließlich gemeinfreie Texte (vgl. Open Access), die sich auf dem Server der FH Augsburg befinden und direkt auf der Seite eingebettet sind, oder durch eine Verlinkung auf externe Informationsressourcen (z. B. Google Books, Internet Archive oder diverse Online-Bibliotheken, etwa Gallica, Biblioteca Virtual Miguel de Cervantes oder die Bayerische Staatsbibliothek München) zur Verfügung gestellt werden

  • Herunterladen der Texte nur per copy & paste in ein eigenes Dokument, da keine Downloadfunktion zur Verfügung steht

2. Anwendungsbeispiel

Sie sind auf der Suche nach einer ersten Inspiration für ein Forschungsprojekt und befinden sich noch in der Phase der Ideen- und Themenfindung? Für diese frühe Phase der Projektkonzeption eignet sich die Arbeit mit der Bibliotheca Augustana. Hier finden Sie biographische Angaben, epochale Werke und hilfreiche Verlinkungen zu ausgewählten Autor*innen.

3. Diskussion

3.1 Kann ich die Bibliotheca Augustana für wissenschaftliche Arbeiten nutzen?

Zum Teil, da keine Exportfunktionen für die zur Verfügung gestellten Texte existiert, gestaltet sich die wissenschaftliche Arbeit mit den Texten schwierig. Die Bibliotheca Augustana ist folglich nicht darauf ausgelegt, zitierfähige Primärliteratur für weitere literaturwissenschaftliche (digitale) Arbeitsschritte zur Verfügung zu stellen, sondern lebt als kreativ gestaltete und inhaltlich äußerst vielseitige Literaturdatenbank von der seiteninternen Recherche und Lektüre. Quellenangaben finden Sie auf der jeweiligen Autor*innenseite unter dem Menüpunkt „Quellen, Kolophon“. Die Metadaten sind nicht immer eindeutig oder lückenhaft, gleichzeitig wird nicht immer deutlich, welcher Text welcher Ausgabe entnommen wurde. Grundlage für die hier dargebotenen Texte sind hauptsächlich zitierfähige Printausgaben (Gesamtausgaben oder Gesammelte Werke). Die Texte werden entweder von dem Herausgeber eingescannt (vgl. OCR) oder von privaten Kooperationspartnern eingeschickt, mit einem Editor an das Seitenformat angepasst und Korrektur gelesen (Landeck und Starnes 2000). Nicht für alle in der Bibliothek aufgelisteten Titel wurden die entsprechenden Texte bereits eingescannt. Die mit Volltexten versehenen Titel erkennen Sie an der blauen Schriftfarbe. Darüber hinaus finden sich v. a. unter der bereitgestellten Sekundärliteratur einige tote Links. Die Auswahl der Texte basiert u. a. auf dem von Hermann Hesse verfassten Essay Eine Bibliothek der Weltliteratur, in dem der persönliche literarische Kanon des Schriftstellers/Malers/Dichters vorgestellt wird. Die Bibliothek umfasst neben mittelalterlicher Literatur (Titel wie Tristan, Carmina Burana und Das Nibelungenlied können abgerufen werden) und den namhaften Größen des 18. und 19. Jhds. wie Goethe, Schiller und Wieland auch eher unbekannte Namen. Die Integration vergleichsweise unbekannter Autor*innen wie Christine Ebner, Frau Ava oder Hans von Bühel verweisen auf das Bestreben des Herausgebers, eine Plattform für Autor*innen und Werke abseits des Bildungskanons zu gestalten. Eine hilfreiche Ergänzung stellen die unter „Hilfsmittel“ vorgestellten Bibliographien, Lexika, Datenbanken, Digitalisierungsprojekte und weiterführenden Links zu Fachportalen dar, die allen zwölf Bibliotheken zur Seite gestellt werden.

3.2 Wie benutzerfreundlich ist die Arbeit mit der Bibliotheca Augustana?

Die Bibliotheca Augustana vereint durch ihren klaren Aufbau, das auf Latein verfasste Interface und einen z. T. äußerst verschachtelten hierarchischen Aufbau benutzerfreundliche und benutzerunfreundliche Aspekte. Die klare Struktur der Startseite generiert einen schnellen Überblick über die unterschiedlichen zur Verfügung gestellten Informationsressourcen und erleichtert die Orientierung in den unterschiedlichen Bibliotheken. Benutzerfreundlichkeit wird vor allem durch die übersichtlich gestalteten Einzelansichten der Autor*innenportraits umgesetzt. Die Informationen zu Leben und Werk bereichern die dargebotenen Primärtexte, die dadurch nicht isoliert dastehen, sondern in einen zeithistorischen und biographischen Kontext eingeordnet werden. Besonders anschaulich sind zahlreiche grafische Elemente wie Handschriftenfaksimiles, Bilder der vorgestellten Autor*innen oder Titelblätter älterer Ausgaben. Als ungewohnt und weniger benutzerfreundlich erweist sich zunächst die vollständig auf Latein verfasste Benutzeroberfläche (vgl. GUI) der Bibliotheca Augustana und das Fehlen einer Navigationsleiste. Texte und Metadaten der unterschiedlichen Bibliotheken sind jedoch in der Originalsprache der jeweiligen Bibliothek verfasst. Je nachdem, in welcher Kategorie Sie sich gerade befinden, wird am oberen und am unteren Bildschirmrand eine individuelle Navigationsleiste eingeblendet. Eine gewisse Einarbeitungszeit muss berücksichtigt werden, da jede Seite eine Vielzahl an Informationen und weiterführenden Links (auch auf externe Quellen und in seltenen Fällen als Verweis zwischen Autor*innen über die einzelnen Bibliotheken hinweg) beinhaltet.

Abb. 2: Vorstellung eines Autors (Ödön Horváth) und zugehöriger Ausschnitt der Werkbibliographie in der Bibliotheca Augustana

4. Wie funktioniert die Textsuche in der Bibliotheca Augustana?

In der Bibliotheca Augustana steht Ihnen keine Suchfunktion (vgl. Query) zur Verfügung. Um zügig Ihren gewünschten Text zu finden, empfiehlt sich die Nutzung der Browsersuchfunktion. Bei der Suche nach Werken und Autor*innen müssen Sie auf die durch die Bibliothek vorgegebene hierarchische Struktur zurückgreifen. Die Ressourcen einer Bibliothek können Sie sich in unterschiedlichen Listen anzeigen lassen: Als alphabetisch geordnetes Autor*innen- und Textregister oder als chronologisch geordnete Liste, die wiederum aus einer alphabetischen Liste der enthaltenen Autor*innen besteht.

Abb. 3: Links: Die Anzeigeoptionen unterschiedlicher Bibliotheken; Rechts: Das Interface der chronologisch und alphabetisch geordneten Bibliotheca Germanica

Ein Vorteil der nach Epochen gegliederten Ansicht ist die übersichtliche Darstellung sämtlicher in ein und derselben Zeit wirksamen Schriftsteller*innen. Auf diese Weise werden überschaubare Textkorpora (vgl. Korpus) präsentiert, die Sie z. B. für weitere vergleichende Analysen verwenden können. Die alphabetische Liste generiert einen Überblick über sämtliche in der Bibliothek vertretene Autor*innen. Auf diese Weise können Sie trotz fehlender Suchoption zügig herausfinden, ob der/die gesuchte Autor*in in der Bibliothek enthalten ist. Nachdem Sie sich für eine Listenansicht entschieden haben, gliedert sich der Seiteninhalt in die drei Bereiche Autor*in, Werk und Sekundäres, wobei biographische Angaben (inkl. Bilder), bibliographische Angaben und Sekundärliteratur (u. a. Artikel, Verlinkungen auf Websites, Vorlesungen zu Werk/Autor*in, Liste der Gesamtausgaben) zur Verfügung gestellt werden. Die biographischen Angaben variieren hinsichtlich ihrer Ausführlichkeit. Die Konzeption der Bibliothek lädt zum eigenständigen Erkunden und unvoreingenommenen Sammeln erster Lektüreerfahrungen ein. Das Design der Seiten mit einem ausgewogenen Verhältnis zwischen Text und Bild sowie der Verwendung gedeckter Farben machen das Lesen am Bildschirm sehr angenehm. Die Textressourcen werden entweder auf der Webseite selbst (über den Server der FHS Augsburg) bereitgestellt oder sind über eine gekennzeichnete Weiterleitung (Symbol: >>>), die zu weiteren Textarchiven führt, abrufbar. Unter dem Menüpunkt „Epistulae electronicae“ können Sie per E-Mail mit dem Betreiber der Website Kontakt aufnehmen. Ein Handbuch oder weitere Informationen über Aufbau und Nutzung der Bibliothek stehen nicht zur Verfügung. Der Betreiber reagiert jedoch zügig auf Nachfragen und/oder Anmerkungen.

Externe und weiterführende Links

Glossar

Annotation

Annotation beschreibt die manuelle oder automatische Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle Annotation wird händisch durchgeführt, während die (teil-)automatisierte Annotation durch Machine-Learning-Verfahren durchgeführt wird. Ein klassisches Beispiel ist das automatisierte PoS-Tagging (Part-of-Speech-Tagging), welches oftmals als Grundlage (Preprocessing) für weitere Analysen wie Named Entity Recognition (NER) nötig ist. Annotationen können zudem deskriptiv oder analytisch sein.

Browser

Mit Browser ist in der Regel ein Webbrowser gemeint, also ein Computerprogramm, mit dem das Anschauen, Navigieren auf, und Interagieren mit Webseiten möglich wird. Am häufigsten genutzt werden dafür Chrome, Firefox, Safari oder der Internet Explorer.

Browsersuchfunktion

Um eine Browser-Suchfunktion durchzuführen, und beispielsweise eine Webseite auf bestimmte Suchbegriffe zu filtern, klicken Sie auf Ihrem Mac „cmd“ + „F“ und auf Ihrem Windows PC „Strg“ + „F“. In das sich öffnende Suchfenster tragen Sie Ihren Suchbegriff ein und die jeweils geöffnete Seite wird darauf hin durchsucht.

Commandline

Die Commandline (engl. command line interface (CLI)), auch Kommandozeile, Konsole, Terminal oder Eingabeaufforderung genannt, ist die direkteste Methode zur Interaktion eines Menschen mit einem Computer. Programme ohne eine grafische Benutzeroberfläche (GUI) werden i. d. R. durch Texteingabe in die Commandline gesteuert. Um die Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ + „space“, geben „Terminal“ ein und doppelklicken auf das Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“, geben „cmd.exe“ ein und klicken Enter.

GUI

GUI steht für Graphical User Interface und bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um somit beispielsweise den Umgang mit der Commandline zu umgehen.

HTML

HTML steht für Hypertext Markup Language und ist eine textbasierte Auszeichnungssprache zur Strukturierung elektronischer Dokumente. HTML-Dokumente werden von Webbrowsern dargestellt und geben die Struktur und Online-Darstellung eines Textes vor. HTML-Dateien können außerdem zusätzliche Metainformationen enthalten, die auf einer Webseite selbst nicht ersichtlich sind.

Korpus

Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural für „das Korpus“) sind typischerweise nach Textsorte, Epoche, Sprache oder Autor*in zusammengestellt.

Lemmatisieren

Die Lemmatisierung von Textdaten gehört zu den wichtigen Preprocessing-Schritten in der Textverarbeitung. Dabei werden alle Wörter (Token) eines Textes auf ihre Grundform zurückgeführt. So werden beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem Lemma „schnell“ zugeordnet.

Machine Learning

Machine Learning, bzw. maschinelles Lernen im Deutschen, ist ein Teilbereich der künstlichen Intelligenz. Auf Grundlage möglichst vieler (Text-)Daten erkennt und erlernt ein Computer die häufig sehr komplexen Muster und Gesetzmäßigkeiten bestimmter Phänomene. Daraufhin können die aus den Daten gewonnen Erkenntnisse verallgemeinert werden und für neue Problemlösungen oder für die Analyse von bisher unbekannten Daten verwendet werden.

Markup Language

Markup Language bezeichnet eine maschinenlesbare Auszeichnungssprache, wie z. B. HTML, zur Formatierung und Gliederung von Texten und anderen Daten. So werden beispielsweise auch Annotationen durch ihre Digitalisierung oder ihre digitale Erstellung zu Markup, indem sie den Inhalt eines Dokumentes strukturieren.

Metadaten

Metadaten oder Metainformationen sind strukturierte Daten, die andere Daten beschreiben. Dabei kann zwischen administrativen (z. B. Zugriffsrechte, Lizenzierung), deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze oder Kapitel eines Textes) und technischen (z. B. digitale Auflösung, Material) Metadaten unterschieden werden. Auch Annotationen bzw. Markup sind Metadaten, da sie Daten/Informationen sind, die den eigentlichen Textdaten hinzugefügt werden und Informationen über die Merkmale der beschriebenen Daten liefern.

Named Entities

Eine Named Entity (NE) ist eine Entität, oft ein Eigenname, die meist in Form einer Nominalphrase zu identifizieren ist. Named Entities können beispielsweise Personen wie „Nils Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“ sein. Named Entities können durch das Verfahren der Named Entity Recognition (NER) automatisiert ermittelt werden.

OCR

OCR steht für Optical Character Recognition und bezeichnet die automatische Texterkennung von gedruckten Texten, d. h. ein Computer „liest“ ein eingescanntes Dokument, erkennt und erfasst den Text darin und generiert daraufhin eine elektronische Version.

Open Access

Open Access bezeichnet den freien Zugang zu wissenschaftlicher Literatur und anderen Materialien im Internet.

POS

PoS steht für Part of Speech, oder „Wortart“ auf Deutsch. Das PoS- Tagging beschreibt die (automatische) Erfassung und Kennzeichnung von Wortarten in einem Text und ist of ein wichtiger Preprocessing-Schritt, beispielsweise für die Analyse von Named Entities.

Preprocessing

Für viele digitale Methoden müssen die zu analysierenden Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für statistische Zwecke werden Texte bspw. häufig in gleich große Segmente unterteilt (chunking), Großbuchstaben werden in Kleinbuchstaben verwandelt oder Wörter werden lemmatisiert.

Query

Query bedeutet „Abfrage“ oder „Frage“ und bezeichnet eine computergestützte Abfrage zur Analyse eines Textes. Um Datenbestände zu durchsuchen, werden Abfragesprachen eingesetzt, die Queries (Anfragen) an den Datenbestand senden. So bilden alle möglichen Queries zusammen die Query Language eines Tools.

Type/Token

Das Begriffspaar „Type/Token“ wird grundsätzlich zur Unterscheidung von einzelnen Vorkommnissen (Token) und Typen (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token ist also ein konkretes Exemplar eines bestimmten Typs, während ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token) umfasst. Es gibt allerdings etwas divergierende Definitionen zur Type-Token-Unterscheidung. Eine präzise Definition ist daher immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“, „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als solche identifiziert werden, wenn Großbuchstaben beachtet werden.

Bibliographie

Landeck, Nadine und Susanne Starnes. 2000. Primärliteratur im Internet. In: Literaturwissenschaft online – offline: Primärliteratur im Internet, elektronische Editionen und Hybrideditionen, Lern- und Literatur-CD-ROMs. Überblick und Sammelrezension, hg. von Alexandra Hildebrandt, Nadine Landeck, Ursula Rautenberg, und Susanne Starnes. http://iasl.uni-muenchen.de/discuss/lisforen/erlangen.htm#Kap21.