Bericht zur Sitzung des Arbeitskreises Digital Humanities, WWU Münster, 1. Februar 2019
Das Internet ist eine unaufhaltsam wachsende Fundgrube für Informationen. Doch die Eigenheiten natürlicher Sprachen erschweren es, dieses Überangebot systematisch zu erschließen. So kann die Westfälische Wilhelms-Universität Münster beispielsweise in verschiedenen Kontexten – ob gewollt oder ungewollt – immer wieder anders bezeichnet werden. Mal heißt es Universität Münster, mal WWU oder auch University of Münster. Oder es stellt sich die Frage, ob sich die Zeichenfolge „Münster“ auf die Stadt in Nordrhein-Westfalen oder doch auf einen speziellen Typ von Kirchen bezieht. Wie lässt sich sicherstellen, dass Informationen trotz synonymer beziehungsweise homonymer Bezeichner referenzierbar sind? Bieten Normdaten hierfür eine Lösung?
Im Zeichen solcher und ähnlicher Fragen stand die erste Sitzung des Jahres für die Mitglieder des Arbeitskreises Digital Humanities. Antworten lieferte Frau Sarah Pielmeier von der Universitäts- und Landesbibliothek Münster (ULB), ihres Zeichens Soziologin und Bibliothekarin. Als Zuständige unter anderem für die bibliothekarische Sacherschließung bot sie den etwa 15 Anwesenden eine kenntnisreiche Einführung in das komplexe Thema „Normdaten“ und ging auch auf ihren Nutzen für die Geisteswissenschaften ein. Zudem berichtete sie von ihren Eindrücken von der GNDCon 2018, die am 3. und 4. Dezember 2018 an der Deutschen Nationalbibliothek (DNB) in Frankfurt am Main stattfand. Der nachfolgende Bericht soll einen kleinen Einblick in die Inhalte ihres Vortrags und die anschließende Diskussion geben.[1]
Was sind Normdaten?
Normdaten sind normierte Begriffe, die über einen unikalen Bezeichner identifiziert werden. Was sperrig klingt, hat einen wertvollen Nutzen: Durch die Angabe dieses Identifiers, beispielsweise einer Nummer, können die vielfältigen Beschreibungsgegenstände unabhängig von ihrer Schreibweise eindeutig referenziert werden. Beschrieben werden kann grundsätzlich alles, was in der Welt begegnet oder gedacht werden kann. Außerdem ist es möglich, die Begriffe mit zusätzlichen Informationen (Attributen) anzureichern. Damit bündeln Normdaten Wissen für verschiedene Anwendungskontexte. In der sogenannten „Normdatei“, einer Art Verzeichnis, werden die einzelnen Datensätze dann für die Weiterverarbeitung zusammengeführt.
Normdaten vereinfachen die bibliothekarische Erschließungsarbeit
Die im deutschsprachigen Raum wohl bekannteste Instanz, die solche Normdaten zur Verfügung stellt, ist die von der DNB in Kooperation mit anderen Kultureinrichtungen und Institutionen verwaltete Gemeinsame Normdatei (GND). Sie führte 2012 die bis dahin getrennt geführten Normdateien für Personennamen (PND), Schlagworte (SWD), Körperschaften (GKD) und die Einheitssachtitel-Datei des Deutschen Musikarchivs (DMA-EST-Datei) zusammen. Dadurch konnten die unterschiedlichen Datenformate und Strukturen der Einträge allmählich harmonisiert und an die Vorgaben einheitlicher Regelwerke angepasst werden.
Die GND dient in erster Linie zur Erschließung und Katalogisierung von Literatur. Mit den Normdaten können Redundanzen und Mehrdeutigkeiten bei der Titelaufnahme aufgelöst werden. So findet sich auch ein Eintrag für die Universität Münster.[2] Neben einer Vorzugsbenennung („Westfälische Wilhelms-Universität Münster“) weist er derzeit elf synonyme Schreibweisen sowie zusätzliche Attribute auf. Über die GND-Nummer (36175-6) können nun Publikationen in einem Bibliothekskatalog, die in irgendeiner Beziehung mit ihr stehen, eindeutig und nachhaltig erschlossen werden. Auf diese Weise schaffen Normdaten eine Grundlage, vermittels derer Wissen über Dinge im Internet ausgetauscht, kommuniziert und vernetzt werden kann – auch über bibliothekarische Bedarfe hinaus.
Warum sind die GND und Normdaten auch spartenübergreifend attraktiv?
Die damit einhergehenden Möglichkeiten sind auch für geisteswissenschaftliche Forschungsprojekte interessant, lassen sich mit ihnen doch Begriffe eindeutig disambiguieren oder bereits an anderer Stelle aufbereitete Informationen in eigene Forschungskontexte einbeziehen. Das kann zum Beispiel für wissenschaftliche Datenbanken oder digitale Editionen relevant sein.
Da die strukturierten Normdaten maschinell nachnutzbar sind, können sie zudem als potenzielle Trainingsdaten für maschinelles Lernen oder Künstliche Intelligenzen dienen. Auch ist es denkbar, dass sie kollaborative Arbeitsweisen zwischen Projekten begünstigen, indem die Wissensbestände leichter verknüpft werden können. Nicht nur die Bibliotheksverbände sollten mit Blick auf Linked Data und Semantic Web ihre Wissensspeicher untereinander stärker vernetzen, sondern auch Forschungsprojekte. Dadurch könnten sich ganz neue Erkenntnismöglichkeiten ergeben.
Wie wird die GND gepflegt?
Die GND ist bislang, was Partizipationsmöglichkeiten betrifft, sehr restriktiv. Bis jetzt werden die Normdaten hauptsächlich von Bibliothekar*innen in verschiedenen redaktionellen Stellen gepflegt. Neue Einträge werden zumeist anlassbezogen anhand der Bedarfe bibliothekarischer Erschließung eingepflegt und nach strikten Vorgaben auf ihre Relevanz und Qualität hin überprüft.
Wer an der GND mitarbeiten möchte, hat bisher lediglich die Möglichkeit, Vorschläge einzureichen, die nach Eingabedatum abgearbeitet werden. Das betrifft sowohl Anfragen zu Neuaufnahmen als auch wichtige Korrekturhinweise. Mit dem zunehmenden, spartenübergreifenden Interesse an Normdaten steigt also auch der Arbeitsaufwand für die Mitarbeiter*innen und die Erwartungshaltung gegenüber der GND.
Die GNDCon 2018 als Forum für den Interessenaustausch
Um diese Situation zu verbessern und die GND für eine breite Nutzung zu öffnen, veranstaltete die Deutsche Nationalbibliothek im Dezember des vergangenen Jahres die GNDCon 2018 in Frankfurt am Main. Sie bot erstmals im deutschsprachigen Raum ein Forum für den offenen Austausch über die Zukunft der GND und Normdaten. Das war längst überfällig, hatten sich doch Bedarfe jenseits der bibliothekarischen Katalogisierung entwickelt, die eine Neuausrichtung des bisherigen Umgangs mit Normdaten notwendig machen. Die Anwesenden erhofften sich von der GND etwa kürzere Bearbeitungszeiten oder offenere Partizipationsmöglichkeiten. Insbesondere für die Geisteswissenschaften wäre zudem eine Versionierung attraktiv, wodurch Änderungen an den GND-Einträgen nachvollziehbar dokumentiert würden, was bislang nicht der Fall ist.
Es konnte ausgiebig diskutiert werden, was in die GND aufgenommen werden soll und was nicht (Stichwort: Relevanz) oder wie Beteiligungsmöglichkeiten geschaffen werden könnten, die gleichermaßen den anwenderspezifischen Interessen entgegenkommen und die Qualitätsstandards wahren. Viel Raum wurde auch technischen Potenzialen (Visualisierung) und Bedarfen (zum Beispiel mehr Mapping-Möglichkeiten) eingeräumt. Zudem konnten sich andere Normdaten-Anbieter vorstellen. So zum Beispiel Wikidata, das ursprünglich zur Strukturierung und Verbesserung der Nachnutzbarkeit von Wikimedia-Projekten wie Wikipedia entwickelt wurde, aber inzwischen spartenübergreifend attraktive Angebote bietet.
Wie geht es weiter?
Als Perspektive für die Öffnung der GND stellte die Referentin das auf der GNDCon diskutierte Angebot eines Core vs. Plus-Modells vor. Mit dem Plus-Zugang könnten Bearbeitungsbereiche freigeschaltet werden, die den anwenderspezifischen Interessen entsprechen und eine variable Erschließungstiefe über den Kernbestand des Core-Bereichs hinaus ermöglichen.
Alternativ lässt sich darüber diskutieren, welche Vor- und Nachteile es hätte, eigene Normdateien für die jeweiligen kulturellen Institutionen und Disziplinen zu entwickeln. So wies ein Teilnehmer darauf hin, das Social-Media-Team der GND habe über Twitter angemerkt, man solle Änderungen nicht abwarten, sondern sich beispielsweise mit Wikidata und der dazugehörigen Software Wikibase auseinandersetzen.[3] Für Historiker*innen gebe es, so ein ergänzender Tipp, beispielsweise bereits das Projekt FactGrid, das auf der Wikibase-Software aufsetzt.
Ob Öffnung der GND oder separate Normdateien: Die Kultureinrichtungen und wissenschaftlichen Disziplinen sollten eng zusammenarbeiten, um gemeinsame Standards für den Austausch von Wissen im Internet zu schaffen. Wo immer Daten entstehen, sollten sie direkt sauber strukturiert werden, denn dann ist eine Integration in andere Normdateien kein Problem mehr. Insbesondere bei Anträgen für (Drittmittel-)Projekte sollte daher auf die wichtige Rolle der Produktion von normierten Daten und auf den Bedarf von Datenkuratoren hingewiesen werden. Diesbezüglich müsse noch viel „Aufbauarbeit“ geleistet werden, die nicht immer anerkannt werde, doch sich angesichts der Potenziale vernetzter Wissensbasen lohne, so das Fazit der Anwesenden.
Save the date!
Die nächste Sitzung des Arbeitskreises Digital Humanities findet am Freitag, dem 1. März 2019, von 14-16 Uhr statt.
Wo? Raum 613, Service Center Digital Humanities/ZB Sozialwissenschaften, Scharnhorststraße 103/109
Inhalt: Dr. Immanuel Normann (Service Center Digital Humanities) wird zu den Konzepten formaler Beschreibungs- und Abfragesprachen des Semantic Web im Hinblick auf deren praktische Anwendung bei Wikidata vortragen.
Wer sich anschauen möchte, wo Normdaten sonst noch angeboten werden oder recherchierbar sind, der sei auf die folgenden, von Frau Pielmeier empfohlenen Webangebote hingewiesen:
- GeoNames bietet Normdaten für geografische Informationen.
- Die Virtual International Authority File (VIAF) bündelt Normdaten der führenden internationalen Normdateien.
- Die Online-GND (OGND) ist eine Rechercheoberfläche für die GND.
- Lobid-gnd bietet interessante Möglichkeiten zur Visualisierung der Beziehungen zwischen verschiedenen Normdatensätzen. Es wird zudem eine Schnittstelle geboten, um die Daten in verschiedenen Anwendungskontexten nutzbar zu machen.
- Der Katalog der Zeitschriftendatenbank (ZDB) visualisiert über Normdaten die Beziehungen zwischen Publikationsorganen.
- Die NRW Bibliografie (NWBib) verzeichnet schwerpunktmäßig Literatur über und aus Nordrhein-Westfalen. Die einzelnen Publikationseinträge sind mit GeoNames-Normdaten, also geografischen Informationen, verknüpft. Neben der typischen Schlagwortsuche können Rechercheergebnisse interaktiv über die Bedienung einer Karte eingegrenzt werden. Eine Zeittafel visualisiert zusätzlich die Anzahl der Publikationen, die pro Jahr zur jeweiligen Region veröffentlicht wurden.
Anmerkungen:
[1] Die Präsentation von Frau Sarah Pielmeier können Sie sich hier ansehen und herunterladen.
[2] http://d-nb.info/gnd/36175-6
[3] https://twitter.com/gndnet/status/1069703915439079424
Schreibe einen Kommentar