Die praktische Organisation von Wissen im Semantic Web? Ein erster Versuch am Beispiel der Bibliothek der marokkanischen Sufibruderschaft an-Nāṣiriyya

Natalie Kraneiß, Institut für Arabistik und Islamwissenschaft, Universität Münster

Noch im November 2021 hatte ich keine Vorstellung davon, was der Begriff ‚Semantic Web‘ überhaupt bedeutet. Gerade angemeldet für das an der Uni Münster neu eingeführte Zertifikat „Digital Humanities“ sprach mich der Titel des Workshops, der für den 26. November 2021 angekündigt war, trotzdem an: „Vernetztes Wissen im Semantic Web – Digitale Methoden der Wissensvernetzung“. Seit einigen Monaten hatte ich mich mit verschiedenen Möglichkeiten beschäftigt, mir eine eigene Wissensdatenbank aufzubauen – inspiriert von Niklas Luhmann und seinem Zettelkasten. Die freie Software Obsidian schien mir dazu besonders geeignet, denn gerade die Vernetzung zwischen verschiedenen Notizen – wie aus Wikipedia bekannt – interessierte mich. Der Workshop zum Semantic Web, geleitet von Dr. Immanuel Normann, kam hier wie gerufen, denn er ergänzte nicht nur meine ersten Versuche mir diese Wissensdatenbank aufzubauen, sondern gab mir Werkzeuge an die Hand, die vielen Informationen, die ich innerhalb des letzten Jahres für meine Masterarbeit recherchiert hatte, anders als ursprünglich geplant zu organisieren.

In dieser Masterarbeit habe ich mich mit einer marokkanischen Bibliothek aus dem 17. Jahrhundert und ihren Manuskripten beschäftigt. Diese Bibliothek besteht bis heute und befindet sich in der kleinen Ortschaft Tamgrūt im Süden Marokkos, am Rand der Sahara. Sie ist an eine religiöse Stätte angebunden, an die Zāwiya (eine Art spiritueller Rückzugsort) der Sufibruderschaft an-Nāṣiriyya, und wurde von den Gründern dieser Bruderschaft errichtet, nämlich von Maḥammad b. Nāṣir (gest. 1674) und seinem Sohn Aḥmad b. Nāṣir al-Khalīfa (gest. 1717). Hier, in Tamgrūt befinden sich noch heute über 4.700 alte Handschriften; einst sollen es sogar bis zu 20.000 gewesen sein. Mich interessierte, woher diese Handschriften stammen, wer sie angefertigt hat und welche Informationen über die Einbindung dieser Sufibruderschaft in ein translokales Netzwerk aus den Handschriften abgeleitet werden können.

Nun zum Workshop: Alle Anwesenden waren sich am Ende des Tages einig, dass gerade das sofortige Ausprobieren – ohne lange Einleitung und theoretische Ausführungen – den Workshop besonders interessant und, für mich jedenfalls, nützlich machte. Vorwissen war keines verlangt. So sollten wir, nach einer kurzen Einführung in die Themen Wissensgraphen und Datenmodellierung und dem Kennenlernen der „Grammatikregeln“ einer dreigliedrigen Aussage, aus denen ein solcher Wissensgraph bestehen kann, das Gelernte direkt ausprobieren. Ziel war hier wohl, sich intuitiv in die Logik eines solchen Systems hineinzudenken – mit Erfolg. Wir haben die einfache Grundregel gelernt, dass eine solche dreigliedrige Aussage aus einem Subjekt, einem Prädikat und einem Objekt besteht. Die Subjekte und Objekte können wiederum Kategorien oder Klassen zugeordnet werden; die Prädikate drücken die Beziehungen zwischen ihnen aus. Für unseren ersten Versuch haben wir schließlich das Tool yEd ausprobiert, das ich seitdem viele weitere Male benutzt habe. Während des Workshops war meine Darstellung (Abb. 1) noch sehr überschaubar: Ich hatte hier zwar schon verschiedene Kategorien von Subjekten und Objekten (nämlich Orte, Personen und Werke) angelegt, aber die Prädikate (dargestellt als Pfeile) noch nicht wirklich genauer spezifiziert.

Abb. 1: Erste Darstellung von Akteuren, Werken und Orten aus dem Umfeld der Sufibruderschaft an-Nāṣiriyya

Innerhalb der nächsten beiden Monate, die mit der finalen Phase meiner Masterarbeit zusammenfielen, kam ich immer wieder zu diesem Tool zurück, denn ich suchte nach einem Weg, die komplexen Beziehungen zu visualisieren, die im Zentrum meiner Arbeit standen – ein Whiteboard reichte dafür längst nicht mehr aus. Diese Darstellung fand schließlich sogar den Weg in meine Masterarbeit, denn ich legte sie als A2-Ausdruck bei (Abb. 2).

Abb. 2: Erweiterte Darstellung der Vernetzung zwischen Akteuren, Manuskripten und Orten

Hier zeigt sich aber bereits, dass die Visualisierung von umfangreichen Daten schnell an die Grenzen der Erfassbarkeit stößt. Sie mag hier gerade noch hilfreich sein, um einzelne Stränge nachzuverfolgen und den Platz eines Akteurs oder eines Texts in einem größeren Kontext zu erkennen. Aber sie kommt schon bei dem Umfang von vernetzten Informationen, die ich hier visualisiert habe (und die nur einen Ausschnitt darstellen!), an ihre Grenzen. Wie viele Informationen, wie viele Beziehungen kann ich auf einer Seite darstellen, um tatsächlich einen Mehrwert zu bieten? Wann reicht ein Poster nicht mehr aus? Wann sind die Daten zu komplex, zu stark miteinander vernetzt, um noch Übersichtlichkeit zu garantieren?

Hier kommt ein weiteres Tool ins Spiel, das wir im Workshop kennengelernt haben, nämlich die Software GraphDB. Dabei handelt es sich um eine Software, mit der aus den bereits genannten dreigliedrigen Aussagen, den RDF-Triples (RDF = Resource Description Framework), ein hochvernetzter Wissensgraph erstellt werden kann, der umfangreiche Abfragen ermöglicht. Im Anschluss an den Workshop habe ich mir weitere Gedanken gemacht, welche Beziehungen aus den von mir recherchierten Daten in einem solchen Graphen dargestellt werden können.[1] Aus diesen ersten Überlegungen ergaben sich als Subjekte bzw. Objekte meines Datasets Person, Ort und Werk, als Prädikate „verfasste“, „ist verwandt mit“, „lebte in“ etc. Einen Teil der mir vorliegenden Informationen habe ich dann versuchsweise nach dem konzeptionellen Rahmen des RDF formuliert (Bild 3a und 3b) und in GraphDB eingefügt (Bild 4).

:Mahammad-b-Mahammad-b-Nasir 
p:geboren-in     
      :Aghlan ;
p:gestorben-in   
      :Tamgrut ;
p:verheiratet-mit
      :Aisha ,
      :Hafsa-al-Ansariya ,
      :Hafsa-al-Bumuhammadiya ,
      :Mariam-Tahnint ,
      :Ruqya ,
      :Zainab ,
      :Maimuna ;
p:Schueler-von   
      :Mahammad-b-Nasir ,
      :Ali-b-Yusuf-al-Dari ,
      :Ali-b-Muhammad-al-Dadisi ,
      :Abdallah-b-Husain-al-Raqqi ,
      :Ahmad-b-Ibrahim-al-Ansari ;
p:getroffen-mit  
      :Muhammad-b-Ahmad-al-Gharisi ,
      :Abu-Bakr-b-Yusuf-al-Saktani ,
      :Muhammad-b-Said-al-Susi ,
      :Ali-al-Andalusi ,
      :Ali-b-Muhammad-al-Zatari ;
p:Kind-von 
      :Mahammad-b-Nasir ;
p:Autor-von      
      al-Ajwiba-al-Nasiriya ;
p:reiste-nach    
      :Mekka ,
      :Kairo ,
      :Medina ,
      :Tripolis ;
p:in-Briefaustausch-mit
      :Ahmad-b-Abd-Qadir-al-Fasi ,
      :Sīdī-al-Arabi-b-Ahmad-Fishtali ,
      :Ahmad-al-Hashtuki .

Abb. 3a: Relationen von Maḥammad b. Nāṣir, ausgedrückt in RDF-Triples

:Ahmad-b-Nasir   
p:geboren-in     
      :Tamgrut ;
p:gestorben-in   
      :Tamgrut ;
p:lebte-in 
      :Tamgrut ;
p:verheiratet-mit
      :Amina-bt-Abdallah ,
      :Zainab-bt-Abd-al-Rahman ;
p:Kind-von 
      :Mahammad-b-Mahammad-b-Nasir ,
      :Hafsa-al-Ansariya ;
p:Schueler-von   
      :Abu-Salim-al-Ayyashi ,
      :Muhammad-b-Abi-l-Futtuh-al-Tilimsani ,
      :Ibn-al-Abbas-al-Jazuli ;
p:reiste-nach    
      :Mekka ,
      :Kairo ,
      :Medina ,
      :Tripolis ;
p:getroffen-mit  
      :Ahmad-b-Abd-Qadir-al-Fasi ,
      :al-Hasan-al-Yusi ,
      :Ahmad-al-Qasri ,
      :Ibrahim-b-Ismail-al-Ajdabi-al-Tarablusi ,
      :Abd-al-Rahman-Umar-al-Tajuri ,
      :Ali-b-Shuayb ,
      :Abu-Tarkiya ,
      :Ibrahim-al-Barri ,
      :Abd-al-Karim-b-Abdallah-al-Khalifi ,
      :Salih-b-Ahmad-al-Matari ,
      :Ahmad-b-Abd-al-Rahman-al-Sijilmasi ,
      :Muhammad-al-Hamisi-al-Tawzari ,
      :Ahmadzadah ,
      :Ahmad-al-Fullani ,
      :al-Hasan-al-Kurani ,
      :Ali-b-Muhammad-al-Zatari .

Abb. 3b: Relationen von Aḥmad b. Nāṣir, ausgedrückt in RDF-Triples

Abb. 4: Ausschnitt aus dem Wissensgraphen in GraphDB

Zentral ist hier, dass die verschiedenen Elemente und Relationen nicht nur visuell in unterschiedlichen Farben oder Formen – wie noch mit yEd – dargestellt werden, sondern dass jede Entität einer Klasse zugeordnet wird: Jede Person, die ich einführe, muss ich als solche definieren, jedes Werk und jeden Ort als solchen deklarieren. Dies ermöglicht, dass die unterschiedliche Zuordnung nicht nur von Menschen auf einer visuellen Ebene erfasst werden kann, sondern dass die Informationen auch von Maschinen lesbar sind. Wenn in einem Text oder einer Übersicht die Worte Kairo, Maḥammad und Koran vorkommen, sind das zunächst einmal nur Aneinanderreihungen von Buchstaben. Durch die Zuordnung zu Kategorien (oder auch Klassen) wird definiert, dass Kairo ein Ort, Maḥammad eine Person und der Koran ein Werk ist. Mit GraphDB kann man sich die angelegten Kategorien (= classes, ausgedrückt als „c:“) und Beziehungen (= predicates, ausgedrückt als „p:/“) übersichtlich als Domain-Range Graph anzeigen lassen (Abb. 5, 6, 7). Das ist sozusagen der Rahmen, den ich mit meinen Daten fülle – und nach Belieben erweitern kann.

Abb. 5: Domain-Range Graph der Klasse „Werk“
Abb. 6: Domain-Range Graph der Klasse „Person“
Abb. 7: Domain-Range Graph der Klasse „Ort“

In der Ansicht „Visual Graph“ kann ich die zahlreichen Verbindungen explorieren, die sich aus den eingegebenen, dreigliedrigen Aussagen, ausgedrückt in RDF-Triples, ergeben. Dazu muss ich zunächst ein Subjekt auswählen, hier im Beispiel (Bild 8) wäre es das Werk Iḥyāʾ ʿulūm ad-dīn von al-Ghazālī. Durch einen Klick auf das Icon „Expand“ kann ich die verschiedenen Objekte, die mit dem Subjekt verknüpft sind, anzeigen lassen. Von jeder weiteren Entität kann ich mir, wenn vorhanden, ebenfalls alle aus- und eingehenden Verbindungen anzeigen lassen und somit durch den Graphen wandern.

Abb. 8: Das Iḥyāʾ ʿulūm ad-Dīn von al-Ghazālī

Meinen Graphen kann ich mit vielen weiteren Informationen anreichern, die bereits frei im Internet verfügbar sind, beispielsweise Informationen über die Lage der Orte, die Lebenszeiten von Autoren oder Lehrer-, Schüler- und Verwandtschaftsverhältnisse der dargestellten Personen. Ich könnte aber auch Fotos der Manuskripte oder der Vermerke auf diesen Manuskripten, die ich selbst angefertigt habe, und ihre Standorte hier einfügen. Dies konnten wir im eintägigen Workshop jedoch noch nicht ausprobieren.

Auch das große Thema Suchabfragen konnte an diesem ersten Einführungstag noch nicht behandelt werden. Mit Suchabfragen könnte ich beispielsweise Fragen beantworten wie „Welche Werke von Autoren aus Ägypten hat Maḥammad b. Nāṣir gekauft?“ oder „Welche Werke von Personen, die Maḥammad b. Nāṣir selbst getroffen hat, kaufte er?“. Dies kann bei einem überschaubaren Dataset sicher auch durch herkömmliche Methoden beantwortet werden. Wenn die Informationen stark miteinander verknüpft sind und einen gewissen Umfang übersteigen, ist das aber nicht mehr oder nur mit sehr hohem Aufwand möglich. Hier konnte der Workshop mir einen neuen Zugang aufzeigen, mit dem ich mich in Zukunft auf jeden Fall weiter beschäftigen will.

Für die Visualisierung der Ergebnisse meiner Masterarbeit habe ich zwar auf yEd zurückgegriffen, aber die Funktionalität von GraphDB hat mich sehr überzeugt. Der Hauptgrund, warum ich nicht mein gesamtes Datenset in GraphDB angelegt habe, war, dass die wissenschaftliche Umschrift der Deutschen Morgenländischen Gesellschaft (DMG), die in meinem Fach standardmäßig verwendet wird, nicht ohne Probleme angezeigt werden kann. Außerdem ist leider kein Export der visuellen Darstellung des Graphen möglich, dieser kann nur per Screenshot geteilt werden. Im Verlauf der weiteren Beschäftigung mit dem Gelernten haben sich noch einige weitere Fragen und Probleme ergeben:

  • Viele der weniger bekannten Personen, die in meinem Kontext vorkommen, sind in den Katalogen des GNB oder VIAF nicht verzeichnet. Somit kann ich nicht auf dort erfasste Lebensdaten, Wirkungskreise und Beziehungen zurückgreifen. Zu einigen Personen sind fehlerhafte Informationen erfasst. Wie geht man damit um? Wie wird sichergestellt, dass solche öffentlichen Daten nicht manipuliert werden?
  • Durch die Kategorisierung und Klassifizierung erfolgt zwangsläufig eine Vereindeutigung, die den historischen Umständen nicht immer Rechnung trägt. Durch die Einordnung von Personen oder Werken in bestimmte Kategorien wird jegliche Ambiguität und Unschärfe beseitigt.[2] Werden dadurch nicht entscheidende Nuancen unsichtbar gemacht? Als Wissenschaftlerin bin ich frei, diese Kategorien selbst zu bestimmen. Wenn wir uns aber in einem größeren System, wie www.wikidata.org, bewegen, bestimmt – so scheint mir – die westlich-europäische Perspektive diese Einteilung in Kategorien sehr stark. Eine Person wird beispielweise einer bestimmten Richtung zugeordnet, ein Werk einem Genre. So weist beispielsweise die Autobiographie, die in nichteuropäischen Kontexten entstanden ist, andere Charakteristika auf als die in Europa geprägte Form, sie wird dennoch unter dem Begriff Autobiographie gefasst. Hier besteht die Gefahr, dass durch die Kategorisierung Unterschiede übersehen und eine Form – aktuell die westlich-europäische – als Idealtyp gesetzt wird.
  • Neben der bereits erwähnten Problematik der Darstellung von arabischer Schrift in der wissenschaftlichen Umschrift sollten in meinem Kontext auch die verschiedenen verwendeten Kalendersysteme berücksichtigt werden. Arabische Namen würde ich aktuell in arabischen Buchstaben schreiben, was eine solche Datenbank für Nicht-Arabischsprechende wiederum weniger zugänglich machen würde. Inwiefern eine verbundene Left-to-Right-Darstellung hier unterstützt wird, habe ich noch nicht ausprobiert.

Dennoch habe ich große Lust, mich mit diesem Thema weiter zu beschäftigen und bin sehr froh, an diesem Workshop teilgenommen zu haben. Ich habe an einem Tag zwar nur einen kleinen Einblick gewonnen, dabei wurde mein Denken aber bereits verändert. Die Darstellung meiner Daten in der altbekannten Exceltabelle hat mich zuletzt nur noch frustriert, da ich diese neu kennengelernte Alternative im Kopf hatte. Nicht zuletzt durch den direkten, niedrigschwelligen Zugang und die ermutigenden Worte während des Workshops wurde ich motiviert, weiter in diese Richtung zu denken. Vielen Dank dafür!


[1] Für mich stand hier erst einmal im Vordergrund, meine Daten darzustellen, um den Überblick zu behalten. Sinnvoll wäre an dieser Stelle aber auch, zu überlegen, welche Fragen mithilfe des Graphen beantwortet werden sollen. Das Thema Suchabfragen mit SPARQL konnte im Rahmen des Workshops leider nicht mehr bearbeitet werden.

[2] Buchtipp: Thomas Bauer (2018), Die Vereindeutigung der Welt. Über den Verlust an Mehrdeutigkeit und Vielfalt, siehe: https://www.reclam.shop/detail/978-3-15-019492-8/Bauer__Thomas/Die_Vereindeutigung_der_Welt.

Kategorien: ,

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Captcha wird geladen…

Weitere Beiträge