Logbucheintrag 10 - Linked Data | Blog Bibliotheks- und Archivinformatik

Time to say goodbye… aber ich will doch noch nicht…

BIBFRAME

Auf Initiative der Library of Congress wurde im Jahr 2012 begonnen ein neues modernes Format als Linked-Data-Alternative zu MARC21 mit dem Ziel diesen Standard dann abzulösen zu entwickeln.

Diese Weiterentwicklung soll bibliografische Information auch ausserhalb der Bibliotheksgemeinschaft nützlich machen. Wenn z.B. ein Buch katalogisiert wird, enthält die Beschreibung Informationselemente wie Autor, worum es im Buch geht, verschiedene Publikationsformen und Information über die Exemplare des Buches.

BIBFRAME basiert auf drei Abstraktionsebenen:

Work (Werk)
- Autor, Sprache
Instance (Ausgabe)
- Ausführungsform: Herausgeber, Ort, Datum, Format
Item (Exemplar)
- Tatsächliche Kopie einer Instanz (Standort, Regalmarkierung, Barcode)

Weiter bestehen drei zusätzliche Entitäten (Klassen):

Agent (Person, Körperschaft)
- sind mit Werk verbunden z.B. als Autor, Herausgeber, Künstler, Fotograf etc.
Subject (alles was im Werk behandelt wird: Themen, Personen, Orte)
- Konzept/Gegenstand des Werks Themen, Orte, Ereignisse, Gegenstände etc.
Event (Event das Werk wiedergibt)
- Aufzeichnung des Inhalts eines Werks

Das BIBFRAME-Vokabular besteht aus RDF-Klassen und -Eigenschaften. Es beschreibt die Entitäten und die Beziehungen des Datenmodells näher. Zum Beispiel kann ein Werk eine «Übersetzung von» eines anderen Werks sein.

Dies tönt für mich schwer nach einer owl-Ontologie mit Class, SubClass, ObjectProperty etc. (owl haben wir dieses Semester in SESY (Semantische Systeme für Informationsverarbeitung) angesehen)… und siehe da. Es ist tatsächlich owl:

Das Basismodell (Grundlage) hinter dieser Ontologie ist FRBR.

Was unterscheidet MARC21 und BIBFRAME?

Das MARC-Format konzentriert sich auf Katalogdatensätze, die unabhängig voneinander verständlich sind. Informationen über das Werk und die Identifikatoren wie Autor, Themen etc die ausserhalb des Datensatzes selbst einen Wert haben werden zusammengefasst. Während bei BIBFRAME die Werte einzeln erfasst und miteinander über Beziehungen verknüpft werden. Dadurch entsteht viel mehr Wissen als wenn jedes Werk in sich abgeschlossen steht.

RiC

Ähnlich wie in der Bibliothekswelt mit BIBFRAME ist man derzeit auch in der Archivwelt mit RiC daran einen neuen Linked-Data-Prinzipien folgenden Standard zu entwickeln da ISAD(G) dies nicht mitbringt.

Auch hier wird auf eine Ontologie mit Klassen und Beziehungen gesetzt.

Die Befürchtung es handle sich um einen Bruch mit dem Provenienzprinzip kann gemäss Daniel Pitti verneint werden. Es handle sich um eine Erweiterung des Verständnisses von Provenienz «um ihre soziale und materielle Komplexität ihrer Entstehungsumstände und Existenz».

Ich denke dieser neu/sich im aufbaubefindende Standard (RiC) bietet auch eine Möglichkeit vom teilweisen verstaubten Image eines Archivs los zu kommen und einen besseren Zugang für Forschende und andere Interessierte zu schaffen. Und dies ist sicherlich im Sinne eines Archivs.

Exkurs in die Praxis

Vorstellung Projekt: Erstellung eines normdatenbasierten Online-Katalog für das Deutsche Literaturarchiv Marbach am Neckar (bestehend aus Archiv, Bibliothek, Museum in einem Haus).

Der derzeitige Katalog soll modernisiert werden. Jedes der drei Institute hat seine eigene Erschliessungstradition zwar wurden die Daten im gleichen System erfasst aber unterschiedlich beschrieben. Gesucht werden kann nur unter den jeweiligen Abteilungen.

Wir haben einen Einblick in die Testversion erhalten (Projekt soll im Q1 21 abgeschlossen werden). Im neuen Katalog kann über alles (Gesamtbestand) gesucht werden aber auch immer noch in den bisherigen drei Abteilungen. Die Suche erfolgt über einen Suchschlitz. Es gibt eine Autovervollständigung wo nicht nur Begriffe sondern auch Normdaten erscheinen. Mit Facetten kann das Suchergebnis eingeschränkt werden. Es kann eine Normdatei ausgewählt werden (z.B. Friedrich von Schiller) und mit diesem dann weitergesucht werden. D.h. es wird dann alles gesucht was mit dem vorherigen Namen (Normdaten) und dem eigegeben Begriff verknüpft ist. Zudem werden die Normdaten mit anderen Quellen angereichert (z.B. Wikidata).

Als Suchmaschine wird Solr verwendet. Die Oberfläche ist TYPO3find.

Die Datenbestände der drei Abteilungen wurden exportiert und mit OpenRefine aufbereitet. So ist nun ein gleiches Suchindexschema vorhanden. Das Zielformat war ein CSV-Format (Tabelle). Es wurde ein eigenes Metadatenformat gewählt.

Ich fand diese Ausführungen sehr spannend und werde mir den neuen Katalog sobald er «live» ist begutachten und selbst ausprobieren. Vielen Dank für den Einblick.

Marbach am Neckar steht weit oben auf meiner Reiseliste (wenn wir irgendwann wieder unbeschwert Reisen können).