Quo vadis?

Passend zum Herbst geht es heute um das eigentliche Kernstück, und zwar das harvesten der Daten. Sozusagen als Erntehelfer installieren wir dafür VuFindHarvest mit der Schnittstelle OAI-PMH.

Zu Beginn war eigentlich metha für dies angedacht aber eine Planänderung macht gar nichts.

VuFindHarvest

VuFindHarvest ist ein Teil des VuFind-Projekts und kann als eigenständiges Tool verwendet werden. Das Tool zieht aus vorhanden Repositories Daten herunter mit der Schnittstelle (OAI-PMH) und sammelt sie in Verzeichnissen. Diese Datensätze können mit Hilfe bestimmter Konfigurationsoptionen manipuliert und erweitert werden.

Installiert werden kann dieses Tool ganze einfach:

sudo apt update

sudo apt install composer php php-xml

cd ~

wget https://github.com/vufind-org/vufindharvest/archive/v4.0.1.zip

unzip v4.0.1.zip

cd vufindharvest-4.0.1

composer install

Nun konnten die vorhandenen Daten geerntet werden.

Schnittstellen

Es gibt verschiedene Übertragungsprotokolle im Bibliotheks- und Archivbereich. Diese drei sind besonders weit verbreitet:

  • Z39.50 (Library of Congress)
    • Netzwerkprotokoll zur Abfrage von bibliographischen Informationssystemen
    • Beginn Entwicklung 1984
  • SRU (search/retrieve via URL) (Library of Congress)
    • Weiterentwicklung des Z39.50-Protokolls
  • OAI-PMH – Open Archives Initiative Protocol for Metadata Harvesting (Open Archives Initiative)
    • 2000 entwickelt
    • Zugriff auf Daten / Recherche

Es handelt sich hier um sogenannte Maschinenschnittstellen. Diese unterscheiden sich von Benutzerschnittstellen wo die Daten aufgehübschter und somit «lesbarer» wären für das menschliche Auge.

Crosswalk - Zebrastreifen

Crosswalk so nennt man das konvertierten von Dateien von einem Metadatenstandard in einen anderen. Dies geschieht nach vorgegebenen Regeln (genannt Metadatenmapping) welche Elemente und Werte des einen Standards sich in welche Elemente und Werte des anderen Standards ändern. Dadurch geht logischerweise auch Information verloren denn so eine Transformation ist nicht verlustfrei möglich – ideal wäre es ja.

System Format
Koha marcxml - Marc21
ArchivesSpace oai-ead - EAD
DSpace oai-dc - Dublin Core

Für die Konvertierung unserer Daten haben wir MarcEdit verwendet. XML-Dateien werden mit der Programmiersprache XSLT transformiert. XSL ist die Skript-Sprache, um XML-Daten zu manipulieren und das T steht für Transformation.

Die Transformation musste nur mit den Daten aus ArchivesSpace und DSpace vorgenommen werden da bei Koha die Daten bereits im richtigen Format vorhanden ist. Denn Marcxml ist bereits Marc21. Ausser bei ArchivesSpace hat es bei mir gut funktioniert.

MarcEdit 7 ist kostenlos aber nicht Open Source (also Quellcode ist nicht offen). Die Software ist weit verbreitet und ist ausserhalb der Bibliothekswelt die Standard Software zur Bearbeitung von Marc21-Daten. Warum ausserhalt der Bibliothekswelt? Die meisten Bibliotheksysteme haben diese schon integriert haben.

DINI (Deutsche Initiative für Netzwerkinformation)

DINI wurde 2002 als Verein durch drei Organisationen (Arbeitsgemeinschaft Medienzentren Arbeitsgemeinschaft der Medienzentren an Hochschulen e.V. (AMH), Deutscher Bibliotheksverband Sektion 4: Wissenschaftliche Universalbibliotheken (dbv) und Zentren für Kommunikation und Informationsverarbeitung in Lehre und Forschung e.V.(ZKI)) gegründet, um die Informationsinfrastruktur an regionalen und überregionalen Hochschulen zu fördern und um die Informations- und Kommunikationsdienstleistungen zu verbessern. Es erfordert daher die gemeinsame Entwicklung von Standards und Empfehlungen.

Ziele:

  • Beispielhafte Lösungen bekannt machen und für die Nachnutzung empfehlen
  • Standards erarbeiten, anwenden und weiterentwickeln und Einsatzgebiet empfehlen
  • Kompetenzzentren registrieren und mit Hilfe moderner netzbasierter Instrumente bekannt machen übergreifenden Erfahrungsaustausch verbessern
  • Förderprogramme bekannt machen und neue Programme anregen

Um DINI-zertifiziert werden zu können, muss das Repositorium Mindestanforderungen erfüllen.

So die Erntearbeit ist erledigt und ich bin es auch…