Schaubild Unterricht Das Schaubild soll uns Studierenden zeigen, wie weit wir im Kurs vorangekommen sind. Aus platz- und zeichengründen habe ich dieses bis jetzt noch nicht erwähnt, gehe aber nun etwas darauf ein:
Wir haben uns bereits das Bibliothekssystem Koha, das Archivsystem ArchivesSpace und die Repository-Softwares DSpace angeschaut, Datensätze erstellt und einige Dinge ausprobiert. Heute stand das “Harvesten” und Konvertieren der Metadaten auf dem Plan. Das “Harvesten” soll mit dem OAI Harvester “VuFindHarvest” geschehen. Dabei soll von Koha das Format MARC21-XML, von ArchivesSpace EAD und von DSpace Dublin Core geharvestet werden. Mit dem Programm MarcEdit (XSLT) sollen die EAD und Dublin Core Daten in MARC21-XML konvertiert werden.

Schnittstellen

Die folgenden drei Übertragungsprotokolle sind besonders weit verbreitet im Bibliotheks- und Archivbereich:

OAI-PMH steht für Open Archives Initiative Protocol for Metadata Harvesting. Die Schnittstelle eignet sich vor allem für grössere Datenabzüge und regelmässige Aktualisierungen. OAI-PMH Anfragen können als URL zusammengestellt werden und direkt über den Browser ohne Zusatzsoftware aufgerufen werden können.
Anscheinend bietet die DNB über eine HTTPS-Schnittstelle und das OAI-PMH-Protokoll eine Anfragemöglichkeit auf ihre Metadaten. Da in der Bibliothek, in der ich arbeite, Datensätze aus der DNB übernommen (und angepasst) werden, gehe ich davon aus, dass dies über eben eine solche OAI-PMH-Schnittstelle funktioniert. Für mich ist es sehr spannend zu sehen, wie solche Sachen, die im Alltag verwendet werden, funktionieren.

Z39.5 ist ein Standard Netzwerkprotokoll, das im Bibliothekswesen, der zur Abfrage von bibliographischen Informationssystemen verwendet wird. Die Schnittstelle ermöglicht eine parallele Suche in mehreren Informationssystemen.

SRU ist die Abkürzung für Search/Retrieve via URL und ist ein Standard für Suchanfragen in Form von URLs. SRU gilt als Weiterentwicklung des Z39.50-Protokolls. Die beim SRU verwendeten Techniken basieren auf etablierten Internet-Standards wie URI und XML. Im Gegensatz zur Z39.5 Schnittstelle lässt sich die SRU auch ausserhalb der Bibliothekswelt verwenden. Mit SRU kann ebenfalls eine Anfrage mittels URL im Browser aufgerufen werden.

SRU und Z39.5 sind besonders für Live-Abfragen oder gezielten Datenabruf mit vielen Parametern geeignet.

Übung: Metadaten über OAI-PMH harvesten mit VuFindHarvest

Nach der Installation von VuFindHarvest 4.0.1 konnten wir in einer Übung Metadaten harvesten. “To harvest” bedeutet ernten und meint das Sammeln & Speichern der Metadaten.
In der README.md Datei wurde beschrieben, wie vorzugehen ist. Dabei wurde folgender Befehl verwendet:
php bin/harvest_oai.php --url=http://example.com/oai_server --metadataPrefix=oai_dc my_target_dir
Hinter url= konnte angegeben werden, von wo die Daten geharvestet werden sollen. Bei metadataPrefix= wurde angegeben in welchem Format die Daten herunterzuladen sind. Bei “my_target_dir” kann ein Ordner angegeben werden, der dann auch gleich erstellt wird.
Diese Übung verlief problemlos. Alle Daten konnte geharvestet werden.

Übung: XSLT Crosswalk mit MarcEdit

In einer weiteren Übung sollte nun ein XSLT Crosswalk mit MarcEdit durchgeführt werden. Dabei sollten alle diese Daten in MARC21-XML konvertiert werden.
XSLT steht für extensible Stylesheet Language Transformation. Es ist eine Programmiersprache, die zur Transformation von XML-Dokumenten in andere Formate verwendet wird. Sie wird von w3C empfohlen.
Der Begriff Crosswalks wird verwendet, um die Konvertierung von einem Metadatenstandard in einen anderen zu beschreiben. Ein Crosswalk enthält Regeln wie Elemente und Werte zugeordnet oder verändert werden müssen.

Als erstes mussten wir also MarcEdit 7 installieren, dieses konfigurieren und dann die XSLT Crosswalks anwenden.
MarcEdit hat sich als ein nicht gerade benutzer’innenfreundliches Programm herausgestellt. Auf Anhieb etwas finden konnte ich gleich vergessen. Allein um herauszufinden, wie die Voreinstellungen korrigiert werden können, habe ich viel zu lang gebraucht.
Bei der Übung selbst hat die Konvertierung, ausser bei den ArchivesSpace-Dateien, nicht richtig funktioniert. Der Rest der Dokumente war nach der Konvertierung leer, als ich sie mir im Editor angeschaut habe.
Nach der Übung kam dann die Auflösung: Ich (meine Gruppe übrigens auch nicht) habe offensichtlich nicht begriffen, dass die Daten mehrmals konvertiert werden mussten. Da ich MarcEdit schon zu Beginn sehr mühsam fand, habe ich darauf verzichtet die Übung ein weiteres Mal durchzuführen.