Wir hatten bereits in der vergangenen Woche kurz auf die aktuelle Ausgabe der Fachzeitschrift BIBLIOTHEK - Forschung und Praxis verwiesen, die den Schwerpunkt DARIAH-DE – Digitalität in den Geistes- und Kulturwissenschaften verfolgt und damit auch eine Reihe von Aspekten anspricht, die aus der Perspektive des Forschungsdatenmanagements insbesondere in der Wechselbeziehung zu wissenschaftlichen Infrastrukturen relevant sind. Jenny Oltersdorf und Stefan Schmunk beleuchten beispielsweise die Aktivitäten des so genannten Stakeholdergremiums “Wissenschaftliche Sammlungen” in DARIAH-DE. Als Vertreter der Universitätsbibliothek der Humboldt-Universität zu Berlin, einer Infrastruktureinrichtung, für die derartige Sammlungen Teil ihres Kernbetriebs sind, bildet sich unmittelbar eine Brücke, die umso deutlicher wird, je stärker diese Sammlungen im Digitalen sicht- und möglichst auch nutzbar werden. Zu beachten ist dabei, dass wissenschaftliche Sammlungen nach dem Verständnis des Gremiums ihren Ausgangspunkt in einer konkreten Forschung bzw. Forschungsfrage und nicht etwa, wie Repositorien, in einem allgemeinen infrastrukturellen Anspruch, haben.

Das Stakeholdergremiums “Wissenschaftliche Sammlungen” bietet für den Begriff der wissenschaftlichen Sammlung die folgende Definition an:

Eine wissenschaftliche Sammlung relevanter digitaler Forschungsdaten

  • besteht aus diskreten, voneinander verschiedenen, logisch unabhängigen Einheiten (Bilderregel),
  • muss nicht aus einem Forschungsanliegen heraus entstanden sein, ist aber Gegenstand wissenschaftlicher Fragestellungen bzw. hat das Potential zu einer wissenschaftlichen Analyse und dient der Validierung von Aussagen, Methoden, Thesen, Hypothesen oder Theorien in Forschung und Lehre (Reproduzierbarkeit),
  • kann sowohl Ursprung als auch Ergebnis wissenschaftlicher Arbeit sein (Research Data Life Cycle),
  • ist in einer regelhaften Form maschinenlesbar, dokumentiert, idealerweise nach internationalen Standards erfasst und mit Normdaten ausgezeichnet (Prozessier- und Interpretierbarkeit),
  • gibt Auskunft über ihren Rechtsstatus (z.B. Nutzungsbedingungen und Lizenzen),
  • dient der Ordnung der Sammlungsgegenstände und der archivischen Sicherung (Archivierung)

Interessant ist vor allem auch vor dem Horizont digitaler Kulturdaten, dass eine wissenschaftliche Sammlung nicht aus der Wissenschaft heraus angelegt werden muss, um wissenschaftlich sein zu können:

Eine Sammlung verdient nicht nur dann das Prädikat „wissenschaftlich“, wenn sie im Rahmen eines wissenschaftlichen Forschungsvorhabens entstanden ist und entsprechend bearbeitet wurde. Auch a posteriori kann eine Sammlung Wissenschaftlichkeit vorweisen, wenn sie zur Beantwortung einer wissenschaftlichen Fragestellung erschlossen und so in den Forschungsprozess eingebracht wird – eine wesentliche und wichtige Rolle, die die Gedächtnisorganisationen zukünftig vermehrt übernehmen könnten.

Prinzipiell wird also auf diesem Weg fast alle Art von Kulturmaterial zur potentiellen Sammlung. Für die Gedächtnisinstitutionen stellt dies sicher eine neue Herausforderung dar, müsste ihre sammelnde Rolle in diesem Fall doch weniger durch Akkumulation als durch Kuration geprägt sein. Dies gilt umso mehr, wenn man, wie das Stakeholdergremium eine inklusive Perspektive vertritt.

Ein weiterer Aspekt ist, dass die Ansprüche an die begleitende Dokumentation zu den Sammlungsinhalte und also potentiellen Forschungsdaten steigen. Jenny Oltersdorf und Stefan Schmunk betonen in Anlehnung an Reinhard Kosselleck, dass das Prinzip der Quellenkritik auch auf Forschungsdaten übertragen werden sollte: wie Quellen in der Geschichtswissenschaft müssen auch Forschungsdaten ihre Provenienz und Entstehungsbedingungen sichtbar machen, um valide zu sein.

Und schließlich ergibt sich die Herausforderung des Mengenwachstums. Eine Löschung von Objekten, wie sie in physischen Sammlungsumgebungen aus praktischen Gründen nachvollziehbar war, ist bei digitalen Sammlungen nicht notwendig. Oder wie es im Text heißt:

Die Aufbewahrung von wissenschaftlichen Sammlungen, inklusive grundlegender Metadaten, stellt daher keine technologischen Schwierigkeiten (Speicherplatz, Bit Preservation etc.) mehr dar. Auch wenn digitale Sammlungen zu einem späteren Zeitpunkt technisch und/oder intellektuell nur schwer nutzbar sein sollten (veraltete Datei- und Datenformate etc.), so könnte argumentiert werden, dass ihre Darstellbarkeit bzw. Interpretierbarkeit im Rahmen von Forschungsprojektenerneut hergestellt, und die Einbindungin einen aktiven Forschungsprozess gewährleistet werden.

Man muss aber auch argumentieren, dass reine Bit-Stream-Archive auch aus Retrieval-Sicht sehr problematisch sind. Allein um Forschungsdaten als für eine Wiederverfügbarmachung relevant zu identifizieren, braucht es eindeutige und zeitstabil zugängliche Beschreibungen, also angemessene Metadaten und Datendokumentationen.

Zugleich wird bereits jetzt ein Bedarf an adäquaten rechtlichen Nutzungsregelungen deutliche. Jenny Oltersdorf und Stefan Schmunk verweisen sehr nachvollziehbar auf Anforderungen, die sich im Bereich des Text- und Datamining ergeben. Wenn man davon ausgeht, dass die Sammlungen von Kulturdaten bzw. digitalen Forschungsdaten kontinuierlich wachsen und - siehe Zitat - spezifische Kurationen a posteriori Fragestellungen naturgemäß nicht vorwegnehmen können, wird der Zugang zu diesen Datenarchiven bzw. -sammlungen vermutlich nicht ohne Lösungen auskommen, die man aktuell unter der Bezeichnung Big-Data-Analysen verhandelt. Allein die Abgrenzung der Idee der Nutzung ist für das Datamining bereits eher kompliziert.

Umso sinnvoller ist es, eine gezielte und themennahe Kommunikation zu diesen Aspekten zu pflegen. Soweit ich den Text von Jenny Oltersdorf und Stefan Schmunk verstehe, soll das Stakeholdergremium “Wissenschaftliche Sammlungen” von DARIAH-DE genau diese Funktion übernehmen, indem sie ausgebaut wird als

eine „soziale Infrastruktur“ und „Ort der Forschungskommunikation“, in dem disziplin- und institutionsübergreifende Diskussionen ermöglicht werden, um aktuelle Fragestellungen zum Umgang, zu Nutzung und Speicherung von Forschungsdaten und wissenschaftlichenSammlungen zu thematisieren.

Jenny Oltersdorf / Stefan Schmunk: Von Forschungsdaten und wissenschaftlichen Sammlungen Zur Arbeit des Stakeholdergremiums „Wissenschaftliche Sammlungen“ in DARIAH-DE. In: Bibliothek - Forschung und Praxis, 2 Juli 2016, S. 179-185 DOI: 10.1515/bfp-2016-0036