eDissPlus DFG-Projekt: Elektronische Dissertationen Plus

Drei Gründe für Forschungsdatenpublikationen.

Drei Gründe für Forschungsdatenpublikationen. Und einige Herausforderungen.

Wir bewegen uns mit eDissPlus-Projekt naturgemäß im Rahmen einer Entwicklung in der wissenschaftlichen Kommunikation, die man gemeinhin unter Open Access zusammenfasst. Differenzierter ist allerdings das Konzept der Open Science bzw. Open Scholarship, welches unterschiedliche Facetten des Forschungsprozesses und der Kommunikation seiner Ergebnisse sowie Bedingungen aufschlüsselt:

  1. Open Access - als offenen Zugang zu wissenschaftlichen Publikationen wie Aufsätzen, Zeitschriften und Monografien
  2. Open (Research) Data - als offenen und nachnutzungsorientierten Zugang zu forschungsrelevanten Daten
  3. Open Source - als offenen und nachnutzungsorientierten Zugang zu digitalen wissenschaftlichen Werkzeugen / wissenschaftlicher Software
  4. Open Methodology - als umfassende, also die Nachvollziehbarkeit der Forschung absicherende Methodentransparenz.

Als Projekt mit dem Schwerpunkt Forschungsdaten interessiert uns vor allem, inwieweit Wissenschaftlerinnen und Wissenschaftler bereit sind, das ihrer Forschung zugrunde liegende Datenmaterial für einer Forschungsdatenpublikation aufzubereiten und entsprechend zu publizieren. Es gibt generell drei Gründe, die für die Publikation von Forschungsdaten sprechen:

  1. Forschungstransparenz - anhand der Forschungsdaten wird nachvollziehbarer, möglicherweise auch reproduzierbar, wie bestimmte Erkenntnisse, die in den Publikationen kommuniziert werden, zustande kommen. Forschungsdaten dienen an dieser Stelle also zur Sichtbarmachung des Forschungsprozesses und zur Verifikation der Ergebnisse. In diesem Szenario ist eine enge Verschränkung von Forschungsnarrativ (z.B. einem Aufsatz oder dem Dissertationstext) mit den Forschungsdaten beispielsweise im Sinne der Idee von Enhanced Publications naheliegend. Hierfür sind bisher nur wenige infrastrukturelle Möglichkeiten und publikationsstrukturelle Konventionen entwickelt. Das eDissPlus-Projekt legt seinen Schwerpunkt mit der Spezialisierung auf die Publikationsform “elektronische Dissertationen” in der Infrastrukturentwicklung auf diesen Aspekt.
  2. Nachnutzbarkeit - nicht in jedem Fall aber doch häufig können einmal erhobene Daten aus weiteren Perspektiven beforscht werden, als es die Erheber für ihren konkreten Forschungszusammenhang vorgenommen haben. An dieser Stelle hilft eine Forschungsdatenpublikation mit Nachnutzungsfreigabe Doppelarbeit zu vermeiden, einen Forschungsrahmen zu erweitern oder auch zukünftige Langzeitstudien vorzubereiten. Der letztgenannte Aspekt unterstreicht, dass es durchaus auch sinnvoll sein kann, Daten ohne akute Nachnutzungsperspektive zu veröffentlichen, da diese zukünftig aus heute noch nicht antizipierbaren Blickwinkeln relevant werden können. Die Herausforderung besteht hier in einer möglichst präzisen Erhebungs-, Kontext- und Strukturdokumentation, die es auch langfristig ermöglicht, den Umfang und das Aussagepotential der Forschungsdaten richtig bewerten zu können. Hierzu agiert das eDissPlus-Projekt vor allem im Bereich von Beratungsdienstleistungen in Kooperation mit der für das Forschungsdatenmanagement zuständigen Stelle der Humboldt-Universität zu Berlin.
  3. Kreditierung - man kann davon ausgehen, dass sich die Wissenschaftlerinnen und Wissenschaftler nur dann umfassend für eine Forschungsdatenpublikation und den damit unvermeidlich zusammenhängenden Mehraufwand (Aufbereitung, Dokumentation) gewinnen lassen, wenn es sehr konkrete Anreize gibt. In der Wissenschaft sind dies im Regelfall Kreditierungen, wie man sie von der Zuschreibung einer Entdeckung bzw. Entwicklung und mehr noch von den vorwiegend mittels Zitationsanalysen gewonnenen Impact Zahlen und Rankings aus den Zeitschriftenpublikationen kennt. Im Bereich der monographischen Publikationskulturen üben die jeweilige Reihe bzw. der Verlagsname diese Funktion aus. Für Forschungsdatenpublikationen sind bisher kaum ähnlich Mechanismen verankert. Aus Sicht vieler Forschenden erscheint dieser Schritt daher als Mehraufwand ohne karrierwirksamen Mehrwert. Es ist jedoch davon auszugehen, dass sich diese Situation langfristig ändert. Bereits heute existieren Data Journals, die entsprechende Ansätze aus der Zeitschriftenkultur übertragbar machen. Auch Forschungsdatenpublikationen auf Publikationsplattformen wie der der Humboldt-Universität erhalten persistente Identifikatoren (in der Regel einen DOI) und sind somit zeitstabil zitierbar. Zudem sind sie über ihre Metadaten über Bibliothekskataloge und andere Discovery Systeme bzw. Suchmaschinen auffindbar. Die infrastrukturelle Seite der Kreditierbarkeit ist also schon jetzt vorbereitet und wird stetig weiterentwickelt. Die Erkenntnisse des eDissPlus-Projektes werden auch an dieser Stelle eine Rolle spielen. Wie Datenpublikationen am Ende jedoch karrierwirksam werden können, müssen die jeweiligen Forschungskulturen klären. Wir bieten den Dialog und bei Bedarf Beratung und ein Engagement bei der weiteren Entwicklung von entsprechenden Prinzipien an.

Letztlich bleibt eine Herausforderung Bedenken wirksam entgegen zu treten, wie sie u.a. aktuell in einer kleinen Anfrage zum Stand des Open Access an den Hochschulen in Thüringen deutlich wird. Der Anfragende Christian Schaft (Die LINKE) wollte u.a. wissen:

Welche Bedenken sind der Landesregierung seitens der Thüringer Hochschulen, Hochschulbibliotheken, Forschungseinrichtungen, Wissenschaftsverbände oder auch einzelner Forschender bezüglich der stärkeren Verwendung von Open-Access-Formaten bekannt?

Das Thüringer Ministerium für Wirtschaft, Wissenschaft und Digitale Gesellschaft antwortete:

Im Kontext von Forschungskooperationen mit Unternehmen stößt der Open-Access-Gedanke im Hinblick auf die Publikation von Forschungsergebnissen, aber vor allem auch hinsichtlich Forschungsprimärdaten auf erhebliche Einwände. Befürchtet wird die Verletzung von Geheimhaltungsverpflichtungen, die für Partner aus der freien Wirtschaft von essentieller Bedeutung zur Sicherung von Wettbewerbsvorteilen sind.

Dies verdeutlicht zunächst vor allem etwas, das sich auch in den bisherigen Interviews mit Promovierenden abzeichnet: Für die Forschungsdatenpublikation ist die Idee des offenen Zugangs (Open Access) im Vergleich zu Publikationen ungleich komplexer. Es wird an dieser Stelle keine pauschale Lösung geben können und jede Empfehlung zur Publikation wird ein “nach Möglichkeit” enthalten müssen. Andererseits ist nicht davon auszugehen, dass man es nur mit Einzelfällen zu tun hat. Aus diesem Grund wird das eDissPlus-Projekt für seinen Teilbereich der dissertationsbegleitenden Forschungsdatenpublikationen auf Grundlage der Interviews und Einzelbegleitungen Szenarien entwickeln, aus denen sich, so die Vermutung, eine Typologie des Umgangs mit Forschungsdaten in Dissertationszusammenhängen erstellen lässt.

Forschungsdaten und das Stakeholdergremium „Wissenschaftliche Sammlungen“ bei DARIAH-DE

Wir hatten bereits in der vergangenen Woche kurz auf die aktuelle Ausgabe der Fachzeitschrift BIBLIOTHEK - Forschung und Praxis verwiesen, die den Schwerpunkt DARIAH-DE – Digitalität in den Geistes- und Kulturwissenschaften verfolgt und damit auch eine Reihe von Aspekten anspricht, die aus der Perspektive des Forschungsdatenmanagements insbesondere in der Wechselbeziehung zu wissenschaftlichen Infrastrukturen relevant sind. Jenny Oltersdorf und Stefan Schmunk beleuchten beispielsweise die Aktivitäten des so genannten Stakeholdergremiums “Wissenschaftliche Sammlungen” in DARIAH-DE. Als Vertreter der Universitätsbibliothek der Humboldt-Universität zu Berlin, einer Infrastruktureinrichtung, für die derartige Sammlungen Teil ihres Kernbetriebs sind, bildet sich unmittelbar eine Brücke, die umso deutlicher wird, je stärker diese Sammlungen im Digitalen sicht- und möglichst auch nutzbar werden. Zu beachten ist dabei, dass wissenschaftliche Sammlungen nach dem Verständnis des Gremiums ihren Ausgangspunkt in einer konkreten Forschung bzw. Forschungsfrage und nicht etwa, wie Repositorien, in einem allgemeinen infrastrukturellen Anspruch, haben.

Das Stakeholdergremiums “Wissenschaftliche Sammlungen” bietet für den Begriff der wissenschaftlichen Sammlung die folgende Definition an:

Eine wissenschaftliche Sammlung relevanter digitaler Forschungsdaten

  • besteht aus diskreten, voneinander verschiedenen, logisch unabhängigen Einheiten (Bilderregel),
  • muss nicht aus einem Forschungsanliegen heraus entstanden sein, ist aber Gegenstand wissenschaftlicher Fragestellungen bzw. hat das Potential zu einer wissenschaftlichen Analyse und dient der Validierung von Aussagen, Methoden, Thesen, Hypothesen oder Theorien in Forschung und Lehre (Reproduzierbarkeit),
  • kann sowohl Ursprung als auch Ergebnis wissenschaftlicher Arbeit sein (Research Data Life Cycle),
  • ist in einer regelhaften Form maschinenlesbar, dokumentiert, idealerweise nach internationalen Standards erfasst und mit Normdaten ausgezeichnet (Prozessier- und Interpretierbarkeit),
  • gibt Auskunft über ihren Rechtsstatus (z.B. Nutzungsbedingungen und Lizenzen),
  • dient der Ordnung der Sammlungsgegenstände und der archivischen Sicherung (Archivierung)

Interessant ist vor allem auch vor dem Horizont digitaler Kulturdaten, dass eine wissenschaftliche Sammlung nicht aus der Wissenschaft heraus angelegt werden muss, um wissenschaftlich sein zu können:

Eine Sammlung verdient nicht nur dann das Prädikat „wissenschaftlich“, wenn sie im Rahmen eines wissenschaftlichen Forschungsvorhabens entstanden ist und entsprechend bearbeitet wurde. Auch a posteriori kann eine Sammlung Wissenschaftlichkeit vorweisen, wenn sie zur Beantwortung einer wissenschaftlichen Fragestellung erschlossen und so in den Forschungsprozess eingebracht wird – eine wesentliche und wichtige Rolle, die die Gedächtnisorganisationen zukünftig vermehrt übernehmen könnten.

Prinzipiell wird also auf diesem Weg fast alle Art von Kulturmaterial zur potentiellen Sammlung. Für die Gedächtnisinstitutionen stellt dies sicher eine neue Herausforderung dar, müsste ihre sammelnde Rolle in diesem Fall doch weniger durch Akkumulation als durch Kuration geprägt sein. Dies gilt umso mehr, wenn man, wie das Stakeholdergremium eine inklusive Perspektive vertritt.

Ein weiterer Aspekt ist, dass die Ansprüche an die begleitende Dokumentation zu den Sammlungsinhalte und also potentiellen Forschungsdaten steigen. Jenny Oltersdorf und Stefan Schmunk betonen in Anlehnung an Reinhard Kosselleck, dass das Prinzip der Quellenkritik auch auf Forschungsdaten übertragen werden sollte: wie Quellen in der Geschichtswissenschaft müssen auch Forschungsdaten ihre Provenienz und Entstehungsbedingungen sichtbar machen, um valide zu sein.

Und schließlich ergibt sich die Herausforderung des Mengenwachstums. Eine Löschung von Objekten, wie sie in physischen Sammlungsumgebungen aus praktischen Gründen nachvollziehbar war, ist bei digitalen Sammlungen nicht notwendig. Oder wie es im Text heißt:

Die Aufbewahrung von wissenschaftlichen Sammlungen, inklusive grundlegender Metadaten, stellt daher keine technologischen Schwierigkeiten (Speicherplatz, Bit Preservation etc.) mehr dar. Auch wenn digitale Sammlungen zu einem späteren Zeitpunkt technisch und/oder intellektuell nur schwer nutzbar sein sollten (veraltete Datei- und Datenformate etc.), so könnte argumentiert werden, dass ihre Darstellbarkeit bzw. Interpretierbarkeit im Rahmen von Forschungsprojektenerneut hergestellt, und die Einbindungin einen aktiven Forschungsprozess gewährleistet werden.

Man muss aber auch argumentieren, dass reine Bit-Stream-Archive auch aus Retrieval-Sicht sehr problematisch sind. Allein um Forschungsdaten als für eine Wiederverfügbarmachung relevant zu identifizieren, braucht es eindeutige und zeitstabil zugängliche Beschreibungen, also angemessene Metadaten und Datendokumentationen.

Zugleich wird bereits jetzt ein Bedarf an adäquaten rechtlichen Nutzungsregelungen deutliche. Jenny Oltersdorf und Stefan Schmunk verweisen sehr nachvollziehbar auf Anforderungen, die sich im Bereich des Text- und Datamining ergeben. Wenn man davon ausgeht, dass die Sammlungen von Kulturdaten bzw. digitalen Forschungsdaten kontinuierlich wachsen und - siehe Zitat - spezifische Kurationen a posteriori Fragestellungen naturgemäß nicht vorwegnehmen können, wird der Zugang zu diesen Datenarchiven bzw. -sammlungen vermutlich nicht ohne Lösungen auskommen, die man aktuell unter der Bezeichnung Big-Data-Analysen verhandelt. Allein die Abgrenzung der Idee der Nutzung ist für das Datamining bereits eher kompliziert.

Umso sinnvoller ist es, eine gezielte und themennahe Kommunikation zu diesen Aspekten zu pflegen. Soweit ich den Text von Jenny Oltersdorf und Stefan Schmunk verstehe, soll das Stakeholdergremium “Wissenschaftliche Sammlungen” von DARIAH-DE genau diese Funktion übernehmen, indem sie ausgebaut wird als

eine „soziale Infrastruktur“ und „Ort der Forschungskommunikation“, in dem disziplin- und institutionsübergreifende Diskussionen ermöglicht werden, um aktuelle Fragestellungen zum Umgang, zu Nutzung und Speicherung von Forschungsdaten und wissenschaftlichenSammlungen zu thematisieren.

Jenny Oltersdorf / Stefan Schmunk: Von Forschungsdaten und wissenschaftlichen Sammlungen Zur Arbeit des Stakeholdergremiums „Wissenschaftliche Sammlungen“ in DARIAH-DE. In: Bibliothek - Forschung und Praxis, 2 Juli 2016, S. 179-185 DOI: 10.1515/bfp-2016-0036

Forschungslizenzen

Das Juliheft der Zeitschrift BIBLIOTHEK - Forschung und Praxis hat den Schwerpunkt DARIAH-DE und ist entsprechend für alle, die sich mit Digital Humanities und / oder geisteswissenschaftlichen Forschungsdaten beschäftigen, zweifellos hochinteressant. Das Inhaltsverzeichnis der Ausgabe gibt es unter: http://www.degruyter.com/view/j/bfup.2016.40.issue-2/issue-files/bfup.2016.40.issue-2.xml.

Wir werden nach Möglichkeit bei Gelegenheit an dieser Stelle auf einige der dort veröffentlichten Aufsätze zurückkommen. Zunächst aber scheint es uns geboten, sehr akut auf ein Angebot hinzuweisen, das Sibylle Söring in ihrem Überblickstext zur auf die Editionswissenschaften ausgerichteten virtuellen Forschungsumgebung TextGrid erwähnt. In diesem liest man kurz vor dem Ende:

Das jüngst in Zusammenarbeit mit dem Deutschen Institut für Archäologie entstandene Portal Forschungslizenzen informiert anhand aktueller geisteswissenschaftlicher Forschungsprojekte über Rechte und Lizenzen bei der Freigabe von Forschungsdaten. [Sibylle Söring: Technische und infrastrukturelle Lösungen für digitale Editionen: DARIAH-DE und TextGrid. In: BIBLIOTHEK Forschung und Praxis 2016, 40(2). S. 207-221. DOI: 10.1515/bfp-2016-0040]

Wie aktuell das jüngst ist, wissen wir nicht. Wir haben uns aber selbstverständlich sofort das verlinkte Angebot www.forschungslizenzen.de angesehen und finden es so gut, dass wir sofort einen Hinweis darauf auch an dieser Stelle setzen wollen. Das Angebot stammt zwar aus dem DARIAH-Umfeld, also dem Bereich der digitalen Geisteswissenschaften. Es ist aber über weite Strecken, zum Beispiel bei den Übersichten zur Lizenzauswahl, auch für Forschende in anderen Wissenschaftsbereichen sehr empfehlenswert.

Forschungsdaten als Supplemente zu Zeitschriftenaufsätzen

Jeremy Kenyon, Nancy Sprague, Edward Flathers: The Journal Article as a Means to Share Data: a Content Analysis of Supplementary Materials from Two Disciplines. In: Journal of Librarianship and Scholarly Communication. 4, p.eP2112. DOI: http://doi.org/10.7710/2162-3309.2112

Auch wenn sich das eDissPlus-Projekt hauptsächlich mit Forschungsdaten befasst, die Dissertationen begleiten, lohnt der Blick darauf, wie Fachgemeinschaften generell in ihren wissenschaftlichen Kommunikationsstrukturen mit solchen Supplementen umgehen. Ein aktueller Artikel von Jeremy Kenyon, Nancy Sprague und Edward Flathers von der University of Idaho liefert einige Ansatzpunkte. Die Autor*innen untersuchten, wie Fachzeitschriften mit solchen so genannten Online Journal Supplements umgehen. Hierbei schließt sich nebenbei der Kreis zu den im Fu-Push-Projekt an der Universitätsbibliothek untersuchten, so genannten Enhanced Publications bzw. Erweiterten Publikationen, allerdings nicht vollständig, ging es in in diesem doch um das geisteswissenschaftliche Publizieren. Der vorliegende Artikel analysiert dagen Zeitschriften aus den Bereichen der Geowissenschaften und der Botanik (Plant Sciences). Insgesamt wurden 15 Titel untersucht.

Interessant ist zunächst die Motivationslage bei der begleitenden Publikation von Daten und ergänzenden Materialien. Weniger als ein durchaus denkbarer intrinsischer Anreiz - beispielsweise aufgrund einer breiteren Überzeugung hinsichtlich der Open Science in Kombination mit passenden Publikationsangeboten durch die Verlage - verweisen Kenyon et al. hauptsächlich auf wissenschaftspolitische Ursachen. Forschungsförderungsinstitutionen legen nicht nur Wert auf Datenmanagementpläne sondern fordern - analog zu Open-Access-Policies - einen öffentlichen Zugang zu Forschungsdaten aus öffentlich geförderten Projekten. Dem begegnen einerseits Zeitschriften - ob proaktiv oder reaktiv erläutert der Text nicht - dadurch, dass sie ebenfalls Supplemente zu den Aufsätzen einfordern und andererseits Institutionen mit der Einrichtung von Datenrepositorien.

Entsprechend aufschlussreich ist der Blick auf den Umgang mit solchen Supplementary Materials bei ausgewählten Zeitschriften aus den genannten Fachbereichen.

Es lassen sich überblickshalber folgene Erkenntnisse festhalten:

  • Zahl der Supplemente pro Artikel: Die Mehrzahl der Artikel mit Supplementen hat ein bis drei Ergänzungsdateien, wobei einzelne Dateien auch mehrere Inhaltsobjekte bündeln können.
  • Code bzw. Scripte werden nur in geringem Umfang geteilt und ließen sich für die Botanik gar nicht nachweisen.
  • Sehr häufig wurden für die Publikation als Supplement aufbereitete Tabellen geteilt.
  • Erschließung: Die Supplemente enthalten insgesamt viel Zusatzmaterial, das jedoch schwer zu finden und in der vorliegenden Form kaum nachnutzbar ist. (So ist die Publikation in PDFs durchaus üblich - vgl. auch Womack, Ryan P. (2015): Research Data in Core Journals in Biology, Chemistry, Mathematics, and Physics. In: PloS one 10 (12), p. e0143460. DOI: http://doi.org/10.1371/journal.pone.0143460.)
  • Datenmengen: Keine der beiden Disziplinen scheint außergewöhnlich große und damit nach aktuellen Bedingungen problematische Datenmengen als Supplemente zu teilen. Im Durchschnitt hatten die Dateien eine Größe von 1,4 MB.
  • Nutzung von Repositorium: Zwei der größten Datensätze wurde auf einem separaten Repositorium abgelegt. Dies ist allerdings ein Sonderfall. Die meisten Materialien werden direkt über die Webseiten der jeweiligen Zeitschriften vermittelt. Kenyon et al. leiten daraus ab, dass Datenrepositorien vor allem als Ergänzung eine Rolle spielen können:
    • „[The] differentiation between the treatment of large and small files may suggest that institutional or disciplinary data repositories could provide a niche service that would complement data sharing through journal supplementary material.“
  • Datenformate: Bei den Formaten wirken weniger fachwissenschaftliche Besonderheiten und mehr die Gepflogenheiten des wissenschaftlichen Schreibens und Publizierens, also mit Textverarbeitungssoftware und Büroanwendungen erstellte Dateien. Dominant sind bei den Supplementen die gängigen Microsoft-Anwendungen (Excel, Powerpoint). Daten, die mit anderen Anwendungen erzeugt werden, werden in einer überwiegenden Zahl der Fälle in diesen Standard-Formaten weiter verarbeitet, also entsprechend für die Publikation als Supplement aufbereitet. Der Vorteil ist die direkte Lesbarkeit durch den Menschen. Als nachteilig erweist sich, dass diese Formate für automatisierte Auswertungen und Indexierungen sowie eine Nachnutzung wenig zu gebrauchen sind.
  • Maschinenlesbarkeit 1: Daten werden also nur selten in maschinenlesbarer Form geteilt.
  • Maschinenlesbarkeit 2: Die Geowissenschaften scheinen der Publikation maschinenlesbarer Formate eher zugeneigt. (Beispiel: GIS-Dateien).

Darauf aufbauend formulieren Kenyon et al. einige Einsichten für Infrastrukturen (Verlage und Herausgeber, Data Manager und Bibliothekar*innen, die sich mit solchen Supplementen befassen):

  • Verlage dürften hinsichtlich der Stabilität ihrer Infrastrukturen keine größeren Probleme haben, da die Supplemente sowohl in Formaten wie auch Größe den Aufsatzpublikationen ähneln. Auch die direkte Einsehbarkeit der Dateien dürfte für die meisten Leser*innen gegeben sein. Disziplinäre Unterschiede spielen keine Rolle.
  • Auch für Bibliotheken und Rechenzentren ist die reine Archivierung und Verfügbarhaltung der Materialien bei den bisherigen Verfahren so keine erhebliche Herausforderung, insbesondere, wenn bereits Hosting-Dienste für Dateien bestehen. Die Herausforderung liegt vielmehr im Bereich der Discoverability der Materialien. Gepackte Inhalte lassen keine Rückschlüsse über die Inhalte zu. Auch die fehlenden Maschinenlesbarkeit wirkt an dieser Stelle als Hürde.
  • Sind also eine gezielte Auffindbarkeit und Nachnutzung das Ziel, müssen weitere bzw. andere Aufbereitungsschritte für die Daten erfolgen. Die Publikationsinfrastrukturen können an dieser Stelle aktiv werden, wenn sie möglichst standardisierte Bedingungen für nachnutzungsfreundliche Formate, Dokumentationen und Datenstrukturen vermitteln. Diese sollten fachgebietsübergreifend gelten.

Wer soll Zugang zu Forschungsdaten bekommen. Eine Anmerkung zur Idee der "Intelligent Openness"

Unterschiedliche Fächer=unterschiedliche Ansprüche

Ein häufig genanntes Argument gegen die Publikation und Nachnutzbarmachung von Forschungsdaten verweist auf die sehr unterschiedlichen Ansprüche der jeweiligen Fachgemeinschaften und zu differenzierende vor allem rechtlich und /oder ethisch begründete Herausforderungen (urheber- und datenschutzsrechtliche Bedenken, Sorge vor Fehlinterpretationen oder Missbrauch u.ä.) der unterschiedlichen Formen von Forschungsdaten. Hier stellt sich die Frage, wer jeweils die Verantwortung für die publizierten und bereitgestellten Forschungsdaten übernimmt. In der Forschungsdatenpoliciy der Humboldt-Universität heißt es:

Die Humboldt-Universität empfiehlt, Forschungsdaten ebenso wie die wissenschaftliche Publikation gemäß der Open-Access-Erklärung der HU frühestmöglich öffentlich zugänglich zu machen.

Es ist jedoch unstrittig, dass dies, anders als bei der Debatte um den freien Zugang zu mit öffentlichen Mitteln finanzierten Publikationen (Open Access), bei der Bereitstellung von Forschungsdaten oft nur mit der Einschränkung einer rechtlichen und forschungslogischen Eignung der jeweiligen Daten realisiert werden kann. Eine grundsätzliche Bedeutung erhalten dabei die Aufbereitungsschritte für Forschungsdatensätze, die einerseits eine eindeutige Dokumentation und die Auszeichnung mit standardisierten Metadaten umfassen und andererseits auch eine redaktionelle Aufarbeitung von Forschungsdaten, so dass Rechtskonformität (bzw. Compliance) erreicht und eine sinnvolle Nachvollziehbar- und Nachnutzbarkeit abgesichert wird. Aufgrund der Heterogenität der Forschungsdatenaktivitäten in unterschiedlichen Forschungsfeldern kann keine pauschale Vorgabe für alle Anwendungsfälle formuliert werden.

Intelligent Openness

Ein Ansatz, mit dieser Herausforderung umzugehen, findet sich in dem 2012 von der Royal Society formulierten Ansatz einer Intelligent Openness, der die Verantwortung, so eine Lesart, jeweils an die Fachgemeinschaften delegiert.

Realising the benefits of open data requires effective communication through a more intelligent openness: data must be accessible and readily located; they must be intelligible to those who wish to scrutinise them; data must be assessable so that judgments can be made about their reliability and the competence of those who created them; and they must be usable by others. For data to meet these requirements it must be supported by explanatory metadata (data about data). As a first step towards this intelligent openness, data that underpin a journal article should be made concurrently available in an accessible database. (S.7)

Der landläufige Schluss, dass sich daraus ein von den fachwissenschaftlichen Gemeinschaften definierter Grad der Freiheit des Zugangs ergibt (so unlängst im Bericht zur KOBV-Veranstaltung »Roundtable Forschungsdatenpolicies« am 16.6.2016 im ZIB) lässt sich aus dem konkreten Wortlaut freilich nicht zwingend ableiten. Die Royal Society formuliert vielmehr einen sehr konsequenten Anspruch an die Offenheit von Forschungsdaten (zugänglich und abrufbar) und die Grundbedingung der Auszeichnung mit erläuternden Metadaten für die Nutzbarkeit. Die Aussage “must be intelligible to those who wish to scrutinise them” unterstreicht einzig, dass man sich dabei an den jeweils für die Nachvollziehbarkeit notwendigen fachkulturellen Standards halten sollte. Das Adressaten dieser Openness sind - im Unterschied zum Open Access zu Publikationen - weniger Vertreter*innen einer allgemeinen (Fach-)Öffentlichkeit sondern eher konkret die Peers, die auf der Grundlage der zugänglich gemachten Daten die wissenschaftliche Qualität der Arbeit ihrer Fachkolleg*innen einschätzen können. Damit dies möglich wird, müssen laut des Berichtes vier allgemeine Kriterien erfüllt sein: Zugänglichkeit (accessibility), Verständlichkeit (intelligibility), Bewertbarkeit (assessability) und Nutzbarkeit (usability). (vgl. Royal Society, S. 66)

Perspektiven

Dessen ungeachtet scheint es sinnvoll, ein Konzept für eine abstufbare und differenzierte Zugänglichmachung von Forschungsdaten zu haben, die idealerweise von der jeweiligen Fachgemeinschaft definierten Standards folgt. Für die in diesem Bereich aktiven Infrastruktureinrichtungen ist eine Kenntnis dieser Eigenheiten und ein Verständnis der dahinter stehenden Überlegungen notwendig. Andererseits dürfte es im Aufgabenbereich der Infrastrukturanbieter (=Bibliotheken, Rechenzentrum u.ä.) liegen, generelle und fachübergreifende Ansprüche im Bereich der Forschungsdatentransparenz und -publikation an die Fachgemeinschaften zurück zu vermitteln und nach Möglichkeit einen entsprechenden interdiszipilinären Dialog zu fördern. Das Ideal einer möglichst offenen Zugänglichkeit und damit Forschungstransparenz sollte dabei durchaus weiter verfolgt werden. Der Erfahrungsrahmen, die Bedürfnisse und die Möglichkeiten der unterschiedlichen Forschungskulturen sind in die Ausgestaltung des Möglichen jedoch unbedingt einzubeziehen. Aus diesem Grund suchen wir im eDissPlus-Projekt bewusst den Kontakt zu Promovierenden aus einer großen Bandbreite von Disziplinen, um über Interviews die jeweiligen Besonderheiten herauszuarbeiten. Sollte uns im Zuge dessen eine passendere Bezeichnung als intelligent openness begegnen, werden wir dies umgehend hier vermelden.

Quelle: The Royal Society: Science as an open enterprise. London: 2012, PDF