eDissPlus DFG-Projekt: Elektronische Dissertationen Plus

Über die European Open Science Cloud (EOSC) und andere Aspekte der Forschungsdateninfrastruktur. Ein Blick in aktuelle Beiträge bei NATURE.

NATURE Editorial: Don’t let Europe’s open-science dream drift. In: Nature 546, 451 (22 June 2017). doi: 10.1038/546451a

NATURE Editorial: Empty rhetoric over data sharing slows science. In: Nature 546, 327 (15 June 2017). doi: 10.1038/546327a

Emma Kowal, Bastien Llamas, Sarah Tishkoff: Consent: Data-sharing for indigenous peoples. In: Nature 546, 474 (22 June 2017) doi: 10.10348/546474a

Wenig überraschend sind zumindest die Diskussionen zum Thema Forschungsdatenpublikationen in naturwissenschaftlichen Communities entwickelter als in geisteswissenschaftlichen Fachgemeinschaften. Aber es ist nur ein Vorsprung auf Sicht, wie drei aktuelle Beiträge der Zeitschrift NATURE illustrieren. Das Thema ist Gegenstand von Editorials sowohl der Ausgabe vom 15. Juni 2017 wie auch der vom 20. Juni 2017. Zu berücksichtigen bleibt freilich, dass NATURE als eine zentrale Querschnittspublikation zum naturwissenschaftlichen Fachdiskurs auch eigene Interessen hat. Die Plattform Figshare gehört zur gleichen Verlagsgruppe wie die Zeitschrift - Holtzbrinck Publishing. Dass sich die Herausgeber also auch für kommerzielle Plattformen engagieren verwundert wenig, sollte aber auch legitim sein, nicht zuletzt, da viele funktionierende Innovationsleistungen in diesem Bereich derzeit tatsächlich von kommerziellen Akteuren und nicht von der öffentlichen Hand kommen.

Eine Ursache dafür deutet das aktuelle Editorial zur European Open Science Cloud (EOSC) an. Das Projekt soll, wie der Name vermuten lässt, eine übergreifende Datenaustauschstruktur für die europäische Wissenschaft entwickeln. Das Prinzip ist dabei Vernetzung von bestehenden Forschungsdatenzentren und die Parallelen des Ansatzes zu Europeana sind sicher nicht zufällig. Der gemeinsame Wille dazu scheint gegeben. Anderer Gemeinsamkeiten dagegen fehlen. Denn wie man auch von Europeana weiß, ist die eigentliche Herausforderung das Finden von verbindlichen gemeinsamen Standards für Software und Protokolle. Je fortgeschrittener die einzelnen Datenzentren selbst sind, desto größer wird wohl der Aufwand, hier eine Übereinkunft zu finden. So steht die EOSC vor allem vor logistischen und koordinativen Hürden, die dadurch verstärkt werden, dass die Finanzierung noch nicht komplett stabil steht. NATURE gibt als Kostenpunkt 6,7 Mrd. Euro an. Die Europäische Kommission steuert offenbar 2 Mrd. Euro bei. Für die Lücke hofft man, so das Editorial, auf nationale Wissenschaftsförderer und „private sources using „innovative“ business models“. Was immer damit gemeint sein mag.

Zugleich scheinen kommerzielle Anbieter von Forschungsdateninfrastrukturen, jedenfalls für den Geschmack von NATURE, bisher sehr wenig an den Gesprächen zur EOSC teilnehmen zu können. Aktuell könnte das dringlichste Problem jedoch noch zu sein, der guten Absicht überhaupt eine Konkretisierung folgen zu lassen, zum Beispiel, in dem man die Werkzeuge zum Suchen und Abrufen der Forschungsdaten entwickelt oder auszuwählt und sich auf Beschreibungs- und Formatstandards für die Daten zu verständigt. Ein GO FAIR soll genanntes Projekt zumindest die Grundlagen zur grenzüberschreitenden Zusammenarbeit absichern.

Das Editorial von NATURE in der Vorwoche ruft dazu passend aber aus einer anderen Richtung drei der großen Stakeholder der Forschungsdateninfrastrukturen - Wissenschaftspolitik, Wissenschaftsförderung, Wissenschaftsgemeinschaften - dazu auf, es beim Teilen und also Publizieren von Forschungsdaten nicht bei Lippenbekenntnissen zu belassen. Die Infrastruktur selbst, also Bibliotheken, Rechenzentren und Data Center, sind hier offenbar irgendwo in der benannten Dreiergruppe subsumiert, was ein wenig ärgerlich ist, weil sie beim Plattformaufbau und der Koordination von Forschungsdatenprozessen eine erhebliche Rolle spielen.

Allerdings sind ihre Spielräume zugegeben oft begrenzt, wenn es um die Beantwortung der vom Editorial benannten Fragen „Who will pay?“ und „Who will host?“ geht. Die Finanzierung von Diensten ist nur innerhalb des verfügbaren Budgets möglich ob sie sich im Einzelfall als zentrale Hosting-Einrichtung verstehen, hängt auch von den Ressourcen und darüber hinaus vom Leitbild ab.

Bei eDissPlus lernen wir regelmäßig, wie unterschiedlich die Szenarien allein für das Publizieren von dissertationsspezifischen Forschungsdaten sind. Hier für alle Fälle eine umfassende Lösung über das lokale Repositorium anzubieten, wird kaum möglich sein. Die Lage könnte sich dann entschärfen, wenn sich die Fachgemeinschaften und im Fall von eDissPlus auch Prüfungsämter auf verbindliche Standards geeinigt haben. Möglicherweise bewegt sich im großen Rahmen der EOSC etwas. Aber bis dahin können auf Seiten der Hochschulinfrastruktur nur sehr grundlegende Dienste etabliert werden. Szenarien, die mehr als diese Basisangebote brauchen, müssen an anderer Stelle adressiert werden.

Und die Finanzierungshürde bleibt, auch wenn die von NATURE beispielhaft angegebenen Kosten für das arXiv von 1,3 Millionen Dollar für 2017 angesichts des Stellenwerts des Servers für die Wissenschaftslandschaft nicht grundweg schockieren. Doch selbst solche Summen muss man zunächst einmal auftreiben. Die technologische Wartung und Enwicklung bleiben genauso Kostenfaktor wie die inhaltliche im Sinne der Sicherung der Datenintegrität, des Kuratierens und Auffindbarhaltens und selbstverständlich auch der Langzeitarchivierung. Digitale Infrastrukturen sind bekanntlich Systeme im permanenten Fluss, die über ihre Betriebszeit nicht zwangsläufig günstiger werden. Oft eher im Gegenteil.

Das wird bisweilen übersehen, wenn man argumentiert, dass die Versorgungslücke der Forschungsdateninfrastruktur über die institutionellen Repositorien von Hochschulen geschlossen werden könnte. Das NATURE Editorial kritisiert diesen Punkt berechtigt und weist darauf hin, dass diese Landschaft eher „patchy“ sei. Wie gut die individuellen Forschenden in Richtung Data-Sharing unterwegs sein können, hinge demzufolge von der jeweiligen Ausstattung und Schwerpunktsetzung der Einrichtung ab. Dies wird weder den Ansprüchen der Wissenschaftspraxis noch dem allerorten geäußerten Wunsch nach Standardisierung gerecht. Wo Forschungsdatenpolicies bewusst schmal gehalten werden müssen, weil das Repositorium bzw. seine Betreiberinstitution es sich schlichtweg nicht leisten kann, offene und längerfristige Garantien anzubieten, werden die Bedürfnisse der Wissenschaft, die oft genau dies von den Forschungsdaten- und Publikationsinfrastrukturen erwarten, kaum zureichend aufzufangen sein.

Kommerzielle Plattformen sind teilweise eine Art Alternative, aber nicht für jeden. Neben persönlichen wissenschaftsethischen Hemmungen spielt vor allem eine Rolle, dass ihre Nutzung von bestimmten Förderpolicies untersagt wird. Und auch hier sind wirkliche Langzeitperspektiven kaum verbindlich abzusichern.

Angesichts dessen lässt sich schwer widersprechen, wenn das NATURE Editorial verkündet: „For too long, public discussions have overlooked the true costs of data openness.“ Beziehungsweise ist es kaum möglich, tragfähige Lösungen zu finden, weshalb man auf Podiumsdiskussionen, rhetorisch nicht unbedingt ungeschickt, den Schwerpunkt der Debatte gern von diesem Problemthema weg und hin zum viel angenehmeren Thema der Open Science als Ideal verschob und verschiebt. Die Verantwortung hier auf die Forschenden und ihre Wissenschaftsgemeinschaften zu verlagern wird aber vermutlich nicht in erstklassige Angebote für das Publizieren und Vorhalten von Forschungsdaten führen. Auch wenn eine sehr großer Teil der Forschendenen Sympathien für Open-Science-Entwicklungen hegt, tut er dies nicht um jeden Preis. Und man muss auch zur Kenntnis nehmen, dass Wissenschaft lange Zeit Erkenntnis erfolgreich auch ohne offene Forschungsdatenrepositorien zu produzieren verstand. Will man weitreichend auf Open Research Data und Nachnutzungsmöglichkeiten umstellen, muss der Rahmen auch stimmen.

Ein weiteres Problem konkret für NATURE aber sicher auch für die offene Wissenschaft selbst sind die Embargokonventionen einzelner Disziplinen, die einer aufsatzbegleitenden Publikation von Forschungsdaten offenbar häufig entgegen stehen. NATURE möchte naturgemäß, dass Daten sofort publiziert werden. Wir wissen jedoch unter anderem ebenfalls aus den Erfahrungen von eDissPlus, dass es zahlreiche Gründe gibt, warum Forschende ein Embargo oder eine bestenfalls selektive Weitergabe auf Anfrage wünschen. Einige Gründe sind nachvollziehbarer als andere. Die Daten vor einer möglichen Forschungsdkonkurrenz verbergen zu wollen, ist sicher wissenschaftsnormativ weniger statthaft, als Gründe des Datenschutzes. Wer viel mit sozialwissenschaftlich oder ethnologisch Forschenden spricht, wird dafür sensibler sein, als jemand, der vorwiegend in der Astrophysik unterwegs ist. Aber je relevanter Forschungsdaten auch für die kommerzielle Verwertung werden, wenn beispielweise Klimadaten Investitionsentscheidungen beeinflussen, desto komplexer werden die Fragen, wer, wann welchen Einblick enthalten sollte. Wissenschaft operiert nicht nur im kleinen Kreise der Fachgemeinschaften. So überlegen zum Beispiel Zoologen mittlerweile mindestens doppelt, ob sie die Bewegungsdaten seltener Tiere freigeben und damit möglicherweise Wilderer zur nächsten Beute führen. Insbesondere Open Science und Open Scholarship müssen also ihre Implikationen sowohl hinsichtlich der Chancen als auch der Risiken auch jenseits der intrawissenschaftlichen Interessen mitbedenken.

Wie kompliziert dies ist, zeigt schließlich ein aktueller Leserbrief in NATURE zu den Beschränkungen der Möglichkeiten, Genomdaten der australischen Ureinwohner weiter zu geben. Die Autorinnen und der Autor bemängeln, dass die strengen Vorgaben des Australian Board for Ethical Review einen Zugang zu diesen Daten denkbar erschweren. Sie argumentieren, dass die Schutzfunktion einer zentralen Restriktion, nämlich die Notwendigkeit der individuellen Einwilligung der Genomspender_innen bei jeder Datenweitergabe, zugleich einem möglichem Nutzen im Weg steht. Sie plädieren daher für eine Form des „dynamic consent“, die auf ein einmaliges Opt-in oder Opt-out setzt. Angesichts des zuvor gesagten und etwas, das man vielleicht in Entleihung aus dem Urheberrecht als “unbekannte Nutzungsarten” bezeichnen könnte, kann man natürlich sofort wieder ein Gegenargument zu einem pauschalen Opt-In-Opt-Out-Ansatz finden. Aber die Diskussion sollen und müssen andere führen. Wir können zunächst einmal nur darauf hinweisen, wie kompliziert das Thema der Publikation digitaler Forschungsdaten schnell werden kann.

Offene Wissenschaft als Herausforderung

Wenn man sich mit der Frage befasst, wie sich tatsächlich Dienstleistungen von Infrastrukturanbietern wie Universitätsbibliotheken für die offene Wissenschaft (open science, open scholarship) umsetzen lassen, gelangt man relativ schnell an den Punkt, dass Infrastruktur allein nicht ausreicht. Ein aktueller Artikel im Data Science Journal bestätigt dies. Der Autor Jens Klump schreibt in Bezug auf das Teilen von Forschungsdaten:

“Sharing data is not a purely technical issue that can be solved by building research data infrastructures. Over the last decade the development of policies around access to reasearch data has evolved with suprisingly little input from social science studies on this subject.”

Diesen Missstand adressiert er mit seinem Paper Data as Social Capital and the Gift Culture in Research (In: Data Science Journal. 16, p.14. DOI: http://doi.org/10.5334/dsj-2017-014). Auch das eDissPlus-Projekt versucht über das Verfahren qualitativer Interviews Einblicke nicht zuletzt in die wissenschaftssoziologischen Bedingungen zu erhalten, die in unserem Fall konkret beim Publizieren von Forschungsdaten in Dissertationszusammenhängen relevant werden. Was wir dabei feststellen, was auch Jens Klump bestätigt und wofür sich empirisch kaum Gegenbeweise finden lassen, ist, dass ein Anspruch einer möglichst vollumfänglichen offenen Wissenschaft (vgl. dazu auch diesen Beitrag: Drei Gründe für Forschungsdatenpublikationen. Und einige Herausforderungen / 29.09.2016), wie er häufig in einschlägigen Programmen und von Aktivisten im Open-Science-Bereich vertreten wird, an vielen Stellen auch mittelfristig kaum realisierbar sein wird. Eine ausführlicher Auseinandersetzung mit diesem Problem im Anschluss an den Aufsatz von Jens Klump gibt es im LIBREAS-Weblog: Warum die Publikation von Forschungsdaten nach wie vor ein begrenztes Phänomen bleibt. / 05.04.2017. Symptomatisch für die Herausforderung wurde die dort geäußerte Kritik von dem für einen sehr konsequenten Einsatz für Offenheit in der Wissenschaft bekannten Historiker Klaus Graf als zu zögerliche Position interpretiert:

“Ben Kaden gefällt sich einmal mehr darin, gegen allzu viel Offenheit einzutreten”

Das verdeutlicht ein weiteres Mal das Spannungsverhältnis, in dem die konkrete Infrastrukturentwicklung für die offene Wissenschaft zu operieren hat. Auf der einen Seite stehen dogmatische Verteidiger der Werkherrschaft für die Open Access und digitale Medien bereits als Idee wenigstens für die Geisteswissenschaften unsäglich sind (ein typischer Tweet zum Thema). Auf der anderen Seite stehen Open-Access-Vorkämpfer wie Klaus Graf, denen die Entwicklung hin zu radikaler Offenheit nicht konsequent genug umgesetzt wird.

Eine dritte Gruppe und die eigentliche Zielgruppe sind die Wissenschaftler_innen, die von den unerbittlich geführten Diskursschlachten in Social Media, ihren Foren und vor allem auch der Frankfurter Allgemeinen Zeitung nicht unberührt bleiben und das Gefühl haben, sich ständig zu Annahmen positionieren zu müssen, wie, dass die Zukunft der Wissenschaft ausschließlich binär codiert sein wird und das Digitale zugleich unvermeidlich den Abschied vom Medium Buch, wenn nicht gar unserer Vorstellungen von Bildung und Kultur bedeutet.

In der eigenen Wissenschaftspraxis und im Kommunikationsverhalten ihrer Peers erleben sie dagegen, dass sich gar nicht so viel ändert und entsprechend zwischen Behauptungs- bzw. Untergangsdiskurs und der wahrnehmbaren Realität eine erhebliche Lücke existiert. Nach wie vor erscheint ein großer Teil der wissenschaftlichen Kommunikation ganz traditionell. Die meisten E-Publikationen bilden ihre gedruckten Vorbilder, also vor allem den Zeitschriftenaufsatz, nach und lassen bestenfalls hier und da Supplemente zu.

Je mehr man sich auf einer praktischen Ebene und nicht nur auf Twitter ohne in visionären Meinungsbeiträgen und auf Digitalisierungsgipfeln mit der Sachlage befasst, desto deutlicher sieht man die Mühen der Ebenen in der digitalen Wissenschaft und wie viel zum Beispiel bereits gewonnen wäre, wenn es nachhaltig gesicherte und intuitiv zu nutzende Repositorien für Forschungsdaten in allen Disziplinen gäbe. An vielen Stellen ist man gerade erst dabei, Best-Practice-Beispiele umzusetzen. Diese Realität anzunehmen bedeutet keinesfalls, nicht perspektivisch oder sogar visionär zu denken. Aber sie bleibt doch unmittelbare Handlungsrahmen, in den Policies und White Paper übersetzt werden müssen.

Auch die normative Debatte um Offene Wissenschaft ist ohne Frage sehr wichtig, wobei meine empirische Erfahrung aus diversen Interviewreihen bleibt, dass Offenheit an sich für die meisten Wissenschaftlerinnen und Wissenschaftler unkritisch ist. Was sie an der praktischen Ausrichtung ihres Wissenschaftshandeln in diese Richtung hindert, sind (1) ein eventueller zusätzlicher Aufwand, der besonders auch bei Forschungsdatenpublikationen zu erwarten ist, (2) die Befürchtung, dass nicht-traditionelle Publikationen (wozu Open Access dann oft zählt, wenn es nicht ein hochgeranktes Gold-OA-Journal ist) und Publikationsformen (u.a. Weblogs) keinen wissenschaftlichen Reputationsgewinn mit sich bringen und (3), dass sie oft gar nicht wissen, wie man Offene Wissenschaft praktisch angeht. Im Gegensatz zum traditionellen Publizieren ist der entsprechende Kompetenztransfer mittels Lehre und Peer Group nur sehr gering ausgeprägt.

An allen drei Stellen gibt es Baustellen und auf allen drei arbeiten Projekte wie eDissPlus und auch Stammmitarbeiter_innen von Rechenzentren und Bibliotheken mit den ihnen zur Verfügung stehenden Mitteln daran, bestmögliche Bedingungen für die digitale Wissenschaft zu realisieren. Infrastrukturen und Interfaces bemühen sich mehr und mehr um Nutzerfreundlichkeit, aber wo wissenschaftliche Standards hinsichtlich Metadaten oder Nachnutzbarkeit aufrecht erhalten werden sollen, ergibt sich für alle Beteiligten zwangsläufig zusätzlicher Aufwand, der dem oft bemühten Ideal der Google-haftigkeit entgegen steht.

Auf das Reputationssystem der einzelnen Fachkulturen bleibt der Einfluss begrenzt, aber selbstverständlich kann man Reviewing-Formen auch in öffentlich geförderten Publikationsstrukturen aufbauen. Dafür braucht man Partner_innen in den Fachdisziplinen. Es ist ohnehin ein notwendiger Weg, anerkannte und aufgeschlossene Persönlichkeiten aus den Disziplinen als Vermittler_innen bzw. Avantgarde neuer Formen der wissenschaftlichen Kommunikation zu aktivieren. Für die Praxis offener Wissenschaft bedarf es solcher Vorbilder.

Auf Seiten der Infrastruktur benötigt man zudem auf absehbare Zeit und mit wachsendem Anteil Beratungs- und Unterstützungsdienstleistungen zu Aspekten wie Formatstandards und Langzeitverfügbarmachung aber insbesondere auch zu rechtlichen Fragen. Die feuilletongetriebene Verkündung der Urheberenteignung durch Urheberrechtsschranken (Stichwort Publikationsfreiheit.de) erweist sich oft als erstaunlich wirkkräftig und führt dazu, dass man zwar ohne schlechtes Gewissen Sci-Hub zur Literaturversorgung nutzt, anderseits aber darauf besteht, dass die Dissertation ausschließlich gedruckt verfügbar sein wird, damit sie ja nicht eines Tages selbst in einer digitalen Schattenbibliothek landet. Grundkurse in Informationsethik mit Schwerpunkt Wissenschaftsethik sind offensichtlich ein weiteres Desiderat auf dem Weg hin zu Open Science und Scholarship. Folglich bleibt Projekten und Bestrebungen in der Wissenschaftsinfrastruktur gar nichts anderes übrig, als geduldig Stück für Stück in Kooperation mit den Wissenschaftlerinnen und Wissenschaftlern eng abgesteckte Parzellen auf ihre Bedürfnisse vor dem Hintergrund der aktuellen Möglichkeiten und unter Berücksichtigung wissenschafts- und förderpolitischer Vorgaben zu erschließen, immer in der Hoffnung, dass daraus eine Eigendynamik entsteht, die idealerweise über die jeweilige Parzelle hinaus wirkt. Und eines Tages werden dann vermutlich auch eine Reihe von Aspekten aus Open Science und Scholarship wie selbstverständlich Teil der Wissenschaftspraxis sein.

(Berlin, 06. April 2017)

Informationsangebote zum Thema Forschungsdatenmanagement auf Internetseiten deutscher Universitäten. Eine kurze Bestandsaufnahme

(Upadate 11.04.17: Einträge Uni Heidelberg und Uni Kassel angepasst)

Teil des eDissPlus-Projekts ist die Entwicklung und Vermittlung von Informationsangeboten zum Forschungsdatenmanagement. Da sich auch andere Universitäten mit diesem Thema befassen und eigene Informationsangebote bereitstellen, liegt es nah, auch diese zu berücksichtigen. Nachfolgend listen wir daher alle aktuell ermittelbaren Informationsseiten deutscher Universitäten. Die Übersicht erhebt keinerlei Anspruch auf Vollständigkeit, lässt aber erkennen, dass das Thema Forschungsdatenmanagement zwar bei vielen Hochschulen wahrgenommen wird, jedoch längst noch nicht auf der Tagesordnung jeder Universität steht.

Für die Übersicht wurden die Internetauftritte 95 verschiedener Universitäten in Deutschland untersucht. Auf 20 davon fanden sich Informationsangebote zum Thema Forschungsdaten. Gleichwohl kündigen einige Universitäten auf ihren Internetseiten bereits den Aufbau thematisch einschlägiger Informationsangebote an und es ist damit zu rechnen, dass nicht in jedem Fall im Vorfeld eine solche Ankündigung stattfindet. Zusätzlich beschränkte sich die Recherche in den meisten Fällen auf eine kurze Suche mit dem Begriff ‘Forschungsdaten’ über die jeweilige Suchfunktion der Universitäts-Website. Von einem Anspruch auf Repräsentativität muss auch deshalb abgesehen werden - als grobe Bestandsaufnahme und Orientierung ist die entstandene Übersicht jedoch durchaus interessant.

  1. Technische Universität München (Bayern)
    Publikation, Wahl des Datenformats, Forschungsdatenmanagementpläne (kurze Artikel)
    https://www.ub.tum.de/forschungsdatenmanagement

  2. Universität Regensburg (Bayern)
    Forschungsdatenmanagement allgemein, Publikation von FD (kurze Artikel)
    http://www.uni-regensburg.de/bibliothek/elektronisches-publizieren/forschungsdaten/index.html

  3. Eberhard Karls Universität Tübingen (Baden-Württemberg)
    Universität Hohenheim (Baden-Württemberg)
    Universität Heidelberg (Baden-Württemberg)
    Universität Konstanz (Baden-Württemberg)
    allesamt Mitarbeit am Projekt https://www.forschungsdaten.info/

  4. Universität Heidelberg (Baden-Württemberg) Umfangreiche Informationsseite und weiterführende Links zu FD (ebenfalls Mitarbeit am Projekt forschungsdaten.info) http://www.data.uni-heidelberg.de/

  5. Karlsruher Institut für Technologie (Baden-Württemberg)
    Umfangreiche Informationsseite und weiterführende Links zu FD
    (ebenfalls Mitarbeit am Projekt forschungsdaten.info)
    http://www.rdm.kit.edu/

  6. Universität Stuttgart (Baden-Württemberg)
    Unfangreiche Informationsseite zum Planen, Speichern und Teilen/Veröffentlichen von FD
    http://www.ub.uni-stuttgart.de/forschen-publizieren/forschungsdatenmanagement/

  7. Universität Ulm (Baden-Württemberg)
    allgemeine Informationen zu FD (kurze Artikel)
    https://www.uni-ulm.de/einrichtungen/kiz/service-katalog/wid/fdm/forschungsdaten-forschungsdatenmanagement/

  8. Humboldt-Universität zu Berlin (Berlin)
    Umfangreiche Informationsseite zum Thema Forschungsdaten
    https://www.cms.hu-berlin.de/de/dl/dataman

  9. Technische Universität Berlin (Berlin)
    Servicezentrum Forschungsdaten und –publikationen
    (deatillierte Artikel)
    http://www.szf.tu-berlin.de/menue/ueber_das_szf/

  10. Technische Universität Hamburg-Harburg (Hamburg)
    FD allgemein (kurzer Artikel)
    https://www.tub.tuhh.de/publizieren/forschungsdaten/

  11. Technische Universität Darmstadt (Hessen)
    FD allgemein, DMP, Archivierung, Veröffentlichung, Nachnutzung (detaillierte Artikel)
    http://www.ulb.tu-darmstadt.de/service/forschungsdaten/digitale_forschungsdaten_an_der_tu/index.de.jsp

  12. Philipps-Universität Marburg (Hessen)
    FD allgemein, DMP, Archivieren, Veröffentlichen, Metadaten rechtliche Aspekte (detaillierte Artikel)
    http://www.uni-marburg.de/projekte/forschungsdaten

  13. Universität Kassel (Hessen)
    Umfangreiche Informationsseite und weiterführende Links zu FD
    https://www.uni-kassel.de/themen/forschungsdatenmanagement/forschungsdaten.html

  14. RWTH Aachen (Nordrhein-Westfalen)
    FD allgemein (kurze Artikel) und Blog zum Thema FD
    http://www.rwth-aachen.de/cms/root/Forschung/Forschungsdatenmanagement/~hnhg/Forschungsdatenmanagement-an-der-RWTH/
    http://blog.rwth-aachen.de/forschungsdaten/

  15. Universität Bielefeld (Nordrhein-Westfalen)
    Informationsseite zu FD
    https://data.uni-bielefeld.de/en

  16. Westfälische Wilhelms-Universität Münster (Nordrhein-Westfalen)
    Vorgaben, rechtliche Aspekte, DMP, Speichern, Archivieren (kurze Artikel)
    https://www.uni-muenster.de/Forschungsdaten/

  17. Universität Siegen (Nordrhein-Westfalen)
    FD allgemein – Informationsseite mit weiterführenden Angeboten
    https://fdm.zimt.uni-siegen.de/

  18. Technische Universität Dresden (Sachsen)
    Archivieren (detaillierter Artikel)
    https://tu-dresden.de/zih/dienste/service-katalog/arbeitsumgebung/backup_archiv/archivierung_am_zih

  19. Friedrich-Schiller-Universität Jena (Thüringen)
    Handlungsempfehlung zum Forschungsdatenmanagement (PDF Broschüre)
    https://www.hanfried.uni-jena.de/vhbmedia/Hochschulrecht/Spezielles+Hochschulrecht+(FSU+Jena)/Handlungsempfehlung+zum+Forschungsdatenmanagement+der+FSU.pdf

(Marius Ventzke ist Studentischer Mitarbeiter im eDissPlus-Projekt.)

Der Videobeweis in der Wissenschaft. Ein Beitrag in Nature befasst sich mit Publikationserweiterungen zur Qualitätssicherung.

Leicht überarbeitete und erweiterte Nachpublikation dieses Beitrags LIBREAS.Tumblr

Timothy D. Clark (2017): Science, lies and video-taped experiments. In: Nature 542, 139 (09 February 2017) doi:10.1038/542139a

Die Frage, was zukünftige Publikationen (also ”Future Publications”) auszeichnen kann und auszeichnen wird, ist für das Publikationswesen wie auch für Bibliotheken von erheblicher Bedeutung. Das Publikationswesen, also insbesondere Verlage und zunehmend weitere Publikationsdienstleister, suchen nach funktionierenden Geschäftsmodellen im Digitalen. Insbesondere wissenschaftliche Bibliotheken stehen dagegen vor der Aufgabe, ihre Organisation und ihre Dienstleistungen an die jeweils relevanten Medienform der Wissenschaftskommunikation anzupassen. Ein Modell des zukünftigen Publizierens ist das des so genannten Enhanced Publishing (vgl. dazu auch die Materialien des Fu-PusH-Projektes, u.a. dieses Dossier), bei dem ein zentrales Publikationsobjekt, im Normalfall ein Textnarrativ wie zum Beispiel ein wissenschaftlicher Aufsatz, mit weiteren Objekten, z.B. Forschungsdaten (vgl. dazu auch forschungsdaten.org) verknüpft und somit erweitert werden.

Für eDissPlus ist dies besonders relevant, weil es im Projekt bekanntlich um den Umgang von mit Disserationsnarrativen verknüpften Forschungsdaten geht, die unselbstständig publiziert als Supplemente oder als selbstständige, verknüpfte Forschungsdatenpublikationen beispielsweise auf spezialisierten Repositorien vorliegen. Das Konzept der Forschungsdaten ist hierbei durchaus inklusiv und vom jeweiligen Forschungsfeld abhängig. Im Prinzip kann alles, was digital vorliegt und beforscht werden kann, zum Forschungsdatum werden. Eine interessante Erweiterung des Blickes ergibt sich, wenn man Forschungsdaten aus der Warte der Forschungsdokumentation betrachtet. Die Publikation wird dabei zum Mittel, um den Forschungsprozess nachvollziehbar zu machen. An diese Stelle treffen die für die Open Scholarship kennzeichnenden Teilaspekte Open Data und Open Methodology (vgl. dazu Drei Gründe für Forschungsdatenpublikationen, 29.09.2016) aufeinander und vermischen sich unter Umständen.

Eine Perspektive, die gut in diesen Zusammenhang passt, zeichnet Timothy D. Clark in einem Beitrag für die aktuelle Ausgabe von Nature. Ausgangspunkt ist die Wahrnehmung einer doch größeren Zahl von Fällen, in denen wissenschaftliche Ergebnisse unsauber, teils auch per Manipulation von Forschungsdaten erzeugt werden. Aus Gründen der Qualitätskontrolle per Reproduzierbarkeit und zur Sicherung der Forschungstransparenz schlägt er nun eine Art GoPro-isierung der Wissenschaft wenigstens dort vor, wo es möglich ist, nämlich in Wildnis und Labor:

If extreme athletes can use self-mounted cameras to record their wildest adventures during mountaintop blizzards, scientists have little excuse not to record what goes on in lab and field studies.

Die entstehenden Videodaten können wie auch andere Supplemente (weiteres dazu u.a. Forschungsdaten als Supplemente zu Zeitschriftenaufsätzen, 28.07.2016) auf (Medien)Repositorien abgelegt werden. Das bietet sich auf der einen Seite deshalb an, weil Journals für Supplemente häufig eine Maximalgröße vorgeben. Der Autor berichtet von 10-150 MB, was für viele Datenformate ausreicht, für Videodaten aber z.B. dann durchaus knapp bemessen ist. Auf der anderen Seite, nämlich aus der Perspektive des Enhanced Publishing, ist die Publikation auf einem Repositorium auch deshalb vorzuziehen, weil die dort abgelegten Objekte zugleich von mehreren Publikationen referenziert werden können. Auch aus Folgepublikationen kann man ohne Probleme auf diese Daten verweisen. In einer langfristigen Perspektive (oder auch kurzfristigen) können diese Videodaten selbst zu wissenschaftssoziologisch bzw. wissenschaftshistorisch relevanten Forschungsdaten werden.

Schließlich bieten sich Repositorien auch aus der Perspektive offener Forschungsdaten als Publikationsplattformen an. Als Teil einer Zeitschrift und damit oft einer Verlagspublikation sind sie als Supplemente möglicherweise besonders geschützt und können beispielsweise nicht für eine Nachnutzung lizenziert werden. Das vierte Argument für die Wahl eines Repositoriums über die Wahl der Publikation direkt zum Artikel ist das der Auffindbarkeit. Videomaterialien oder auch Forschungsdaten können erfahrungsgemäß bei einer Ablage in einem öffentlichen Repositorium detaillierter erschlossen und damit besser gefunden werden. Wenn es sich um ein Datenrepositorium handelt, unterstützt der Kontext sicher auch die Auffindbarkeit für entsprechend interessierte Zielgruppen.

Wie bei Forschungsdatenpublikation stellt sich auch für dokumentierende Forschungsvideos die Herausforderung bei der Motivation. Das Anfertigen, technische Aufbereiten und Publizieren derartiger Materialien ist fraglos ein erheblicher Zusatzaufwand, den WissenschaftlerInnen vermutlich dann scheuen, wenn er weder gesondert anerkannt wird noch verpflichtend ist. Das weiß auch Timothy D. Clark, der deshalb für Mandate eintritt und entsprechend betont:

The best way to implement these changes is for academic journals to start mandating visual (and audio) evidence to support a submitted paper. As far as I am aware, no journals routinely do this. Journals must also ensure that their stated requirements are adhered to.

Infrastrukturen für digitale Geisteswissenschaften. Eine Anmerkung zu einer aktuellen Forderung des Deutschen Bibliotheksverband e.V.

Der unlängst erschienene Bericht zur Lage der Bibliotheken 2016/17 des Deutschen Bibliotheksverbands e.V. (dbv) enthält erwartungsgemäß eine Vielzahl von interessanten Punkten und Forderungen zur Weiterentwicklung des Bibliothekswesens. Aus unserer Perspektive ist der Anspruch an eine

Nachhaltige Finanzierung für Informationsinfrastrukturen für die Geisteswissenschaften

erwartungsgemäß besonders relevant.

Der Treiber ist an dieser Stelle die Entwicklung der Digital Humanities, die ein wachsendes Bewusstsein für die Rolle von Daten auch in der geisteswissenschaftlichen Forschungspraxis mit sich bringt. Selbst wer nicht digital ediert, Texte statistisch auswertet oder auf Visualisierungen setzt, begegnet dem Konzept der Daten spätestens dann explizit, wenn er digital publiziert und implizit bereits, wenn er/sie eine Internetsuchmaschine oder einen Online-Katalog für die Recherche verwendet.

Da folglich jede digitale Forschungspraxis unweigerlich mit Daten umgehen muss, viele wissenschaftliche Bibliotheken aber traditionell oft immer noch ihren Schwerpunkt in der bibliothekarischen Verwaltung von Medieneinheiten haben, ist es außerordentlich wichtig, eine Öffnung der Bibliotheken und ihrer Dienstleistungen an dieser Stelle nicht nur zu betonen, sondern auch sinnvoll auszugestalten.

Es geht hierbei nicht notwendigerweise um die vollständige Ablösung des Bestandsmodells durch ein Datenvernetzungsmodell. Deutlich ist jedoch, dass die Idee der Bestandsverwaltung viele Bedarfe der digitalen Geisteswissenschaften verfehlt, so dass die Infrastrukturentwicklungen für diese Forschungskulturen nicht selten an den Bibliotheken vorbei laufen oder, wenn es doch einen Bezug gibt, sie innerhalb der Einrichtungen als weitgehend vom Kerngeschäft abzukoppelnde Sonderfälle gelten.

Möglicherweise ist das aktuell noch berechtigt, ist es doch gerade in den Geisteswissenschaften möglich, traditionelle Forschungspraxen weitgehend unbeinträchtigt fortzusetzen. Da die Rolle des Digitalen und damit der Datenorientierung jedoch in allen Wissenschaften perspektivisch an Bedeutung eher gewinnt, braucht es dennoch einerseits entsprechend zugeschnittene Dienstleistungen und andererseits Umsetzungsszenarien für die Einrichtungen. Nicht zu vergessen ist, dass wissenschaftliche Infrastruktureinrichtungen auch eine Verantwortung für eine Art Transformationsmanagement haben, also Entwicklungen und Medienbrüche eben nicht als plötzlich und disruptiv wahrnehmen, sondern sie aktiv mitgestalten und in Rückbindung an den Bedarf ihrer Zielgruppen auch lenken.

Das Papier des dbv skizziert für beide Aspekte - Dienstleistungen und Umsetzungen - kurz konkrete Ansatzpunkte. So leuchtet die Kooperation von Rechenzentren und Bibliotheken unmittelbar ein:

“Rechenzentren bringen Kompetenzen bei der Speicherung von Daten ein, Bibliotheken ihr Know-How beim Nachweis und für die Wiederauffindbarkeit.”

Die komplexen Prozesse der Sammlung (bzw. Harvesting), Speicherung und Langzeitverfügbarhaltung sowie Vermittlung, Aktivierung und Kuratierung von Forschungsdaten sind vermutlich nur auf diese Weise verschränk- und umsetzbar.

Bei den tatsächlichen Dienstleistungen rückt der dbv Aspekte in den Mittelpunkt, die zumindest an der Humboldt-Universität schon angelegt sind und perspektivisch vor dem Hintergrund der in eDissPlus zusammengetragen Aspekte weiter ausgestaltet werden sollen:

  • Unterstützung bei der Erstellung von Datenmanagementplänen
  • Hilfe bei der Auswahl von Fachrepositorien
  • Angebot von Lösungen für die Langzeitarchivierung von Forschungsdaten
  • Unterstützung von Publikationsvorhaben.

Mit dem Anspruch an eine Erweiterung des die Bedürfnisse digitaler Wissenschaft auffangenden bibliothekarischen Dienstleistungsrahmens geht allerdings die Notwendigkeit einer adäquaten Ausstattung sowohl mit technischen Ressourcen und mehr noch mit einschlägig qualifizierten Mitarbeiter/innen einher. Der dbv formuliert entsprechend:

“Investiert werden muss vor allem neben den Grundlagen der Forschungsarbeit in die qualitativ hochwertige Digitalisierung und Retro-Digitalisierung durch Fachpersonal und mit modernster Technik sowie in den Aufbau der nötigen sozialen und technischen Infrastruktur in den Bibliotheken.”

Nach den bisherigen Erfahrungen aus dem Projekt ist der zweite Teil - die soziale und technische Infrastruktur - derzeit ein noch größeres Desiderat als die Digitalisierungsvorhaben.

Innerhalb dieses Bereiches die “soziale Infrastruktur”, was u.a. Ansprechpartner/innen meint, die in der Lage sind, jeweils die fachwissenschaftlichen Ansprüche mit den infrastrukturellen Möglichkeiten zusammenzuführen. In einem erweiterten Szenario ist es durchaus vorstellbar, derart qualifizierte Mitarbeiter/innen als Embedded Librarians weitaus stärker in die konkreten Forschungszusammenhänge einzubinden und sie u.U. sogar bei größeren Forschungsprojekten zum Teil des Projektteams werden zu lassen.

Wie auch immer die Entwicklung aussehen wird, so ist doch deutlich, dass die beobachtbare Schwerpunkterweiterung in den Geisteswissenschaften um datentechnologisch geprägte Forschungsfragen, -ansätze und Methodologien zwangsläufig Verschiebungen im bibliothekarischen Berufsbild und im institutionellen Selbstverständnis nach sich ziehen muss. Dies jedoch ist nur durchsetzbar, wenn entsprechende Angebote in den Betriebs- und Beschäftigungsprofilen der Bibliotheken berücksichtigt werden können. Dazu braucht es, wie der dbv sehr richtig fordert, ein gesamtstaatliches Bekenntnis und einen Willen auf Seiten der Träger, solche Angebote und Entwicklungen langfristig und also nachhaltig abzusichern.