eDissPlus DFG-Projekt: Elektronische Dissertationen Plus

eDissPlus Workshop-Reihe

Der Umgang mit dissertationsbezogenen Publikationen von Forschungsdaten. Ergebnisse des eDissPlus-Projektes.

Das DFG-Projekt “Elektronische Dissertationen Plus” (eDissPlus), eine Kooperation der Humboldt-Universität zu Berlin und der Deutschen Nationalbibliothek, entwickelte Angebote zur Veröffentlichung von dissertationsbezogenen Forschungsdaten, die als Muster für die Entwicklung entsprechender Angebote an weiteren Institutionen dienen können. Die Projektergebnisse möchten wir gern deutschlandweit in einer Workshop-Reihe vorstellen. Diese wendet sich an Vertreterinnen und Vertreter von akademischen Informationsinfrastruktureinrichtungen (z.B. Universitätsbibliotheken, Rechenzentren) aus den Bereichen Publikationsdienstleistungen und Pflichtablieferung von Dissertationen.

Der Workshop orientiert sich dabei an folgenden thematischen Schwerpunkten:

  • Erwartungen von Promovierenden an Services und Beratungsangebote in Bezug auf Forschungsdatenpublikationen (Präsentation: Ben Kaden, Michael Kleineberg von der Universitätsbibliothek der HU Berlin)
  • Konzeption und Umsetzung der Publikation von dissertationsbezogenen Forschungsdaten am Beispiel des edoc-Servers der HU (Präsentation: Martin Walk vom Computer- und Medienservice der HU Berlin)
  • Pflichtablieferungsprozess der DNB für Dissertationen mit Forschungsdaten (Präsentation: Nathalie Lubetzki von der Deutschen Nationalbibliothek)

Wir präsentieren die Lösung der Humboldt-Universität als Anwendungsfall mit dem Ziel, Anregungen für ähnliche Lösungen an anderen Einrichtungen zu geben.

Es wird insgesamt fünf Workshops an folgenden Einrichtungen geben:

Interessierte Personen sind herzlich eingeladen. Aufgrund des sehr großen Interesses ist die Anzahl der Teilnehmenden begrenzt. Daher bitten wir bei Interesse an einer Teilnahme um eine unverbindliche Anmeldung per E-Mail an die entsprechenden Ansprechpartner bzw. als Online-Anmeldung. Diese entspricht einer Vormerkung. Wir bemühen uns um eine zeitnahe Teilnahmebestätigung.

Guidelines zur Veröffentlichung dissertationsbezogener Forschungsdaten

Der edoc-Server der Humboldt-Universität zu Berlin ermöglicht es Promovierenden zusätzlich zur Dissertation auch zugehörige Forschungsdaten (z.B. Datensätze, Bilder, Audio- bzw. Videodateien, Modelle oder Software) zu publizieren. Das eDissPlus Projekt hat Guidelines zur Unterstützung des Veröffentlichungsprozesses hinsichtlich technischer, organisatorischer und rechtlicher Aspekte erstellt:

Kaden, Ben; Kleineberg, Michael. “Guidelines zur Veröffentlichung dissertationsbezogener Forschungsdaten,” 2018. https://doi.org/10.18452/18811

Informationsangebote zum Thema Forschungsdatenmanagement auf Internetseiten deutscher Universitäten. Eine kurze Bestandsaufnahme

Update 08.02.18 - Einträge aktualisiert und ergänzt
Im Laufe des letzten Jahres hat sich das Informationsangebot zum Thema Forschungsdatenmanagement stark vergrößert. Bestehendes wurde ausgebaut und neue Angebote sind hinzugekommen - die Liste wächst damit von 19 auf 35 Einträge an.

Update 11.04.17 - Einträge Uni Heidelberg und Uni Kassel angepasst

Ursprünglicher Blogpost:
Teil des eDissPlus-Projekts ist die Entwicklung und Vermittlung von Informationsangeboten zum Forschungsdatenmanagement. Da sich auch andere Universitäten mit diesem Thema befassen und eigene Informationsangebote bereitstellen, liegt es nah, auch diese zu berücksichtigen. Nachfolgend listen wir daher alle aktuell ermittelbaren Informationsseiten deutscher Universitäten. Die Übersicht erhebt keinerlei Anspruch auf Vollständigkeit, lässt aber erkennen, dass das Thema Forschungsdatenmanagement zwar bei vielen Hochschulen wahrgenommen wird, jedoch längst noch nicht auf der Tagesordnung jeder Universität steht.

Für die Übersicht wurden die Internetauftritte 95 verschiedener Universitäten in Deutschland untersucht. Auf 20 davon fanden sich Informationsangebote zum Thema Forschungsdaten. Gleichwohl kündigen einige Universitäten auf ihren Internetseiten bereits den Aufbau thematisch einschlägiger Informationsangebote an und es ist damit zu rechnen, dass nicht in jedem Fall im Vorfeld eine solche Ankündigung stattfindet. Zusätzlich beschränkte sich die Recherche in den meisten Fällen auf eine kurze Suche mit dem Begriff ‘Forschungsdaten’ über die jeweilige Suchfunktion der Universitäts-Website. Von einem Anspruch auf Repräsentativität muss auch deshalb abgesehen werden - als grobe Bestandsaufnahme und Orientierung ist die entstandene Übersicht jedoch durchaus interessant.

  1. Friedrich-Alexander-Universität Erlangen-Nürnberg (Bayern)
    https://ub.fau.de/haeufig-gestellte-fragen-faq/forschungsdaten/

  2. Julius-Maximilians-Universität Würzburg (Bayern)
    https://www.uni-wuerzburg.de/data/handlungsempfehlungen/

  3. Technische Universität München (Bayern)
    https://www.ub.tum.de/forschungsdatenmanagement

  4. Universität Bayreuth (Bayern)
    http://www.fdm.uni-bayreuth.de/de/index.php

  5. Universität Regensburg (Bayern)
    http://www.uni-regensburg.de/bibliothek/elektronisches-publizieren/forschungsdaten/index.html

  6. Eberhard Karls Universität Tübingen (Baden-Württemberg)
    https://fdat.escience.uni-tuebingen.de/portal/#/deposit

  7. Universität Hohenheim (Baden-Württemberg)
    https://kim.uni-hohenheim.de/forschungsdatenmanagement

  8. Universität Heidelberg (Baden-Württemberg)
    http://data.uni-heidelberg.de/

  9. Karlsruher Institut für Technologie (Baden-Württemberg)
    http://www.rdm.kit.edu/

  10. Universität Mannheim (Baden-Württemberg)
    https://www.bib.uni-mannheim.de/lehren-forschen/forschungsdaten/

  11. Universität Stuttgart (Baden-Württemberg)
    http://www.ub.uni-stuttgart.de/forschen-publizieren/forschungsdatenmanagement/

  12. Universität Ulm (Baden-Württemberg)
    https://www.uni-ulm.de/en/einrichtungen/kiz/service-catalogue/wid/fdm/forschungsdaten-forschungsdatenmanagement/

  13. Karlsruher Institut für Technologie (Baden-Württemberg)
    Eberhard Karls Universität Tübingen (Baden-Württemberg)
    Universität Hohenheim (Baden-Württemberg)
    Universität Heidelberg (Baden-Württemberg)
    Universität Konstanz (Baden-Württemberg)]
    Allesamt Mitarbeit am Projekt https://www.forschungsdaten.info/

  14. Humboldt-Universität zu Berlin (Berlin)
    https://www.cms.hu-berlin.de/de/dl/dataman

  15. Technische Universität Berlin (Berlin)
    http://www.szf.tu-berlin.de/menue/ueber_das_szf/

  16. Brandenburgische Technische Universität Cottbus (Brandenburg)
    https://www.b-tu.de/bibliothek/publizieren/forschungsdaten

  17. Technische Universität Hamburg-Harburg (Hamburg)
    https://www.tub.tuhh.de/publizieren/forschungsdaten/

  18. Universität Hamburg (Hamburg)
    https://www.fdm.uni-hamburg.de/

  19. Technische Universität Darmstadt (Hessen)
    http://www.ulb.tu-darmstadt.de/service/forschungsdaten/digitale_forschungsdaten_an_der_tu/index.de.jsp

  20. Philipps-Universität Marburg (Hessen)
    http://www.uni-marburg.de/projekte/forschungsdaten

  21. Universität Kassel (Hessen)
    https://www.uni-kassel.de/themen/forschungsdatenmanagement/forschungsdaten.html

  22. Ernst-Moritz-Arndt-Universität Greifswald (Mecklenburg-Vorpommern)
    https://rz.uni-greifswald.de/dienste/studium-lehre/forschungsdatenmanagement/

  23. Technische Universität Carolo-Wilhelmina zu Braunschweig (Niedersachsen)
    https://ub.tu-braunschweig.de/publizieren_openaccess/forschungsdaten/

  24. Gottfried Wilhelm Leibniz Universität Hannover (Niedersachsen)
    https://www.fdm.uni-hannover.de/fdm.html?&no_cache=1

  25. Universität Osnabrück (Niedersachsen)
    https://www.uni-osnabrueck.de/forschung/service/forschungsdaten.html

  26. RWTH Aachen (Nordrhein-Westfalen)
    http://www.rwth-aachen.de/cms/root/Forschung/~lnaw/Forschungsdatenmanagement/
    http://blog.rwth-aachen.de/forschungsdaten/

  27. Universität Bielefeld (Nordrhein-Westfalen)
    https://data.uni-bielefeld.de/en

  28. Westfälische Wilhelms-Universität Münster (Nordrhein-Westfalen)
    https://www.uni-muenster.de/Forschungsdaten/

  29. Universität Siegen (Nordrhein-Westfalen)
    https://fdm.zimt.uni-siegen.de/

  30. Technische Universität Kaiserslautern (Rheinland-Pfalz)
    https://www.ub.uni-kl.de/dienstleistungen/forschungsdaten/

  31. Technische Universität Bergakademie Freiberg (Sachsen)
    http://tu-freiberg.de/ub/publizieren/forschungsdaten

  32. Technische Universität Dresden (Sachsen)
    https://tu-dresden.de/forschung/services-fuer-forschende/kontaktstelle-forschungsdaten#intro-target-box

  33. Christian-Albrechts-Universität zu Kiel (Schleswig-Holstein)
    http://www.datamanagement.uni-kiel.de/de

  34. Friedrich-Schiller-Universität Jena (Thüringen)
    http://www.researchdata.uni-jena.de/Leitlinien.html
    https://www.hanfried.uni-jena.de/vhbmedia/Hochschulrecht/Spezielles+Hochschulrecht+(FSU+Jena)/Handlungsempfehlung+zum+Forschungsdatenmanagement+der+FSU.pdf

(Marius Ventzke ist Studentischer Mitarbeiter im eDissPlus-Projekt.)

Publizieren von Forschungsdaten auf dem edoc-Server

Der Publikationsserver der Humboldt-Universität zu Berlin bietet Promovierenden ab sofort die Möglichkeit zusätzlich zur elektronischen Dissertation auch die zugehörigen digitalen Forschungsdaten (z.B. Audiodateien, Bilder, Datensätze, Forschungsdatensammlungen, Modelle, Software, Videodateien) als Supplement oder integralen Bestandteil zu veröffentlichen.

Die Publikation von dissertationsbegleitenen Forschungsdaten erhöht die Nachvollziehbarkeit von Forschungsergebnissen, eröffnet Möglichkeiten der Nachnutzung und wird den Ansprüchen an eine offene Wissenschaft im Sinne der Open-Access-Erklärung und der Forschungsdaten-Policy der Humboldt-Universität zu Berlin sowie der Sicherung guter wissenschaftlicher Praxis gerecht.

Bei Interesse unterstützen wir Sie gern und freuen uns auf eine Kontaktaufnahme.

Über die European Open Science Cloud (EOSC) und andere Aspekte der Forschungsdateninfrastruktur. Ein Blick in aktuelle Beiträge bei NATURE.

NATURE Editorial: Don’t let Europe’s open-science dream drift. In: Nature 546, 451 (22 June 2017). doi: 10.1038/546451a

NATURE Editorial: Empty rhetoric over data sharing slows science. In: Nature 546, 327 (15 June 2017). doi: 10.1038/546327a

Emma Kowal, Bastien Llamas, Sarah Tishkoff: Consent: Data-sharing for indigenous peoples. In: Nature 546, 474 (22 June 2017) doi: 10.10348/546474a

Wenig überraschend sind zumindest die Diskussionen zum Thema Forschungsdatenpublikationen in naturwissenschaftlichen Communities entwickelter als in geisteswissenschaftlichen Fachgemeinschaften. Aber es ist nur ein Vorsprung auf Sicht, wie drei aktuelle Beiträge der Zeitschrift NATURE illustrieren. Das Thema ist Gegenstand von Editorials sowohl der Ausgabe vom 15. Juni 2017 wie auch der vom 20. Juni 2017. Zu berücksichtigen bleibt freilich, dass NATURE als eine zentrale Querschnittspublikation zum naturwissenschaftlichen Fachdiskurs auch eigene Interessen hat. Die Plattform Figshare gehört zur gleichen Verlagsgruppe wie die Zeitschrift - Holtzbrinck Publishing. Dass sich die Herausgeber also auch für kommerzielle Plattformen engagieren verwundert wenig, sollte aber auch legitim sein, nicht zuletzt, da viele funktionierende Innovationsleistungen in diesem Bereich derzeit tatsächlich von kommerziellen Akteuren und nicht von der öffentlichen Hand kommen.

Eine Ursache dafür deutet das aktuelle Editorial zur European Open Science Cloud (EOSC) an. Das Projekt soll, wie der Name vermuten lässt, eine übergreifende Datenaustauschstruktur für die europäische Wissenschaft entwickeln. Das Prinzip ist dabei Vernetzung von bestehenden Forschungsdatenzentren und die Parallelen des Ansatzes zu Europeana sind sicher nicht zufällig. Der gemeinsame Wille dazu scheint gegeben. Anderer Gemeinsamkeiten dagegen fehlen. Denn wie man auch von Europeana weiß, ist die eigentliche Herausforderung das Finden von verbindlichen gemeinsamen Standards für Software und Protokolle. Je fortgeschrittener die einzelnen Datenzentren selbst sind, desto größer wird wohl der Aufwand, hier eine Übereinkunft zu finden. So steht die EOSC vor allem vor logistischen und koordinativen Hürden, die dadurch verstärkt werden, dass die Finanzierung noch nicht komplett stabil steht. NATURE gibt als Kostenpunkt 6,7 Mrd. Euro an. Die Europäische Kommission steuert offenbar 2 Mrd. Euro bei. Für die Lücke hofft man, so das Editorial, auf nationale Wissenschaftsförderer und „private sources using „innovative“ business models“. Was immer damit gemeint sein mag.

Zugleich scheinen kommerzielle Anbieter von Forschungsdateninfrastrukturen, jedenfalls für den Geschmack von NATURE, bisher sehr wenig an den Gesprächen zur EOSC teilnehmen zu können. Aktuell könnte das dringlichste Problem jedoch noch zu sein, der guten Absicht überhaupt eine Konkretisierung folgen zu lassen, zum Beispiel, in dem man die Werkzeuge zum Suchen und Abrufen der Forschungsdaten entwickelt oder auszuwählt und sich auf Beschreibungs- und Formatstandards für die Daten zu verständigt. Ein GO FAIR soll genanntes Projekt zumindest die Grundlagen zur grenzüberschreitenden Zusammenarbeit absichern.

Das Editorial von NATURE in der Vorwoche ruft dazu passend aber aus einer anderen Richtung drei der großen Stakeholder der Forschungsdateninfrastrukturen - Wissenschaftspolitik, Wissenschaftsförderung, Wissenschaftsgemeinschaften - dazu auf, es beim Teilen und also Publizieren von Forschungsdaten nicht bei Lippenbekenntnissen zu belassen. Die Infrastruktur selbst, also Bibliotheken, Rechenzentren und Data Center, sind hier offenbar irgendwo in der benannten Dreiergruppe subsumiert, was ein wenig ärgerlich ist, weil sie beim Plattformaufbau und der Koordination von Forschungsdatenprozessen eine erhebliche Rolle spielen.

Allerdings sind ihre Spielräume zugegeben oft begrenzt, wenn es um die Beantwortung der vom Editorial benannten Fragen „Who will pay?“ und „Who will host?“ geht. Die Finanzierung von Diensten ist nur innerhalb des verfügbaren Budgets möglich ob sie sich im Einzelfall als zentrale Hosting-Einrichtung verstehen, hängt auch von den Ressourcen und darüber hinaus vom Leitbild ab.

Bei eDissPlus lernen wir regelmäßig, wie unterschiedlich die Szenarien allein für das Publizieren von dissertationsspezifischen Forschungsdaten sind. Hier für alle Fälle eine umfassende Lösung über das lokale Repositorium anzubieten, wird kaum möglich sein. Die Lage könnte sich dann entschärfen, wenn sich die Fachgemeinschaften und im Fall von eDissPlus auch Prüfungsämter auf verbindliche Standards geeinigt haben. Möglicherweise bewegt sich im großen Rahmen der EOSC etwas. Aber bis dahin können auf Seiten der Hochschulinfrastruktur nur sehr grundlegende Dienste etabliert werden. Szenarien, die mehr als diese Basisangebote brauchen, müssen an anderer Stelle adressiert werden.

Und die Finanzierungshürde bleibt, auch wenn die von NATURE beispielhaft angegebenen Kosten für das arXiv von 1,3 Millionen Dollar für 2017 angesichts des Stellenwerts des Servers für die Wissenschaftslandschaft nicht grundweg schockieren. Doch selbst solche Summen muss man zunächst einmal auftreiben. Die technologische Wartung und Enwicklung bleiben genauso Kostenfaktor wie die inhaltliche im Sinne der Sicherung der Datenintegrität, des Kuratierens und Auffindbarhaltens und selbstverständlich auch der Langzeitarchivierung. Digitale Infrastrukturen sind bekanntlich Systeme im permanenten Fluss, die über ihre Betriebszeit nicht zwangsläufig günstiger werden. Oft eher im Gegenteil.

Das wird bisweilen übersehen, wenn man argumentiert, dass die Versorgungslücke der Forschungsdateninfrastruktur über die institutionellen Repositorien von Hochschulen geschlossen werden könnte. Das NATURE Editorial kritisiert diesen Punkt berechtigt und weist darauf hin, dass diese Landschaft eher „patchy“ sei. Wie gut die individuellen Forschenden in Richtung Data-Sharing unterwegs sein können, hinge demzufolge von der jeweiligen Ausstattung und Schwerpunktsetzung der Einrichtung ab. Dies wird weder den Ansprüchen der Wissenschaftspraxis noch dem allerorten geäußerten Wunsch nach Standardisierung gerecht. Wo Forschungsdatenpolicies bewusst schmal gehalten werden müssen, weil das Repositorium bzw. seine Betreiberinstitution es sich schlichtweg nicht leisten kann, offene und längerfristige Garantien anzubieten, werden die Bedürfnisse der Wissenschaft, die oft genau dies von den Forschungsdaten- und Publikationsinfrastrukturen erwarten, kaum zureichend aufzufangen sein.

Kommerzielle Plattformen sind teilweise eine Art Alternative, aber nicht für jeden. Neben persönlichen wissenschaftsethischen Hemmungen spielt vor allem eine Rolle, dass ihre Nutzung von bestimmten Förderpolicies untersagt wird. Und auch hier sind wirkliche Langzeitperspektiven kaum verbindlich abzusichern.

Angesichts dessen lässt sich schwer widersprechen, wenn das NATURE Editorial verkündet: „For too long, public discussions have overlooked the true costs of data openness.“ Beziehungsweise ist es kaum möglich, tragfähige Lösungen zu finden, weshalb man auf Podiumsdiskussionen, rhetorisch nicht unbedingt ungeschickt, den Schwerpunkt der Debatte gern von diesem Problemthema weg und hin zum viel angenehmeren Thema der Open Science als Ideal verschob und verschiebt. Die Verantwortung hier auf die Forschenden und ihre Wissenschaftsgemeinschaften zu verlagern wird aber vermutlich nicht in erstklassige Angebote für das Publizieren und Vorhalten von Forschungsdaten führen. Auch wenn eine sehr großer Teil der Forschendenen Sympathien für Open-Science-Entwicklungen hegt, tut er dies nicht um jeden Preis. Und man muss auch zur Kenntnis nehmen, dass Wissenschaft lange Zeit Erkenntnis erfolgreich auch ohne offene Forschungsdatenrepositorien zu produzieren verstand. Will man weitreichend auf Open Research Data und Nachnutzungsmöglichkeiten umstellen, muss der Rahmen auch stimmen.

Ein weiteres Problem konkret für NATURE aber sicher auch für die offene Wissenschaft selbst sind die Embargokonventionen einzelner Disziplinen, die einer aufsatzbegleitenden Publikation von Forschungsdaten offenbar häufig entgegen stehen. NATURE möchte naturgemäß, dass Daten sofort publiziert werden. Wir wissen jedoch unter anderem ebenfalls aus den Erfahrungen von eDissPlus, dass es zahlreiche Gründe gibt, warum Forschende ein Embargo oder eine bestenfalls selektive Weitergabe auf Anfrage wünschen. Einige Gründe sind nachvollziehbarer als andere. Die Daten vor einer möglichen Forschungsdkonkurrenz verbergen zu wollen, ist sicher wissenschaftsnormativ weniger statthaft, als Gründe des Datenschutzes. Wer viel mit sozialwissenschaftlich oder ethnologisch Forschenden spricht, wird dafür sensibler sein, als jemand, der vorwiegend in der Astrophysik unterwegs ist. Aber je relevanter Forschungsdaten auch für die kommerzielle Verwertung werden, wenn beispielweise Klimadaten Investitionsentscheidungen beeinflussen, desto komplexer werden die Fragen, wer, wann welchen Einblick enthalten sollte. Wissenschaft operiert nicht nur im kleinen Kreise der Fachgemeinschaften. So überlegen zum Beispiel Zoologen mittlerweile mindestens doppelt, ob sie die Bewegungsdaten seltener Tiere freigeben und damit möglicherweise Wilderer zur nächsten Beute führen. Insbesondere Open Science und Open Scholarship müssen also ihre Implikationen sowohl hinsichtlich der Chancen als auch der Risiken auch jenseits der intrawissenschaftlichen Interessen mitbedenken.

Wie kompliziert dies ist, zeigt schließlich ein aktueller Leserbrief in NATURE zu den Beschränkungen der Möglichkeiten, Genomdaten der australischen Ureinwohner weiter zu geben. Die Autorinnen und der Autor bemängeln, dass die strengen Vorgaben des Australian Board for Ethical Review einen Zugang zu diesen Daten denkbar erschweren. Sie argumentieren, dass die Schutzfunktion einer zentralen Restriktion, nämlich die Notwendigkeit der individuellen Einwilligung der Genomspender_innen bei jeder Datenweitergabe, zugleich einem möglichem Nutzen im Weg steht. Sie plädieren daher für eine Form des „dynamic consent“, die auf ein einmaliges Opt-in oder Opt-out setzt. Angesichts des zuvor gesagten und etwas, das man vielleicht in Entleihung aus dem Urheberrecht als “unbekannte Nutzungsarten” bezeichnen könnte, kann man natürlich sofort wieder ein Gegenargument zu einem pauschalen Opt-In-Opt-Out-Ansatz finden. Aber die Diskussion sollen und müssen andere führen. Wir können zunächst einmal nur darauf hinweisen, wie kompliziert das Thema der Publikation digitaler Forschungsdaten schnell werden kann.