NATURE Editorial: Don’t let Europe’s open-science dream drift. In: Nature 546, 451 (22 June 2017). doi: 10.1038/546451a

NATURE Editorial: Empty rhetoric over data sharing slows science. In: Nature 546, 327 (15 June 2017). doi: 10.1038/546327a

Emma Kowal, Bastien Llamas, Sarah Tishkoff: Consent: Data-sharing for indigenous peoples. In: Nature 546, 474 (22 June 2017) doi: 10.10348/546474a

Wenig überraschend sind zumindest die Diskussionen zum Thema Forschungsdatenpublikationen in naturwissenschaftlichen Communities entwickelter als in geisteswissenschaftlichen Fachgemeinschaften. Aber es ist nur ein Vorsprung auf Sicht, wie drei aktuelle Beiträge der Zeitschrift NATURE illustrieren. Das Thema ist Gegenstand von Editorials sowohl der Ausgabe vom 15. Juni 2017 wie auch der vom 20. Juni 2017. Zu berücksichtigen bleibt freilich, dass NATURE als eine zentrale Querschnittspublikation zum naturwissenschaftlichen Fachdiskurs auch eigene Interessen hat. Die Plattform Figshare gehört zur gleichen Verlagsgruppe wie die Zeitschrift - Holtzbrinck Publishing. Dass sich die Herausgeber also auch für kommerzielle Plattformen engagieren verwundert wenig, sollte aber auch legitim sein, nicht zuletzt, da viele funktionierende Innovationsleistungen in diesem Bereich derzeit tatsächlich von kommerziellen Akteuren und nicht von der öffentlichen Hand kommen.

Eine Ursache dafür deutet das aktuelle Editorial zur European Open Science Cloud (EOSC) an. Das Projekt soll, wie der Name vermuten lässt, eine übergreifende Datenaustauschstruktur für die europäische Wissenschaft entwickeln. Das Prinzip ist dabei Vernetzung von bestehenden Forschungsdatenzentren und die Parallelen des Ansatzes zu Europeana sind sicher nicht zufällig. Der gemeinsame Wille dazu scheint gegeben. Anderer Gemeinsamkeiten dagegen fehlen. Denn wie man auch von Europeana weiß, ist die eigentliche Herausforderung das Finden von verbindlichen gemeinsamen Standards für Software und Protokolle. Je fortgeschrittener die einzelnen Datenzentren selbst sind, desto größer wird wohl der Aufwand, hier eine Übereinkunft zu finden. So steht die EOSC vor allem vor logistischen und koordinativen Hürden, die dadurch verstärkt werden, dass die Finanzierung noch nicht komplett stabil steht. NATURE gibt als Kostenpunkt 6,7 Mrd. Euro an. Die Europäische Kommission steuert offenbar 2 Mrd. Euro bei. Für die Lücke hofft man, so das Editorial, auf nationale Wissenschaftsförderer und „private sources using „innovative“ business models“. Was immer damit gemeint sein mag.

Zugleich scheinen kommerzielle Anbieter von Forschungsdateninfrastrukturen, jedenfalls für den Geschmack von NATURE, bisher sehr wenig an den Gesprächen zur EOSC teilnehmen zu können. Aktuell könnte das dringlichste Problem jedoch noch zu sein, der guten Absicht überhaupt eine Konkretisierung folgen zu lassen, zum Beispiel, in dem man die Werkzeuge zum Suchen und Abrufen der Forschungsdaten entwickelt oder auszuwählt und sich auf Beschreibungs- und Formatstandards für die Daten zu verständigt. Ein GO FAIR soll genanntes Projekt zumindest die Grundlagen zur grenzüberschreitenden Zusammenarbeit absichern.

Das Editorial von NATURE in der Vorwoche ruft dazu passend aber aus einer anderen Richtung drei der großen Stakeholder der Forschungsdateninfrastrukturen - Wissenschaftspolitik, Wissenschaftsförderung, Wissenschaftsgemeinschaften - dazu auf, es beim Teilen und also Publizieren von Forschungsdaten nicht bei Lippenbekenntnissen zu belassen. Die Infrastruktur selbst, also Bibliotheken, Rechenzentren und Data Center, sind hier offenbar irgendwo in der benannten Dreiergruppe subsumiert, was ein wenig ärgerlich ist, weil sie beim Plattformaufbau und der Koordination von Forschungsdatenprozessen eine erhebliche Rolle spielen.

Allerdings sind ihre Spielräume zugegeben oft begrenzt, wenn es um die Beantwortung der vom Editorial benannten Fragen „Who will pay?“ und „Who will host?“ geht. Die Finanzierung von Diensten ist nur innerhalb des verfügbaren Budgets möglich ob sie sich im Einzelfall als zentrale Hosting-Einrichtung verstehen, hängt auch von den Ressourcen und darüber hinaus vom Leitbild ab.

Bei eDissPlus lernen wir regelmäßig, wie unterschiedlich die Szenarien allein für das Publizieren von dissertationsspezifischen Forschungsdaten sind. Hier für alle Fälle eine umfassende Lösung über das lokale Repositorium anzubieten, wird kaum möglich sein. Die Lage könnte sich dann entschärfen, wenn sich die Fachgemeinschaften und im Fall von eDissPlus auch Prüfungsämter auf verbindliche Standards geeinigt haben. Möglicherweise bewegt sich im großen Rahmen der EOSC etwas. Aber bis dahin können auf Seiten der Hochschulinfrastruktur nur sehr grundlegende Dienste etabliert werden. Szenarien, die mehr als diese Basisangebote brauchen, müssen an anderer Stelle adressiert werden.

Und die Finanzierungshürde bleibt, auch wenn die von NATURE beispielhaft angegebenen Kosten für das arXiv von 1,3 Millionen Dollar für 2017 angesichts des Stellenwerts des Servers für die Wissenschaftslandschaft nicht grundweg schockieren. Doch selbst solche Summen muss man zunächst einmal auftreiben. Die technologische Wartung und Enwicklung bleiben genauso Kostenfaktor wie die inhaltliche im Sinne der Sicherung der Datenintegrität, des Kuratierens und Auffindbarhaltens und selbstverständlich auch der Langzeitarchivierung. Digitale Infrastrukturen sind bekanntlich Systeme im permanenten Fluss, die über ihre Betriebszeit nicht zwangsläufig günstiger werden. Oft eher im Gegenteil.

Das wird bisweilen übersehen, wenn man argumentiert, dass die Versorgungslücke der Forschungsdateninfrastruktur über die institutionellen Repositorien von Hochschulen geschlossen werden könnte. Das NATURE Editorial kritisiert diesen Punkt berechtigt und weist darauf hin, dass diese Landschaft eher „patchy“ sei. Wie gut die individuellen Forschenden in Richtung Data-Sharing unterwegs sein können, hinge demzufolge von der jeweiligen Ausstattung und Schwerpunktsetzung der Einrichtung ab. Dies wird weder den Ansprüchen der Wissenschaftspraxis noch dem allerorten geäußerten Wunsch nach Standardisierung gerecht. Wo Forschungsdatenpolicies bewusst schmal gehalten werden müssen, weil das Repositorium bzw. seine Betreiberinstitution es sich schlichtweg nicht leisten kann, offene und längerfristige Garantien anzubieten, werden die Bedürfnisse der Wissenschaft, die oft genau dies von den Forschungsdaten- und Publikationsinfrastrukturen erwarten, kaum zureichend aufzufangen sein.

Kommerzielle Plattformen sind teilweise eine Art Alternative, aber nicht für jeden. Neben persönlichen wissenschaftsethischen Hemmungen spielt vor allem eine Rolle, dass ihre Nutzung von bestimmten Förderpolicies untersagt wird. Und auch hier sind wirkliche Langzeitperspektiven kaum verbindlich abzusichern.

Angesichts dessen lässt sich schwer widersprechen, wenn das NATURE Editorial verkündet: „For too long, public discussions have overlooked the true costs of data openness.“ Beziehungsweise ist es kaum möglich, tragfähige Lösungen zu finden, weshalb man auf Podiumsdiskussionen, rhetorisch nicht unbedingt ungeschickt, den Schwerpunkt der Debatte gern von diesem Problemthema weg und hin zum viel angenehmeren Thema der Open Science als Ideal verschob und verschiebt. Die Verantwortung hier auf die Forschenden und ihre Wissenschaftsgemeinschaften zu verlagern wird aber vermutlich nicht in erstklassige Angebote für das Publizieren und Vorhalten von Forschungsdaten führen. Auch wenn eine sehr großer Teil der Forschendenen Sympathien für Open-Science-Entwicklungen hegt, tut er dies nicht um jeden Preis. Und man muss auch zur Kenntnis nehmen, dass Wissenschaft lange Zeit Erkenntnis erfolgreich auch ohne offene Forschungsdatenrepositorien zu produzieren verstand. Will man weitreichend auf Open Research Data und Nachnutzungsmöglichkeiten umstellen, muss der Rahmen auch stimmen.

Ein weiteres Problem konkret für NATURE aber sicher auch für die offene Wissenschaft selbst sind die Embargokonventionen einzelner Disziplinen, die einer aufsatzbegleitenden Publikation von Forschungsdaten offenbar häufig entgegen stehen. NATURE möchte naturgemäß, dass Daten sofort publiziert werden. Wir wissen jedoch unter anderem ebenfalls aus den Erfahrungen von eDissPlus, dass es zahlreiche Gründe gibt, warum Forschende ein Embargo oder eine bestenfalls selektive Weitergabe auf Anfrage wünschen. Einige Gründe sind nachvollziehbarer als andere. Die Daten vor einer möglichen Forschungsdkonkurrenz verbergen zu wollen, ist sicher wissenschaftsnormativ weniger statthaft, als Gründe des Datenschutzes. Wer viel mit sozialwissenschaftlich oder ethnologisch Forschenden spricht, wird dafür sensibler sein, als jemand, der vorwiegend in der Astrophysik unterwegs ist. Aber je relevanter Forschungsdaten auch für die kommerzielle Verwertung werden, wenn beispielweise Klimadaten Investitionsentscheidungen beeinflussen, desto komplexer werden die Fragen, wer, wann welchen Einblick enthalten sollte. Wissenschaft operiert nicht nur im kleinen Kreise der Fachgemeinschaften. So überlegen zum Beispiel Zoologen mittlerweile mindestens doppelt, ob sie die Bewegungsdaten seltener Tiere freigeben und damit möglicherweise Wilderer zur nächsten Beute führen. Insbesondere Open Science und Open Scholarship müssen also ihre Implikationen sowohl hinsichtlich der Chancen als auch der Risiken auch jenseits der intrawissenschaftlichen Interessen mitbedenken.

Wie kompliziert dies ist, zeigt schließlich ein aktueller Leserbrief in NATURE zu den Beschränkungen der Möglichkeiten, Genomdaten der australischen Ureinwohner weiter zu geben. Die Autorinnen und der Autor bemängeln, dass die strengen Vorgaben des Australian Board for Ethical Review einen Zugang zu diesen Daten denkbar erschweren. Sie argumentieren, dass die Schutzfunktion einer zentralen Restriktion, nämlich die Notwendigkeit der individuellen Einwilligung der Genomspender_innen bei jeder Datenweitergabe, zugleich einem möglichem Nutzen im Weg steht. Sie plädieren daher für eine Form des „dynamic consent“, die auf ein einmaliges Opt-in oder Opt-out setzt. Angesichts des zuvor gesagten und etwas, das man vielleicht in Entleihung aus dem Urheberrecht als “unbekannte Nutzungsarten” bezeichnen könnte, kann man natürlich sofort wieder ein Gegenargument zu einem pauschalen Opt-In-Opt-Out-Ansatz finden. Aber die Diskussion sollen und müssen andere führen. Wir können zunächst einmal nur darauf hinweisen, wie kompliziert das Thema der Publikation digitaler Forschungsdaten schnell werden kann.