eDissPlus DFG-Projekt: Elektronische Dissertationen Plus

Offene Wissenschaft als Herausforderung

Wenn man sich mit der Frage befasst, wie sich tatsächlich Dienstleistungen von Infrastrukturanbietern wie Universitätsbibliotheken für die offene Wissenschaft (open science, open scholarship) umsetzen lassen, gelangt man relativ schnell an den Punkt, dass Infrastruktur allein nicht ausreicht. Ein aktueller Artikel im Data Science Journal bestätigt dies. Der Autor Jens Klump schreibt in Bezug auf das Teilen von Forschungsdaten:

“Sharing data is not a purely technical issue that can be solved by building research data infrastructures. Over the last decade the development of policies around access to reasearch data has evolved with suprisingly little input from social science studies on this subject.”

Diesen Missstand adressiert er mit seinem Paper Data as Social Capital and the Gift Culture in Research (In: Data Science Journal. 16, p.14. DOI: http://doi.org/10.5334/dsj-2017-014). Auch das eDissPlus-Projekt versucht über das Verfahren qualitativer Interviews Einblicke nicht zuletzt in die wissenschaftssoziologischen Bedingungen zu erhalten, die in unserem Fall konkret beim Publizieren von Forschungsdaten in Dissertationszusammenhängen relevant werden. Was wir dabei feststellen, was auch Jens Klump bestätigt und wofür sich empirisch kaum Gegenbeweise finden lassen, ist, dass ein Anspruch einer möglichst vollumfänglichen offenen Wissenschaft (vgl. dazu auch diesen Beitrag: Drei Gründe für Forschungsdatenpublikationen. Und einige Herausforderungen / 29.09.2016), wie er häufig in einschlägigen Programmen und von Aktivisten im Open-Science-Bereich vertreten wird, an vielen Stellen auch mittelfristig kaum realisierbar sein wird. Eine ausführlicher Auseinandersetzung mit diesem Problem im Anschluss an den Aufsatz von Jens Klump gibt es im LIBREAS-Weblog: Warum die Publikation von Forschungsdaten nach wie vor ein begrenztes Phänomen bleibt. / 05.04.2017. Symptomatisch für die Herausforderung wurde die dort geäußerte Kritik von dem für einen sehr konsequenten Einsatz für Offenheit in der Wissenschaft bekannten Historiker Klaus Graf als zu zögerliche Position interpretiert:

“Ben Kaden gefällt sich einmal mehr darin, gegen allzu viel Offenheit einzutreten”

Das verdeutlicht ein weiteres Mal das Spannungsverhältnis, in dem die konkrete Infrastrukturentwicklung für die offene Wissenschaft zu operieren hat. Auf der einen Seite stehen dogmatische Verteidiger der Werkherrschaft für die Open Access und digitale Medien bereits als Idee wenigstens für die Geisteswissenschaften unsäglich sind (ein typischer Tweet zum Thema). Auf der anderen Seite stehen Open-Access-Vorkämpfer wie Klaus Graf, denen die Entwicklung hin zu radikaler Offenheit nicht konsequent genug umgesetzt wird.

Eine dritte Gruppe und die eigentliche Zielgruppe sind die Wissenschaftler_innen, die von den unerbittlich geführten Diskursschlachten in Social Media, ihren Foren und vor allem auch der Frankfurter Allgemeinen Zeitung nicht unberührt bleiben und das Gefühl haben, sich ständig zu Annahmen positionieren zu müssen, wie, dass die Zukunft der Wissenschaft ausschließlich binär codiert sein wird und das Digitale zugleich unvermeidlich den Abschied vom Medium Buch, wenn nicht gar unserer Vorstellungen von Bildung und Kultur bedeutet.

In der eigenen Wissenschaftspraxis und im Kommunikationsverhalten ihrer Peers erleben sie dagegen, dass sich gar nicht so viel ändert und entsprechend zwischen Behauptungs- bzw. Untergangsdiskurs und der wahrnehmbaren Realität eine erhebliche Lücke existiert. Nach wie vor erscheint ein großer Teil der wissenschaftlichen Kommunikation ganz traditionell. Die meisten E-Publikationen bilden ihre gedruckten Vorbilder, also vor allem den Zeitschriftenaufsatz, nach und lassen bestenfalls hier und da Supplemente zu.

Je mehr man sich auf einer praktischen Ebene und nicht nur auf Twitter ohne in visionären Meinungsbeiträgen und auf Digitalisierungsgipfeln mit der Sachlage befasst, desto deutlicher sieht man die Mühen der Ebenen in der digitalen Wissenschaft und wie viel zum Beispiel bereits gewonnen wäre, wenn es nachhaltig gesicherte und intuitiv zu nutzende Repositorien für Forschungsdaten in allen Disziplinen gäbe. An vielen Stellen ist man gerade erst dabei, Best-Practice-Beispiele umzusetzen. Diese Realität anzunehmen bedeutet keinesfalls, nicht perspektivisch oder sogar visionär zu denken. Aber sie bleibt doch unmittelbare Handlungsrahmen, in den Policies und White Paper übersetzt werden müssen.

Auch die normative Debatte um Offene Wissenschaft ist ohne Frage sehr wichtig, wobei meine empirische Erfahrung aus diversen Interviewreihen bleibt, dass Offenheit an sich für die meisten Wissenschaftlerinnen und Wissenschaftler unkritisch ist. Was sie an der praktischen Ausrichtung ihres Wissenschaftshandeln in diese Richtung hindert, sind (1) ein eventueller zusätzlicher Aufwand, der besonders auch bei Forschungsdatenpublikationen zu erwarten ist, (2) die Befürchtung, dass nicht-traditionelle Publikationen (wozu Open Access dann oft zählt, wenn es nicht ein hochgeranktes Gold-OA-Journal ist) und Publikationsformen (u.a. Weblogs) keinen wissenschaftlichen Reputationsgewinn mit sich bringen und (3), dass sie oft gar nicht wissen, wie man Offene Wissenschaft praktisch angeht. Im Gegensatz zum traditionellen Publizieren ist der entsprechende Kompetenztransfer mittels Lehre und Peer Group nur sehr gering ausgeprägt.

An allen drei Stellen gibt es Baustellen und auf allen drei arbeiten Projekte wie eDissPlus und auch Stammmitarbeiter_innen von Rechenzentren und Bibliotheken mit den ihnen zur Verfügung stehenden Mitteln daran, bestmögliche Bedingungen für die digitale Wissenschaft zu realisieren. Infrastrukturen und Interfaces bemühen sich mehr und mehr um Nutzerfreundlichkeit, aber wo wissenschaftliche Standards hinsichtlich Metadaten oder Nachnutzbarkeit aufrecht erhalten werden sollen, ergibt sich für alle Beteiligten zwangsläufig zusätzlicher Aufwand, der dem oft bemühten Ideal der Google-haftigkeit entgegen steht.

Auf das Reputationssystem der einzelnen Fachkulturen bleibt der Einfluss begrenzt, aber selbstverständlich kann man Reviewing-Formen auch in öffentlich geförderten Publikationsstrukturen aufbauen. Dafür braucht man Partner_innen in den Fachdisziplinen. Es ist ohnehin ein notwendiger Weg, anerkannte und aufgeschlossene Persönlichkeiten aus den Disziplinen als Vermittler_innen bzw. Avantgarde neuer Formen der wissenschaftlichen Kommunikation zu aktivieren. Für die Praxis offener Wissenschaft bedarf es solcher Vorbilder.

Auf Seiten der Infrastruktur benötigt man zudem auf absehbare Zeit und mit wachsendem Anteil Beratungs- und Unterstützungsdienstleistungen zu Aspekten wie Formatstandards und Langzeitverfügbarmachung aber insbesondere auch zu rechtlichen Fragen. Die feuilletongetriebene Verkündung der Urheberenteignung durch Urheberrechtsschranken (Stichwort Publikationsfreiheit.de) erweist sich oft als erstaunlich wirkkräftig und führt dazu, dass man zwar ohne schlechtes Gewissen Sci-Hub zur Literaturversorgung nutzt, anderseits aber darauf besteht, dass die Dissertation ausschließlich gedruckt verfügbar sein wird, damit sie ja nicht eines Tages selbst in einer digitalen Schattenbibliothek landet. Grundkurse in Informationsethik mit Schwerpunkt Wissenschaftsethik sind offensichtlich ein weiteres Desiderat auf dem Weg hin zu Open Science und Scholarship. Folglich bleibt Projekten und Bestrebungen in der Wissenschaftsinfrastruktur gar nichts anderes übrig, als geduldig Stück für Stück in Kooperation mit den Wissenschaftlerinnen und Wissenschaftlern eng abgesteckte Parzellen auf ihre Bedürfnisse vor dem Hintergrund der aktuellen Möglichkeiten und unter Berücksichtigung wissenschafts- und förderpolitischer Vorgaben zu erschließen, immer in der Hoffnung, dass daraus eine Eigendynamik entsteht, die idealerweise über die jeweilige Parzelle hinaus wirkt. Und eines Tages werden dann vermutlich auch eine Reihe von Aspekten aus Open Science und Scholarship wie selbstverständlich Teil der Wissenschaftspraxis sein.

(Berlin, 06. April 2017)

Informationsangebote zum Thema Forschungsdatenmanagement auf Internetseiten deutscher Universitäten. Eine kurze Bestandsaufnahme

(Upadate 11.04.17: Einträge Uni Heidelberg und Uni Kassel angepasst)

Teil des eDissPlus-Projekts ist die Entwicklung und Vermittlung von Informationsangeboten zum Forschungsdatenmanagement. Da sich auch andere Universitäten mit diesem Thema befassen und eigene Informationsangebote bereitstellen, liegt es nah, auch diese zu berücksichtigen. Nachfolgend listen wir daher alle aktuell ermittelbaren Informationsseiten deutscher Universitäten. Die Übersicht erhebt keinerlei Anspruch auf Vollständigkeit, lässt aber erkennen, dass das Thema Forschungsdatenmanagement zwar bei vielen Hochschulen wahrgenommen wird, jedoch längst noch nicht auf der Tagesordnung jeder Universität steht.

Für die Übersicht wurden die Internetauftritte 95 verschiedener Universitäten in Deutschland untersucht. Auf 20 davon fanden sich Informationsangebote zum Thema Forschungsdaten. Gleichwohl kündigen einige Universitäten auf ihren Internetseiten bereits den Aufbau thematisch einschlägiger Informationsangebote an und es ist damit zu rechnen, dass nicht in jedem Fall im Vorfeld eine solche Ankündigung stattfindet. Zusätzlich beschränkte sich die Recherche in den meisten Fällen auf eine kurze Suche mit dem Begriff ‘Forschungsdaten’ über die jeweilige Suchfunktion der Universitäts-Website. Von einem Anspruch auf Repräsentativität muss auch deshalb abgesehen werden - als grobe Bestandsaufnahme und Orientierung ist die entstandene Übersicht jedoch durchaus interessant.

  1. Technische Universität München (Bayern)
    Publikation, Wahl des Datenformats, Forschungsdatenmanagementpläne (kurze Artikel)
    https://www.ub.tum.de/forschungsdatenmanagement

  2. Universität Regensburg (Bayern)
    Forschungsdatenmanagement allgemein, Publikation von FD (kurze Artikel)
    http://www.uni-regensburg.de/bibliothek/elektronisches-publizieren/forschungsdaten/index.html

  3. Eberhard Karls Universität Tübingen (Baden-Württemberg)
    Universität Hohenheim (Baden-Württemberg)
    Universität Heidelberg (Baden-Württemberg)
    Universität Konstanz (Baden-Württemberg)
    allesamt Mitarbeit am Projekt https://www.forschungsdaten.info/

  4. Universität Heidelberg (Baden-Württemberg) Umfangreiche Informationsseite und weiterführende Links zu FD (ebenfalls Mitarbeit am Projekt forschungsdaten.info) http://www.data.uni-heidelberg.de/

  5. Karlsruher Institut für Technologie (Baden-Württemberg)
    Umfangreiche Informationsseite und weiterführende Links zu FD
    (ebenfalls Mitarbeit am Projekt forschungsdaten.info)
    http://www.rdm.kit.edu/

  6. Universität Stuttgart (Baden-Württemberg)
    Unfangreiche Informationsseite zum Planen, Speichern und Teilen/Veröffentlichen von FD
    http://www.ub.uni-stuttgart.de/forschen-publizieren/forschungsdatenmanagement/

  7. Universität Ulm (Baden-Württemberg)
    allgemeine Informationen zu FD (kurze Artikel)
    https://www.uni-ulm.de/einrichtungen/kiz/service-katalog/wid/fdm/forschungsdaten-forschungsdatenmanagement/

  8. Humboldt-Universität zu Berlin (Berlin)
    Umfangreiche Informationsseite zum Thema Forschungsdaten
    https://www.cms.hu-berlin.de/de/dl/dataman

  9. Technische Universität Berlin (Berlin)
    Servicezentrum Forschungsdaten und –publikationen
    (deatillierte Artikel)
    http://www.szf.tu-berlin.de/menue/ueber_das_szf/

  10. Technische Universität Hamburg-Harburg (Hamburg)
    FD allgemein (kurzer Artikel)
    https://www.tub.tuhh.de/publizieren/forschungsdaten/

  11. Technische Universität Darmstadt (Hessen)
    FD allgemein, DMP, Archivierung, Veröffentlichung, Nachnutzung (detaillierte Artikel)
    http://www.ulb.tu-darmstadt.de/service/forschungsdaten/digitale_forschungsdaten_an_der_tu/index.de.jsp

  12. Philipps-Universität Marburg (Hessen)
    FD allgemein, DMP, Archivieren, Veröffentlichen, Metadaten rechtliche Aspekte (detaillierte Artikel)
    http://www.uni-marburg.de/projekte/forschungsdaten

  13. Universität Kassel (Hessen)
    Umfangreiche Informationsseite und weiterführende Links zu FD
    https://www.uni-kassel.de/themen/forschungsdatenmanagement/forschungsdaten.html

  14. RWTH Aachen (Nordrhein-Westfalen)
    FD allgemein (kurze Artikel) und Blog zum Thema FD
    http://www.rwth-aachen.de/cms/root/Forschung/Forschungsdatenmanagement/~hnhg/Forschungsdatenmanagement-an-der-RWTH/
    http://blog.rwth-aachen.de/forschungsdaten/

  15. Universität Bielefeld (Nordrhein-Westfalen)
    Informationsseite zu FD
    https://data.uni-bielefeld.de/en

  16. Westfälische Wilhelms-Universität Münster (Nordrhein-Westfalen)
    Vorgaben, rechtliche Aspekte, DMP, Speichern, Archivieren (kurze Artikel)
    https://www.uni-muenster.de/Forschungsdaten/

  17. Universität Siegen (Nordrhein-Westfalen)
    FD allgemein – Informationsseite mit weiterführenden Angeboten
    https://fdm.zimt.uni-siegen.de/

  18. Technische Universität Dresden (Sachsen)
    Archivieren (detaillierter Artikel)
    https://tu-dresden.de/zih/dienste/service-katalog/arbeitsumgebung/backup_archiv/archivierung_am_zih

  19. Friedrich-Schiller-Universität Jena (Thüringen)
    Handlungsempfehlung zum Forschungsdatenmanagement (PDF Broschüre)
    https://www.hanfried.uni-jena.de/vhbmedia/Hochschulrecht/Spezielles+Hochschulrecht+(FSU+Jena)/Handlungsempfehlung+zum+Forschungsdatenmanagement+der+FSU.pdf

(Marius Ventzke ist Studentischer Mitarbeiter im eDissPlus-Projekt.)

Der Videobeweis in der Wissenschaft. Ein Beitrag in Nature befasst sich mit Publikationserweiterungen zur Qualitätssicherung.

Leicht überarbeitete und erweiterte Nachpublikation dieses Beitrags LIBREAS.Tumblr

Timothy D. Clark (2017): Science, lies and video-taped experiments. In: Nature 542, 139 (09 February 2017) doi:10.1038/542139a

Die Frage, was zukünftige Publikationen (also ”Future Publications”) auszeichnen kann und auszeichnen wird, ist für das Publikationswesen wie auch für Bibliotheken von erheblicher Bedeutung. Das Publikationswesen, also insbesondere Verlage und zunehmend weitere Publikationsdienstleister, suchen nach funktionierenden Geschäftsmodellen im Digitalen. Insbesondere wissenschaftliche Bibliotheken stehen dagegen vor der Aufgabe, ihre Organisation und ihre Dienstleistungen an die jeweils relevanten Medienform der Wissenschaftskommunikation anzupassen. Ein Modell des zukünftigen Publizierens ist das des so genannten Enhanced Publishing (vgl. dazu auch die Materialien des Fu-PusH-Projektes, u.a. dieses Dossier), bei dem ein zentrales Publikationsobjekt, im Normalfall ein Textnarrativ wie zum Beispiel ein wissenschaftlicher Aufsatz, mit weiteren Objekten, z.B. Forschungsdaten (vgl. dazu auch forschungsdaten.org) verknüpft und somit erweitert werden.

Für eDissPlus ist dies besonders relevant, weil es im Projekt bekanntlich um den Umgang von mit Disserationsnarrativen verknüpften Forschungsdaten geht, die unselbstständig publiziert als Supplemente oder als selbstständige, verknüpfte Forschungsdatenpublikationen beispielsweise auf spezialisierten Repositorien vorliegen. Das Konzept der Forschungsdaten ist hierbei durchaus inklusiv und vom jeweiligen Forschungsfeld abhängig. Im Prinzip kann alles, was digital vorliegt und beforscht werden kann, zum Forschungsdatum werden. Eine interessante Erweiterung des Blickes ergibt sich, wenn man Forschungsdaten aus der Warte der Forschungsdokumentation betrachtet. Die Publikation wird dabei zum Mittel, um den Forschungsprozess nachvollziehbar zu machen. An diese Stelle treffen die für die Open Scholarship kennzeichnenden Teilaspekte Open Data und Open Methodology (vgl. dazu Drei Gründe für Forschungsdatenpublikationen, 29.09.2016) aufeinander und vermischen sich unter Umständen.

Eine Perspektive, die gut in diesen Zusammenhang passt, zeichnet Timothy D. Clark in einem Beitrag für die aktuelle Ausgabe von Nature. Ausgangspunkt ist die Wahrnehmung einer doch größeren Zahl von Fällen, in denen wissenschaftliche Ergebnisse unsauber, teils auch per Manipulation von Forschungsdaten erzeugt werden. Aus Gründen der Qualitätskontrolle per Reproduzierbarkeit und zur Sicherung der Forschungstransparenz schlägt er nun eine Art GoPro-isierung der Wissenschaft wenigstens dort vor, wo es möglich ist, nämlich in Wildnis und Labor:

If extreme athletes can use self-mounted cameras to record their wildest adventures during mountaintop blizzards, scientists have little excuse not to record what goes on in lab and field studies.

Die entstehenden Videodaten können wie auch andere Supplemente (weiteres dazu u.a. Forschungsdaten als Supplemente zu Zeitschriftenaufsätzen, 28.07.2016) auf (Medien)Repositorien abgelegt werden. Das bietet sich auf der einen Seite deshalb an, weil Journals für Supplemente häufig eine Maximalgröße vorgeben. Der Autor berichtet von 10-150 MB, was für viele Datenformate ausreicht, für Videodaten aber z.B. dann durchaus knapp bemessen ist. Auf der anderen Seite, nämlich aus der Perspektive des Enhanced Publishing, ist die Publikation auf einem Repositorium auch deshalb vorzuziehen, weil die dort abgelegten Objekte zugleich von mehreren Publikationen referenziert werden können. Auch aus Folgepublikationen kann man ohne Probleme auf diese Daten verweisen. In einer langfristigen Perspektive (oder auch kurzfristigen) können diese Videodaten selbst zu wissenschaftssoziologisch bzw. wissenschaftshistorisch relevanten Forschungsdaten werden.

Schließlich bieten sich Repositorien auch aus der Perspektive offener Forschungsdaten als Publikationsplattformen an. Als Teil einer Zeitschrift und damit oft einer Verlagspublikation sind sie als Supplemente möglicherweise besonders geschützt und können beispielsweise nicht für eine Nachnutzung lizenziert werden. Das vierte Argument für die Wahl eines Repositoriums über die Wahl der Publikation direkt zum Artikel ist das der Auffindbarkeit. Videomaterialien oder auch Forschungsdaten können erfahrungsgemäß bei einer Ablage in einem öffentlichen Repositorium detaillierter erschlossen und damit besser gefunden werden. Wenn es sich um ein Datenrepositorium handelt, unterstützt der Kontext sicher auch die Auffindbarkeit für entsprechend interessierte Zielgruppen.

Wie bei Forschungsdatenpublikation stellt sich auch für dokumentierende Forschungsvideos die Herausforderung bei der Motivation. Das Anfertigen, technische Aufbereiten und Publizieren derartiger Materialien ist fraglos ein erheblicher Zusatzaufwand, den WissenschaftlerInnen vermutlich dann scheuen, wenn er weder gesondert anerkannt wird noch verpflichtend ist. Das weiß auch Timothy D. Clark, der deshalb für Mandate eintritt und entsprechend betont:

The best way to implement these changes is for academic journals to start mandating visual (and audio) evidence to support a submitted paper. As far as I am aware, no journals routinely do this. Journals must also ensure that their stated requirements are adhered to.

Infrastrukturen für digitale Geisteswissenschaften. Eine Anmerkung zu einer aktuellen Forderung des Deutschen Bibliotheksverband e.V.

Der unlängst erschienene Bericht zur Lage der Bibliotheken 2016/17 des Deutschen Bibliotheksverbands e.V. (dbv) enthält erwartungsgemäß eine Vielzahl von interessanten Punkten und Forderungen zur Weiterentwicklung des Bibliothekswesens. Aus unserer Perspektive ist der Anspruch an eine

Nachhaltige Finanzierung für Informationsinfrastrukturen für die Geisteswissenschaften

erwartungsgemäß besonders relevant.

Der Treiber ist an dieser Stelle die Entwicklung der Digital Humanities, die ein wachsendes Bewusstsein für die Rolle von Daten auch in der geisteswissenschaftlichen Forschungspraxis mit sich bringt. Selbst wer nicht digital ediert, Texte statistisch auswertet oder auf Visualisierungen setzt, begegnet dem Konzept der Daten spätestens dann explizit, wenn er digital publiziert und implizit bereits, wenn er/sie eine Internetsuchmaschine oder einen Online-Katalog für die Recherche verwendet.

Da folglich jede digitale Forschungspraxis unweigerlich mit Daten umgehen muss, viele wissenschaftliche Bibliotheken aber traditionell oft immer noch ihren Schwerpunkt in der bibliothekarischen Verwaltung von Medieneinheiten haben, ist es außerordentlich wichtig, eine Öffnung der Bibliotheken und ihrer Dienstleistungen an dieser Stelle nicht nur zu betonen, sondern auch sinnvoll auszugestalten.

Es geht hierbei nicht notwendigerweise um die vollständige Ablösung des Bestandsmodells durch ein Datenvernetzungsmodell. Deutlich ist jedoch, dass die Idee der Bestandsverwaltung viele Bedarfe der digitalen Geisteswissenschaften verfehlt, so dass die Infrastrukturentwicklungen für diese Forschungskulturen nicht selten an den Bibliotheken vorbei laufen oder, wenn es doch einen Bezug gibt, sie innerhalb der Einrichtungen als weitgehend vom Kerngeschäft abzukoppelnde Sonderfälle gelten.

Möglicherweise ist das aktuell noch berechtigt, ist es doch gerade in den Geisteswissenschaften möglich, traditionelle Forschungspraxen weitgehend unbeinträchtigt fortzusetzen. Da die Rolle des Digitalen und damit der Datenorientierung jedoch in allen Wissenschaften perspektivisch an Bedeutung eher gewinnt, braucht es dennoch einerseits entsprechend zugeschnittene Dienstleistungen und andererseits Umsetzungsszenarien für die Einrichtungen. Nicht zu vergessen ist, dass wissenschaftliche Infrastruktureinrichtungen auch eine Verantwortung für eine Art Transformationsmanagement haben, also Entwicklungen und Medienbrüche eben nicht als plötzlich und disruptiv wahrnehmen, sondern sie aktiv mitgestalten und in Rückbindung an den Bedarf ihrer Zielgruppen auch lenken.

Das Papier des dbv skizziert für beide Aspekte - Dienstleistungen und Umsetzungen - kurz konkrete Ansatzpunkte. So leuchtet die Kooperation von Rechenzentren und Bibliotheken unmittelbar ein:

“Rechenzentren bringen Kompetenzen bei der Speicherung von Daten ein, Bibliotheken ihr Know-How beim Nachweis und für die Wiederauffindbarkeit.”

Die komplexen Prozesse der Sammlung (bzw. Harvesting), Speicherung und Langzeitverfügbarhaltung sowie Vermittlung, Aktivierung und Kuratierung von Forschungsdaten sind vermutlich nur auf diese Weise verschränk- und umsetzbar.

Bei den tatsächlichen Dienstleistungen rückt der dbv Aspekte in den Mittelpunkt, die zumindest an der Humboldt-Universität schon angelegt sind und perspektivisch vor dem Hintergrund der in eDissPlus zusammengetragen Aspekte weiter ausgestaltet werden sollen:

  • Unterstützung bei der Erstellung von Datenmanagementplänen
  • Hilfe bei der Auswahl von Fachrepositorien
  • Angebot von Lösungen für die Langzeitarchivierung von Forschungsdaten
  • Unterstützung von Publikationsvorhaben.

Mit dem Anspruch an eine Erweiterung des die Bedürfnisse digitaler Wissenschaft auffangenden bibliothekarischen Dienstleistungsrahmens geht allerdings die Notwendigkeit einer adäquaten Ausstattung sowohl mit technischen Ressourcen und mehr noch mit einschlägig qualifizierten Mitarbeiter/innen einher. Der dbv formuliert entsprechend:

“Investiert werden muss vor allem neben den Grundlagen der Forschungsarbeit in die qualitativ hochwertige Digitalisierung und Retro-Digitalisierung durch Fachpersonal und mit modernster Technik sowie in den Aufbau der nötigen sozialen und technischen Infrastruktur in den Bibliotheken.”

Nach den bisherigen Erfahrungen aus dem Projekt ist der zweite Teil - die soziale und technische Infrastruktur - derzeit ein noch größeres Desiderat als die Digitalisierungsvorhaben.

Innerhalb dieses Bereiches die “soziale Infrastruktur”, was u.a. Ansprechpartner/innen meint, die in der Lage sind, jeweils die fachwissenschaftlichen Ansprüche mit den infrastrukturellen Möglichkeiten zusammenzuführen. In einem erweiterten Szenario ist es durchaus vorstellbar, derart qualifizierte Mitarbeiter/innen als Embedded Librarians weitaus stärker in die konkreten Forschungszusammenhänge einzubinden und sie u.U. sogar bei größeren Forschungsprojekten zum Teil des Projektteams werden zu lassen.

Wie auch immer die Entwicklung aussehen wird, so ist doch deutlich, dass die beobachtbare Schwerpunkterweiterung in den Geisteswissenschaften um datentechnologisch geprägte Forschungsfragen, -ansätze und Methodologien zwangsläufig Verschiebungen im bibliothekarischen Berufsbild und im institutionellen Selbstverständnis nach sich ziehen muss. Dies jedoch ist nur durchsetzbar, wenn entsprechende Angebote in den Betriebs- und Beschäftigungsprofilen der Bibliotheken berücksichtigt werden können. Dazu braucht es, wie der dbv sehr richtig fordert, ein gesamtstaatliches Bekenntnis und einen Willen auf Seiten der Träger, solche Angebote und Entwicklungen langfristig und also nachhaltig abzusichern.

Git und GitHub als Werkzeuge für das Forschungsdatenmanagement

Es könnte durchaus sein, dass wir uns in einer wissengeschichtlichen Rückschau im späteren Fortgang dieses Jahrhunderts weniger an die reputationsfokussierten Social Networks und die Altmetrics-fütternden Kommunikationsplattformen als für die digitale Wissenschaft weichenstellend erinnern und mehr an GitHub. Das scheint deshalb plausibel, da es sich hier nicht um ein reines Addon zur bisherigen Wissenschaftskultur handelt, sondern um ein Konzept, welches direkt in die Forschungspraxis eingreift.

Ein aktueller Artikel in Nature erläutert, warum das so ist. Die Idee von Git stammt aus dem Feld der Programmierung bzw. des Codings. Die Grundidee ist eigentlich nicht mehr als ein Fortschrittsmonitoring von Programmcode inklusive der Aufzeichung der Versionsgeschichte:

large, distributed teams of programmers can work together on a project online, and users can scroll back in time through a file’s version history, seeing each change, when it was made, by whom and for what purpose.

Ähnliches kennt man von der Wikipedia.

Vor einigen Jahren erkannte man, dass sich dieses Verfahren nicht nur zur Organisationen zu Projekten in der Softwareentwicklung sondern auch für bestimmte Forschungsdatenbestände eignet:

GitHub makes most sense for those researchers working with relatively small, text-based data sets that are being actively updated, curated and maintained by groups of scientists[.]

Die Entwicklungsdokumentation von zeilenbasierten Datenstrukturen, seien es nun Programmcode, Texte oder Datenreihen, erfasst präzise Veränderungen, macht diese leicht nachvollziehbar und ermöglicht auch einen direkten Rückgriff auf frühere Versionen. Zudem lassen sich von jedem Projekt Kopien erzeugen, so genannte Gabelungen bzw. Forks, die es ermöglichen, von einer Basis diverse Entwicklungspfade zu verfolgen. Das unterscheidet sich maßgeblich von der oft üblichen Versionierungsvariante, bei der nach einer Änderung jeweils das gesamte Objekt komplett als neue Fassung gespeichert wird und so am Ende eine ganze Reihe von geschlossenen Versionen nebeneinander stehen.

Das Git-Verfahren bietet sich daher aus mindestens zwei Gründen für die Nutzung von zeilenbasierten Forschungsdatensets (beispielsweise bei .csv-Dateien) an:

  • erstens erzeugt es eine eindeutige und transparente Entwicklungsdokumentation,
  • zweitens ermöglicht es sehr einfach und ebenfalls direkt nachvollziehbar die Nachnutzung und eigenständige Weiterentwicklung der Inhalte.

Es überrascht folglich nicht, dass GitHub auch ein Hub des Data Sharings wurde und damit zu einem wichtigen Baustein der offenen Wissenschaft. Der Autor des Nature-Artikels betont entsprechend:

Data sharing is a key requirement of open science, and researchers can share data sets anywhere they wish.

Er weist zugleich darauf hin, dass GitHub primär als Arbeits- und Entwicklungsplattform und nicht als Archiv gedacht ist. Für die Langzeitarchivierung und einen wissenschaftlichen Konventionen folgende Forschungsdatenpublikation (also z.B. mit DOI) können GitHub-Inhalte jedoch zu einschlägig spezialisierten Seiten wie Zenodo oder FigShare als Snapshots exportiert werden. Die Idee von Git als Möglichkeit einer niedrigschwelligen, sehr flexiblen und sehr auf Kollaborativität gerichteten Oberfläche für die wissenschaftliche Arbeit ist naturgemäß nicht an das Startup GitHub, Inc. gebunden, sondern kann, da es sich um freie Software handelt, auch selbstverwaltet benutzt werden. Insofern ist für Infrastrukturanbieter durchaus zu überlegen, ob sie bei entsprechender Nachfrage ein solches Angebot nicht direkt in ihr eigenes Dienstleistungsportfolio aufnehmen.

Jeffrey Perkel: Democratic Databases: Science on Github. In: Nature, Vol 538, 6 October 2016, S. 126-128, doi:10.1038/538127a