Jeremy Kenyon, Nancy Sprague, Edward Flathers: The Journal Article as a Means to Share Data: a Content Analysis of Supplementary Materials from Two Disciplines. In: Journal of Librarianship and Scholarly Communication. 4, p.eP2112. DOI: http://doi.org/10.7710/2162-3309.2112

Auch wenn sich das eDissPlus-Projekt hauptsächlich mit Forschungsdaten befasst, die Dissertationen begleiten, lohnt der Blick darauf, wie Fachgemeinschaften generell in ihren wissenschaftlichen Kommunikationsstrukturen mit solchen Supplementen umgehen. Ein aktueller Artikel von Jeremy Kenyon, Nancy Sprague und Edward Flathers von der University of Idaho liefert einige Ansatzpunkte. Die Autor*innen untersuchten, wie Fachzeitschriften mit solchen so genannten Online Journal Supplements umgehen. Hierbei schließt sich nebenbei der Kreis zu den im Fu-Push-Projekt an der Universitätsbibliothek untersuchten, so genannten Enhanced Publications bzw. Erweiterten Publikationen, allerdings nicht vollständig, ging es in in diesem doch um das geisteswissenschaftliche Publizieren. Der vorliegende Artikel analysiert dagen Zeitschriften aus den Bereichen der Geowissenschaften und der Botanik (Plant Sciences). Insgesamt wurden 15 Titel untersucht.

Interessant ist zunächst die Motivationslage bei der begleitenden Publikation von Daten und ergänzenden Materialien. Weniger als ein durchaus denkbarer intrinsischer Anreiz - beispielsweise aufgrund einer breiteren Überzeugung hinsichtlich der Open Science in Kombination mit passenden Publikationsangeboten durch die Verlage - verweisen Kenyon et al. hauptsächlich auf wissenschaftspolitische Ursachen. Forschungsförderungsinstitutionen legen nicht nur Wert auf Datenmanagementpläne sondern fordern - analog zu Open-Access-Policies - einen öffentlichen Zugang zu Forschungsdaten aus öffentlich geförderten Projekten. Dem begegnen einerseits Zeitschriften - ob proaktiv oder reaktiv erläutert der Text nicht - dadurch, dass sie ebenfalls Supplemente zu den Aufsätzen einfordern und andererseits Institutionen mit der Einrichtung von Datenrepositorien.

Entsprechend aufschlussreich ist der Blick auf den Umgang mit solchen Supplementary Materials bei ausgewählten Zeitschriften aus den genannten Fachbereichen.

Es lassen sich überblickshalber folgene Erkenntnisse festhalten:

  • Zahl der Supplemente pro Artikel: Die Mehrzahl der Artikel mit Supplementen hat ein bis drei Ergänzungsdateien, wobei einzelne Dateien auch mehrere Inhaltsobjekte bündeln können.
  • Code bzw. Scripte werden nur in geringem Umfang geteilt und ließen sich für die Botanik gar nicht nachweisen.
  • Sehr häufig wurden für die Publikation als Supplement aufbereitete Tabellen geteilt.
  • Erschließung: Die Supplemente enthalten insgesamt viel Zusatzmaterial, das jedoch schwer zu finden und in der vorliegenden Form kaum nachnutzbar ist. (So ist die Publikation in PDFs durchaus üblich - vgl. auch Womack, Ryan P. (2015): Research Data in Core Journals in Biology, Chemistry, Mathematics, and Physics. In: PloS one 10 (12), p. e0143460. DOI: http://doi.org/10.1371/journal.pone.0143460.)
  • Datenmengen: Keine der beiden Disziplinen scheint außergewöhnlich große und damit nach aktuellen Bedingungen problematische Datenmengen als Supplemente zu teilen. Im Durchschnitt hatten die Dateien eine Größe von 1,4 MB.
  • Nutzung von Repositorium: Zwei der größten Datensätze wurde auf einem separaten Repositorium abgelegt. Dies ist allerdings ein Sonderfall. Die meisten Materialien werden direkt über die Webseiten der jeweiligen Zeitschriften vermittelt. Kenyon et al. leiten daraus ab, dass Datenrepositorien vor allem als Ergänzung eine Rolle spielen können:
    • „[The] differentiation between the treatment of large and small files may suggest that institutional or disciplinary data repositories could provide a niche service that would complement data sharing through journal supplementary material.“
  • Datenformate: Bei den Formaten wirken weniger fachwissenschaftliche Besonderheiten und mehr die Gepflogenheiten des wissenschaftlichen Schreibens und Publizierens, also mit Textverarbeitungssoftware und Büroanwendungen erstellte Dateien. Dominant sind bei den Supplementen die gängigen Microsoft-Anwendungen (Excel, Powerpoint). Daten, die mit anderen Anwendungen erzeugt werden, werden in einer überwiegenden Zahl der Fälle in diesen Standard-Formaten weiter verarbeitet, also entsprechend für die Publikation als Supplement aufbereitet. Der Vorteil ist die direkte Lesbarkeit durch den Menschen. Als nachteilig erweist sich, dass diese Formate für automatisierte Auswertungen und Indexierungen sowie eine Nachnutzung wenig zu gebrauchen sind.
  • Maschinenlesbarkeit 1: Daten werden also nur selten in maschinenlesbarer Form geteilt.
  • Maschinenlesbarkeit 2: Die Geowissenschaften scheinen der Publikation maschinenlesbarer Formate eher zugeneigt. (Beispiel: GIS-Dateien).

Darauf aufbauend formulieren Kenyon et al. einige Einsichten für Infrastrukturen (Verlage und Herausgeber, Data Manager und Bibliothekar*innen, die sich mit solchen Supplementen befassen):

  • Verlage dürften hinsichtlich der Stabilität ihrer Infrastrukturen keine größeren Probleme haben, da die Supplemente sowohl in Formaten wie auch Größe den Aufsatzpublikationen ähneln. Auch die direkte Einsehbarkeit der Dateien dürfte für die meisten Leser*innen gegeben sein. Disziplinäre Unterschiede spielen keine Rolle.
  • Auch für Bibliotheken und Rechenzentren ist die reine Archivierung und Verfügbarhaltung der Materialien bei den bisherigen Verfahren so keine erhebliche Herausforderung, insbesondere, wenn bereits Hosting-Dienste für Dateien bestehen. Die Herausforderung liegt vielmehr im Bereich der Discoverability der Materialien. Gepackte Inhalte lassen keine Rückschlüsse über die Inhalte zu. Auch die fehlenden Maschinenlesbarkeit wirkt an dieser Stelle als Hürde.
  • Sind also eine gezielte Auffindbarkeit und Nachnutzung das Ziel, müssen weitere bzw. andere Aufbereitungsschritte für die Daten erfolgen. Die Publikationsinfrastrukturen können an dieser Stelle aktiv werden, wenn sie möglichst standardisierte Bedingungen für nachnutzungsfreundliche Formate, Dokumentationen und Datenstrukturen vermitteln. Diese sollten fachgebietsübergreifend gelten.