|
|
|
 |
Ausgehend von einem Beschluß des Präsidiums der Leibniz-Soztietät
vom März 2010 erfolgte mit freundlicher Erlaubnis des trafo
Verlages Dr. Wolfgang Weist eine Aufbereitung der Texte der Bände
50 bis 105 für den Aufbau eines Online-Archivs
der Sitzungsberichte der Leibniz-Sozietät , das über
diese Website seit dem 25. Juni 2010 für jedermann zugänglich
ist. Die Arbeiten wurden mit den jüngeren Bänden begonnen, da
für diese die Ausgangstexte und Abbildungen in einem maschinenlesbaren
Format vorlagen und lediglich die für die Webseite erforderlichen
logischen Verknüpfungen von den jeweiligen Inhaltsverzeichnissen
auf die entsprechenden Inhalte im Format PDF erstellt werden mussten.
Ab Juni 2011 stehen im Archiv ebenfalls die Bände 1 bis 49
zur Verfügung.
Die Bearbeitung dieser Bände weist einige Besonderheiten auf:
Sie wurden aus den eingescannten Druckexemplaren gewonnen.
Dazu mussten die Scanergebnisse mittels Texterkennung (OCR) in maschinen-lesbare
und durchsuchbare Dateien umgewandelt werden. Diese Dateien bestehen aus
zwei übereinander liegenden Schichten - dem eingescannten Abbild
der Druckseiten (quasi einer Fotokopie) und einer darunter liegenden durchsuchbaren
Textdatei.
Anschließend wurden die Dateien für den Einzelzugriff auf die
jeweiligen Artikel strukturiert und in einer für das Speichervolumen
auf dem Server und für den Download vertretbaren Größe
abgelegt. Die auf diese Weise gewonnenen Dateien sind im Durchschnitt
vier- bis fünfmal größer als die Satzdateien der Bände
50 ff.
Die Textschicht konnte aber wegen des damit verbundenen großen Zeitaufwandes
weder kontrolliert noch redigiert werden. Dadurch sind nicht alle Textstellen
exakt kopierbar, insbesondere solche, die auf nichtlateinischen Alphabeten
(z.B. Griechisch, Kyrillisch, Devanagari) basieren. Diese sind nicht durchsuchbar
und können nur als Bild ausgedruckt werden.
Die übrigen PDF-Texte sind durchsuchbar und somit über Suchmaschinen
auswertbar.
Bei der Aufbereitung wurden erkannte Druckfehler stillschweigend berichtigt
sowie einige Anpassungen der Kopfzeilen der Einzelbeiträge an die
derzeit übliche Form vorgenommen. Vakatseiten, die nicht zu den Beiträgen
gehören, wurden nicht mit eingestellt. Die Umschlagseiten wurden
ebenfalls weggelassen, die darauf enthaltenen bibliografischen Angaben
in den Kopf des Inhaltsverzeichnisses des Bandes übernommen.
Da eine solche umfangreiche Textsammlung ganz sicher nicht ohne Fehler
aufbereitet werden kann, ist die Redaktion für entsprechende Hinweise
dankbar (steiger@leibniz-sozietaet.de).
Klaus-Peter Steiger
|