Forschungsbericht 2006-2007

Komplexe Datenbasen zur Rekonstruktion und Simulation evolutionärere Prozesse I


Ziel dieses Projekts die Etablierung eines interdisziplinären Forschungsverbundes mit dem Thema Berechnung von Verwandtschaft und Abstammung. Beteiligt sind die Disziplinen Linguistik, Korpuslinguistik, Informatik und Bioinformatik. Mit der Etablierung dieses Netz-werkes wollen wir eine Brücke schlagen von den Philologien über die Linguistik und Infor-matik bis hin in die Lebenswissenschaften. Wir verbinden dabei in einer für die aktuelle For-schungslandschaft ungewöhnliche Weise erneut geistes- und naturwissenschaftliche Diszipli-nen, die bezogen auf diese Zielsetzung bereits Anfang des 19. Jahrhunderts erfolgreich zu-sammengearbeitet haben und die nun vor Aufgaben stehen, die eine Erneuerung der Zusam-menarbeit sinnvoll, wenn nicht sogar notwendig erscheinen lassen.

Genau wie die Linguistik/Korpuslinguistik steht auch die Biologie/Bioinformatik vor der Aufgabe, große Mengen von Zeichenketten zu analysieren und zu verarbeiten. Die Zeichen-ketten sind mit Metadaten zu versehen und in Datenbanken abzulegen und einer Vielzahl von Benutzern mit unterschiedlichen Interessen zugänglich zu machen. Während die Bioinforma-tik diese Zeichenketten (genomische DNA) unter anderem mit dem Ziel untersucht, ähnliche Teilzeichenketten zu finden, um beispielsweise die Verwandtschaftsbeziehungen von Genen oder Spezies aufzuklären, analysiert die Linguistik Zeichenketten (Wörter, Sätze und Texte) mit dem sehr ähnlichen Ziel, Verwandtschaft zwischen Sprachen und Transformationsprozes-se von lexikalischen und grammatischen Strukturen (Sprachwandel) zu verstehen. Beide For-schungsgebiete sind heute undenkbar geworden ohne modernste Methoden der Informatik, stellen andererseits die Informatik aber auch vor neue und interessante Fragestellungen, bei-spielsweise im Bereich der Mustersuche in Strings (Bioinformatik) oder des maschinellen Textverstehens (Linguistik).

Die beteiligten Forscher und Forscherinnen sind Experten auf ihren jeweiligen Gebieten. Sie haben sich zusammengefunden bei der Vorbereitung eines bundesweiten interdisziplinären Großprojektes, dessen Ziel es ist, ein historisches Referenzkorpus für das Deutsche aufzubau-en, in dem die Textüberlieferung des Deutschen von ihren Anfängen um 800 bis in die Ge-genwart in digitaler Form erschlossen und unter Einsatz modernster sprachtechnologischer, korpuslinguistischer und informatischer Methoden und Verfahren so aufbereitet werden soll, dass sie einer möglichst breiten Nutzergemeinde zur Verfügung steht. Mit dem Aufbau und der Etablierung eines interdisziplinären Forschungsverbundes sollen die erforderlichen wis-senschaftlichen und wissenschaftlich-methodischen Sondierungen intensiviert, die tragende interdisziplinäre Kooperationsstruktur entwickelt sowie die bestehende erfolgreiche Zusam-menarbeit vertieft und erweitert werden.

Projektleitung:

Prof. Dr. phil. Karin Donhauser
Philosophische Fakultät II
Institut für deutsche Sprache und Linguistik
Geschichte der Deutschen Sprache / Diachronie / Sprachwandel
Tel (030) 2093-
Fax (030)
E-Mail karin.donhauser@rz.hu-berlin.de
Weitere Projektleitungen:

Prof. Dr. Anke Lüdeling, Prof. Dr. Ulf Leser
Laufzeit:

07/2003 - 12/2007
Fördereinrichtung:

Berlin/ Sonstige