Programm | Abstracts | Autoren | Reader | Tagungsbericht

Abstracts

Outils pour la géolinguistique automatisée

Gotzon Aurrekoetxea, UPVEHU / Charles Videgain, UPPA, IKER-CNRS

La géolinguistique a réalisé de grandes avancées durant les dernières décennies, en particulier quant au recours à l'informatique pour aider au traitement et à l'analyse des données linguistiques. Le groupe EUDIA de l'Université du Pays Basque, qui réunit aussi des chercheurs d'autres universités, s'attache à travailler sur cet aspect de la géolinguistique. Le groupe compte sur différents outils pour le traitement de l'information dialectale : il a installé sur le web un convertisseur de textes dialectaux vers une base de données, appelée CORPUSLEM qui à son tour fournit une aide pour la confection de textes dialectaux, une base de données (My SQL), consultable sur le web, un convertisseur de base de données vers des corpus tels que le TEI, un programme de cartographie, un logiciel de dialectométrie, qui fournit un traitement aux réponses et items multiples. Tous ces outils sont disponibles sur le net. L'outil CORPUSLEM (http://aholab.ehu.es/CorpusLem/login. html) fonctionne en basque, espagnol, français, anglais et catalan. Il ouvre deux écrans, l'un servant à l'accès de l'utilisateur avec un mot de passe, et le second à transformer des textes (au format .txt) en base de données (format MySQL), avec des outils de copie de données, élaboration de dictionnaires, etc. La base de données EDAK (actuellement domiciliée à l'adresse http: //aholab.ehu.es/edak/2/) est un outil de gestion des données, au format MySQL, qui supporte lui-même plusieurs bases de données et des modules tels qu'une aide à la lemmatisation des données et un module de conversion à partir du format de la base de données vers le format corpus (TEI). Les données hébergées sont écrites ou audio-visuelles. Enfin l'outil dialectométrique et cartométrique propose divers modules : module de la base de données propre au groupe EDAK, module statistique-cumulatif, et module cartographique. Nous prévoyons l'ouverture d'un module pour un atlas parlant et la possibilité de cartographier des données synthétiques et dialectométriques. Nous pensons qu'avec cet outil, nous proposons aussi une solution au problème des réponses multiples. D'autre part, cet outil permet d'importer des données recueillies par d'autres chercheurs, et ce directement sur son propre ordinateur où chaque chercheur peut élaborer ses propres analyses.

Bibliographie

Aurrekoetxea, G., J. Sánchez & I. Odriozola, 2009, "EDAK : A Corpus to Analyze Linguistic Variation", in P. Cantos Gómez / A. Sánchez Pérez (arg.), 2009, A Survey on Corpus-based Research Panorama de investigaciones basadas en corpus, Asociación Española de Lingüística del Corpus, 489-503.

Aurrekoetxea, G., 2011, "CorpusLem" una herramienta para la conversión de corpus textuales en datos In M.L. Carrió Pastor & M. A. Candel Mora (eds.), Las TIC : Presente y futuro en el análisis de Corpus, Valencia : Universitat Politècnica de València, 611-618.

Aurrekoetxea, G,, K. Fernandez-Aguirre, J. Rubio, J. Sánchez, 2012, " "DiaTech" : A New Tool for Dialectology" (acceptado para su publicacion en Literary and Linguistic Computing) Aurrekoeta eta Aurrekoetxea, Gotzon / K. Fernández, J.A. Rubio, G. Santander, 2012, "Technical features of the DiaTech dialectological tool" (acceptado en el congreso 7th SIDG, Viena 2012).

Zur Dialektometrisierung des ALD-II: erste Erfahrungen

Roland Bauer, Universität Salzburg

Im Zentrum des Vortrags steht der wohl noch im Jahr 2012 erscheinende zweite Teil des dolomitenladinischen Sprachatlasses (ALD-II). Dieser umfasst, aufgeteilt auf fünf großformatige Kartenbände, insgesamt 1 066 Sprachkarten, die den Bereichen Lexikon, Morphologie und Syntax gewidmet sind. Wie bereits für den auf die Phonetik zentrierten ersten Teil des ALD geschehen, sollen nun auch sämtliche auf den ALD-II-Karten publizierten Dialektmaterialien analysiert oder taxiert werden, wobei dieser Taxierungsertrag in eine Datenbank einfließen wird, die ihrerseits die Grundlage für die weitere dialektometrische Bearbeitung darstellt. In diesem Zusammenhang können anhand eines lexikalischen Kleincorpus bereits erste WerkstattErgebnisse in Form ausgewählter Arbeitskarten und provisorischer Ähnlichkeitsprofile gezeigt werden. Die Präsentation stützt sich dabei auf das in Salzburg entwickelte Tool VDM (Visual DialectoMetry).

Die praktische Applikation der für den ALD-II entwickelten EDV-Werkzeuge

Heidemarie Beer / Agnes Staudinger, Universität Salzburg

Beim ALD-II fielen schriftliche (= Transkripte), akustische (= Tonaufnahmen) und bildliche (= ,,Ethnophotographien'') Daten an, die allesamt via EDV für jeweils spezifische Zwecke weiterverarbeitet werden mussten.

Zur Verarbeitung der Transkripte:

Hier ging es um die Ersterfassung und Korrektur der in handschriftlicher Form in Salzburg eintreffenden Transkriptionen, deren nachfolgende Einspeisung in eine passende Datenbank, den sich daran anschließenden Ausdruck von Probekarten sowie um deren in mehreren Stufen erfolgende Korrektur bis hin zur Herstellung der beim Druck eingesetzten PDFs. Damit waren bzw. sind zahlreiche Arbeitsschritte verbunden, die direkt an der Schnittstelle zwischen Philologie und EDV sowie an jener zwischen repetitiver Routine und einzelfallspezifischer Problemlösung liegen.

Zur Verarbeitung der akustischen Daten:

An den 217 Messpunkten des ALD-II fielen durch die Applikation des 1063 z. T. recht komplexe Items umfassenden Fragebuchs ausschließlich digitale Tonaufnahmen an, die in toto mehr als 20 000 Stunden umfassten. Da von Anfang an vorgesehen war, der Fachwelt alle Tonaufnahmen in einer punktgenau konsultierbaren ,,SoundDatenbank" (SDB2) zur Verfügung zu stellen, mussten die vorhandenen Sound-Files im Wege einer ,,intelligenten Abhörarbeit" in mehreren Durchgängen bestmöglich getaggt werden. Erst dadurch konnte die punktgenaue Konsultierbarkeit erreicht werden. Überdies hat angesichts des operativen Erfolgs der SDB2 diese herausfordernde Arbeit unser Team nicht davon abgehalten, unmittelbar nach Fertigstellung der SDB2 die exklusiv in analoger Form vorliegenden Tondaten des ALD-I in ähnlicher Weise mit dem Ziel zu bearbeiten, bis Ende 2012 auch für den ALD-I eine eigene ,,Sound-Datenbank" (SDB1) auf die Beine zu stellen.

Zur Verarbeitung der ethnophotographischen Daten: An den 217 Messpunkten des ALD-Netzes wurden auch beim Projektteil ALDII jeweils 3040 Aufnahmen gemacht, die als wesentlich bzw. charakteristisch anzusehende Aspekte der betreffenden Ortschaft dokumentieren sollten. Zwei Drittel dieser Aufnahmen waren analog, ein Drittel digital realisiert worden. Ende 2011 wurde beschlossen, auch diese visuellen Materialien und zwar sowohl für ALD-II als auch für ALD-I in digitaler Form im Netz allgemein zugänglich zu machen. Dies bedeutete zweierlei: zum einen die Bereitstellung der dafür nötigen DB-spezifischen Einrichtungen (Datenbank, Dia-Scanner etc.) und zum anderen die Einrichtung einer möglichst rationell bedienbaren Arbeitsschiene zur Digitalisierung der mehr als 10 000 analogen Diapositive. Dazu kommt das nachträgliche Grob-Tagging der Gesamtheit der rund 17 000 ethnophotographischen Dias von ALD-I und ALD-II.

Ziel unseres Referats ist es, möglichst realistische Einblicke in die auf diesen drei Gebieten geleisteten Arbeiten zu geben, die zwar hauptsächlich am ALD-Archiv der Universität Salzburg, daneben aber auch an verschiedenen Orten Italiens unter Beteiligung externer Mitarbeiterinnen verrichtet wurden.

The Multimedia Prosodic Atlas of Romania

Anca-Diana Bibiri, Oana Panaite, Adrian Turcule Social Human Interdisciplinary Research Department 'Alexandru Ioan Cuza' University of Iassy

The Multimedia Atlas of Romania (AMPRom) is a last generation atlas combining principles of geolinguistics with techniques specific to instrumental phonetics and to computer sciences, following the scientific and methodological approach used by AMPER (L'Atlas Multimédia Prosodique de l'Espace Roman). AMPRom is conceived as an interactive database which will integrate collected and acoustically processed data regarding prosodic features of linguistic varieties specific to the Romanian language. The objective of the atlas is the documentation of geoprosodic variation of the Romanian language both at the level of dialects and idioms and at the level of colloquial literary language, which will enable the achievement of an intonative typology of the varieties of Romanian language.

The objective of the atlas is the documentation of geoprosodic variation of the Romanian language both at the level of dialects and idioms and at the level of colloquial literary language, which will enable the achievement of an intonative typology of the varieties of Romanian language.

Le projet Atlas Multimédia Prosodique de l'Espace Roman (AMPER)

Antonio Romano** / (Michel Contini* / Paolo Mairano* / Jean-Pierreq Lai*) *Laboratoire Gipsa-lab UMR 5216, Université de Grenoble / ** Facoltà di Lingue e Letterature Straniere dell'Università degli Studi di Torino

Le projet Amper lancé il y a près de dix ans grosso modo, se veut une exploration des phénomènes intonatifs des parlers romans, plus exactement, la comparaison entre les structures intonationnelles des différentes variétés romanes. Il part d'un état des lieux qui fait apparaître qu'aucune étude prosodique est comparable à une autre, d'où l'idée innovatrice d'établir une méthodologie commune et unitaire.

Plusieurs pays sont entrés dans notre projet : l'Italie, l'Espagne, le Portugal, la Roumanie, des comités nationaux ont été créés avec des aires autonomes (Galice, Catalogne, Asturies), et depuis 2004 les pays d'Amérique latine se sont joints aussi à Amper, il s'agit du Brésil, du Venezuela, du Chili, de l'Argentine, de Cuba, du Costa Rica, de la Bolivie, du Mexique. Les objectifs du projet Amper sont tout d'abord le fait d'établir une analyse contrastive et une connaissance des règles de structuration prosodique des aires dialectales romanes.

Au-delà de l'espace dialectal, le but est aussi d'exploiter les variétés régionales des langues nationales. Evidemment l'objectif essentiel étant la création d'une base de données sur Internet, ce qui permettra de vérifier auditivement et visuellement par le biais de graphiques les différentes stratégies rythmico-mélodiques dans l'espace roman. De plus on pourra également relever les segments porteurs d'informations prosodiques.

La méthodologie s'appuie sur une structure syntaxique unique de type SVO qui est commune à toutes les variétés romanes, même si on sait très bien qu'elle n'est pas la plus employée, mais elle existe. A cette structure de base vient s'ajouter une expansion, à droite puis à gauche du verbe. Tous les types accentuels sont pris en compte, avec si possible des mots trisyllabiques. On emploiera un homme et une femme. Chaque énoncé sera demandé en modalité déclarative et interrogative et il sera répété trois fois, afin d'obtenir une moyenne exploitable.

On utilisera un corpus semi dirigé et un corpus libre afin de vérifier les courbes mélodiques issues de la structure de notre corpus sur du parler spontané. Pour la restitution d'un corpus ad hoc de manière la plus naturelle possible, nous mettons en place toute une stratégie d'élicitation du corpus. A ce jour Amper représente près de 150 chercheurs de 33 universités, plus de 200 articles et 7 ouvrages y ont été consacrés.

ONDa, eine GIS-Anwendung zur onomastischen Kartographie

Alois Dicklberger, Universität Passau

In der Ortsnamenforschung ist es seit langem üblich, die geographische Verteilung von Namenstypen oder die urkundliche Erstbelegung von Ortsnamen auf Karten darzustellen. Auch historische, geomorphologische oder topographischen Karten sind hin und wieder den Fachpublikationen beigegeben.

Die Zusammenschau unterschiedlichster Phänomene mit geographischer Ausdehnung findet bei dieser Methode jedoch im Kopf Rezipienten statt, indem dieser von einer Karte zur anderen blättert und die verschiedenen Karten zusammendenkt.

Die am Lehrstuhl für deutsche Sprachwissenschaft an der Universität Passau im Rahmen eines EU-Projekts entwickelte WebGISAnwendung soll dem Leser Phänomene sichtbar machen, die bisher - wenn überhaupt - nur vom sehr geübten und erfahrenen Namenforscher erkannt werden konnten.

Die in der GIS-Datenbank gespeicherten eigenen Daten können mit GIS-Daten anderer Institutionen kombiniert und verglichen werden, womit vielschichtige, für die Ortsnamenbildung potentiell relevante Erscheinungen dem Benutzer sichtbar werden.

Darüber hinaus hat der Benutzer Zugang zu Urkunden der historischen Belege, Hörproben der Mundartbelege, Photographien der Orte und nicht zuletzt zu sprachhistorisch fundierten Erklärungen der Ortsnamen.

Im fertig ausgebauten System wird der Leser in der Lage sein, sich selbst Karten zur Verteilung aller relevanten Ortsnamentypen im slavisch-germanischen Kontaktraum zu erstellen.

L'atlas linguistique audiovisuel et les défis du

Federica Diémoz / Andres Kristol, Université de Neuchâtel (Suisse)

L'Atlas linguistique audiovisuel du francoprovençal valaisan (ALAVAL), en voie d'élaboration au Centre de dialectologie de l'Université de Neuchâtel (Suisse), est axé sur des questions de morphologie et de syntaxe, les domaines les moins étudiés de la linguistique francoprovençale. Il s'appuie sur des données dialectales recueillies par un questionnaire et des conversations dirigées qui laissaient une grande liberté aux témoins dans leur manière de formuler leurs énoncés ; la totalité de nos enquêtes a été enregistrée par caméra vidéo (trois à cinq heures d'enregistrements par témoin).

Le questionnaire utilisé était construit sur le principe de la redondance : l'analyse linguistique repose non pas sur des énoncés «types», mais sur de nombreuses occurrences du même phénomène. L'ALAVAL est ainsi en mesure de documenter l'importante variation interne qui caractérise les parlers francoprovençaux et vraisemblablement toutes les langues vivantes faiblement normées : un même témoin a souvent produit trois ou quatre formes alternatives d'une même forme verbale, d'un même pronom clitique, et de nombreuses allomorphies pragmatiques, alors que les relations entre enquêteurs et informateurs sont restés relativement stables pendant toute la durée de l'enquête.

La nature de nos données énoncés complets, intégralement conservés et accessibles aux utilisateurs de l'atlas, sous forme de clips vidéo transcrits et traduits nous a obligés à trouver des solutions innovatrices dans l'analyse et dans la représentation cartographique. Dans notre communication, nous discuterons les difficultés résultant du polymorphisme intrinsèque de nos données, et les solutions adoptées : comment cartographier par exemple l'expression du sujet indéterminé dans une langue où une demi-douzaine de tournures alternatives sont en concurrence, tout en garantissant la lisibilité des cartes à l'écran de l'ordinateur, et ceci même pour des utilisateurs daltoniens ?

Une page «modèle» très simple de l'ALAVAL peut être consultée sur le site internet du Centre de dialectologie de l'Université de Neuchâtel [http://www2.unine.ch/dialectologie/page-8174.html] ; la totalité des données (80 cartes actuellement disponibles) est trop volumineuse (plus de 25 GO) pour être aisément consultée en ligne. Nous en prévoyons une publication sur clé USB, accompagnée d'un volume de commentaires.

Zur Erhebung und kartographischen Darstellung von Daten zur deutschen Alltagssprache online Möglichkeiten und Grenzen / Collecting and presenting data on colloquial German online

Stephan Elspaß, Universität Salzburg / Robert Möller, Université de Liège

Seit jeher ist das ,Vor-Augen-Führen` von arealen Sprachverhältnissen in Karten Darstellungsmittel und die linguistische Untersuchung solcher Karten Gegenstand sprachgeographischer Forschung. Seit Beginn der ersten großen Sprachatlasprojekte zum Deutschen haben sich freilich die Varietätenverhältnisse in den meisten deutschsprachigen Gebieten vollkommen gewandelt und damit auch die zu erhebenden und darzustellenden Gegenstände. Auch wenn sich die Methodik im Grundsatz relativ wenig geändert hat, so eröffnen die Weiterentwicklung und Verbreitung der ,neuen Medien` doch für die Sprachgeographie völlig neue Möglichkeiten der indirekten Erhebung (per Online-Fragebogen), der technischen bzw. rechnerischen Verarbeitung (z. B. mit dialektometrischen Verfahren) sowie der Präsentation (Online-Karten) areal verbreiteter Sprachdaten. Im Vortrag werden Verfahren und Teilergebnisse des Projekts ,,Atlas zur deutschen Alltagssprache (AdA)" vorgestellt, das seit etwa zehn Jahren das Internet zum einen als Befragungsinstrument nutzt und es zum anderen als Raum für die kostenlose und frei verfügbare Präsentation von über 300 Sprachkarten zur Verbreitung arealer Varianten in nähesprachlichen Registern des Deutschen dient. Der Atlas wird inzwischen nicht nur von Laien, sondern auch in der sprachgermanistischen Lehre und Forschung rege genutzt (vgl. http://www.atlas-alltagssprache.de).

Der Einsatz der EDV beim ALD (,,Atlant linguistich dl ladin dolomitich y di dialec vejins''): 1985-2012

Hans Goebl / Bernhard Schauer, Universität Salzburg

Das Gesamtprojekt ALD besteht aus zwei Teilen (ALD-I und ALDII), bei denen der jeweils letzte Stand der EDV-Technik zur Erreichung der speziellen Publikationsziele eingesetzt wurde.

Beim ALD-I (1985-1998) kam es zur Entwicklung einerseits eines Daten-Erfassungs- und Karten-Generierungs-Programms CARD und andererseits des ,,Sprechenden Sprachatlasses", der zuletzt als DVD und als netzbasierte Version zur Verfügung stand. Während mit CARD alle Agenden der Erfassung, Bearbeitung und Publikation der Transkriptions-Daten bestritten werden konnten, war die Funktionalität des ,,Sprechenden" sehr fokussiert: es ging dabei darum, dem Benützer des ALD-I für den engeren Bereich der Dolomitenladinia maßgeschneidert erhobene mündliche Daten zur besseren Einschätzung der auf den 884 Karten des ALD-I sichtbaren Transkriptionen zu bieten. Heute ist die DVD-Version des ,,Sprechenden", die in den 90er Jahren noch eine weltweite Pionierleistung war, in die Jahre gekommen: sie muß an die neusten EDV-Standards angepaßt werden, um wieder lauffähig zu werden.

Beim ALD-II (1999-2012) konnte das von Edgar Haimerl geschaffene Programm CARD nicht mehr verwendet werden. Es wurde von ihm durch das Programm DMG (,,Dialect MapGenerator'') ersetzt, dessen Finalitäten erneut auf die Erfassung, Bearbeitung und Publikation der Transkriptions-Daten ausgerichtet waren. Während beim ALD-I nur gedruckte Indizes zur Verfügung standen und die CD-ROM's der Daten letztendlich nur von EDV-Spezialisten bedient werden konnten, wurde beim ALD-II der gesamte Such- und Retrieval-Komplex in das Netz verlagert. Dort findet man heute eine sehr potente Suchmaschine (,,Index Retrieval System", IRS2), die die völlig freie Navigation in den Transkriptions-Daten des ALD-II gestattet.

Hinsichtlich der EDV-technischen Erfassung aller beim ALD-II im Feld gemachten Aufnahmen wurde seit 1999 darauf hingearbeitet, ein akustisches Tool (,,Sound-Datenbank", SDB2) zu schaffen, das es gestattet, durch die Eingabe zweier Ziffern (Nummer des Ortspunkts: zwischen 1 und 217; Nummer der Frage: zwischen 1 und 1063) blitzschnell zur originalen Abfragesituation vorstoßen zu können.

Durch den guten Erfolg von IRS2 und SDB2 ermutigt, hat die Mannschaft des ALD-II beschlossen, völlig analoge Tools für die noch erhaltenen Transkriptions- und Schalldaten des ALD-I zu erstellen. Es steht zu erwarten, daß gegen Ende des Jahres 2012 auf die Gesamtdaten der beiden Teile des ALD in völlig analoger Weise zugegriffen werden kann: mit Hilfe des Druckwerks (zwei mal sieben Bände) sowie über speziell gestaltete Homepages mittels IRS1, IRS2, SDB1 und SDB2. Dazu kämen ein völlig neu gestalteter ,,Sprechender" zum ALD-I und eine umfangreiche Datenbank mit mehr als 20 000 in elektronischer Form vorliegenden Diapositiven (,,Ethnophotographie'') zu ALD-I und ALD-II.

A New Website Design for Mapping Dialectal Variation: Functionality, Research Applications, and

Paul Heggarty / Jakob Runge, Dept of Linguistics, MPI for Evolutionary Anthropology, Leipzig

We present a new website design to host maps of `instant playback' recordings of variation in phonetics across the regional dialectal/accent diversity within any given language family (applied so far to Quechua, Aymara, accents of English, Germanic, and Slav languages). The intention is to make extensive dialectal databases available in ways that not only are user-friendly for the general public, but also offer powerful functions for linguist researchers. We focus on illustrating facilities for each of the following.

Searching and filtering the databases by `regular expression', e.g. to isolate all cases of particular ipa symbols in all transcriptions for any selected language (e.g. all words that include `dark l' [ë] in RP English).

Selecting preferred subsets of the language varieties covered, for closer side-by-side comparison.

Ensuring full functionality for touch-screen devices. Overcoming browser differences and incompatibilities. Enabling the entire website interface to be translated remotely into any other language variety.

Our web interface is part of a larger research project in which the recordings and transcriptions also form the input to a new approach to dialectometry in phonetics. The aim is to provide further perspectives on the internal classification of language families, which often emerge as complexes of both branching splits (as per the traditional `family tree' vision) and more network-like dialect continua. This in turn entails implications for how we might best interpret the (pre)historical contexts that impacted on speaker populations, to shape how their dialectal differences came to crystallise.

Finally, we mention an `outreach' application of our comparative websites. This project originally arose in order to disseminate linguistic research findings to speakers of the Quechua languages themselves, and thus to raise public awareness of dialectal diversity amongst them. One particular intention was to explain the logic of the compromise official spelling system for Southern Quechua, and thus support its take-up, to help indigenous language literacy in Peru and Bolivia.

GeoLing2.0 - Aktuelle Projekte zur webbasierten

Thomas Krefeld / Stephan Lücke, Ludwig-Maximilians-Universität (LMU) München

Vorgestellt werden die folgenden vier Projekte: 1. Atlante sintattico della Calabria (AsiCa; http://www.asica.gwi.uni-muenchen.de/index.php); 2. Audio-Atlas siebenbürgisch-sächsischer Dialekte (ASD; http://www.asd.gwi.uni-muenchen.de/); 3. Atlante linguistico digitale dell'Italia e della Svizzera meridionale (AdIS; http://www.adis.gwi.uni-muenchen.de/AIS.php); 4. Metropolitalia http://www.metropolitalia.org/. Diese sehr unterschiedlich fortgeschrittenen Unternehmungen haben zwar jeweils eigene Zielsetzungen; ihnen allen liegt jedoch eine gemeinsame Konzeption digitaler Sprachgeographie zu Grunde, deren wissenschaftliche und technische Prinzipien im Vortrag entwickelt werden.

Il progetto @lant!

Fabio D'Agostini, Ludwig-Maximiliams-Universität, München / Luca Melchior, Karl-Franzens-Universität, Graz

Con @lant! (http://www.atlant-furlan.org/) si desidera inaugurare un nuovo progetto di atlante linguistico del friulano e delle sue varietà. Nato dalla collaborazione tra linguisti e informatici esso si propone di applicare le nuove tecnologie sia nel processo di raccolta dati che in fase di loro rappresentazione e di accesso. A differenza dei "classici" atlanti linguistici cartacei tra i quali l'ASLEF Atlante storico linguistico etnografico del Friuli rappresenta uno splendido esempio dedicato proprio al friulano, ma a differenza anche di progetti di geolinguistica digitale, come lo Sprachatlas des Dolomitenladinischen und angrenzender Dialekte, 1. Teil ("Sprechender") (ALD-I, http://ald.sbg.ac.at/ald/ald-i/), l'Atlante Sintattico della Calabria (ASiCA, http://www.asica.gwi.uni-muenchen. de/), il Vivaio Acustico delle Lingue e dei Dialetti d'Italia (VIVALDI, http://www2.hu-berlin.de/vivaldi/), l'Atlante Sintattico d'Italia (ASIt, http://asis-cnr.unipd.it/) o, per guardare fuori dai confini della Romània, il cosidetto Sprechender Sprachatlas von Bayern (http://sprachatlas.bayerische-landesbibliothekonline.de/).

@lant! si propone di utilizzare le nuove tecnologie non solo per la rappresentazione cartografica e per la messa a disposizione dei dati, bensì anche in fase di raccolta degli stessi, ribaltando la prospettiva: non è più il raccoglitore ad andare dagli informanti con il suo catalogo di domande, bensì il parlante ha a sua disposizione una piattaforma mediale in cui può sia rispondere ai quesiti scientifici specifici proposti dal linguista, sia proporre a sua volta elementi che ritenga interessanti. Si intende in tal modo coniugare l'approccio semicollaborativo, già esperimentato nella lessicografia (cf. Melchior 2009, 2012 Melchior/D'Agostini 2011, per altri ambiti della linguistica cf. Krefeld 2011) con il principio della science4fun, coinvolgendo in modo attivo l'informante, che non è più passivo fornitore di dati, ma attivo collaboratore della ricerca. Il progetto persegue diversi interessi, situati in vari ambiti della linguistica: da una parte vi è il classico interesse geolinguistico, nell'ambito del quale si desidera indagare la variazione dal punto di vista fonetico-fonologico, morfologico, sintattico e lessicale nello spazio linguistico friulano; d'altra parte vi sono aspetti più prettamente lessicologico-lessicografici, che saranno indagati nella prima fase del progetto, durante la quale si desidera raccogliere soprattutto espressioni idiomatiche e fraseologismi a fini lessicografici; da ultimo vi sono anche aspetti di stampo più sociolinguistico, come per esempio la diffusione della conoscenza della grafia ufficiale del friulano e il rapporto fonia/grafia. Durante l'intervento si presenteranno le linee su cui si svilupperà il progetto, i presupposti tecnici e scientifici e gli auspicati prossimi passi.

Bibliografia

Krefeld, Thomas (2011): "La raccolta di dati linguistici ai tempi dei nuovi media", in: Gruppo di ricerca dell'Atlante Linguistico della Sicilia (ed.): Per i linguisti del nuovo millennio. Scritti in onore di Giovanni Ruffino, Palermo: Sellerio, 111-114.

Melchior, Luca (2009): "'Frocio', `checca', `morosa' e... un problema lessicografico", in: Italienisch 62, 67-88.

Melchior, Luca (2012): "Halbkollaborativität und Online-Lexikographie. Ansätze und Überlegungen zu Wörterbuchredaktion und Wörterbuchforschung am Beispiel LEO DeutschItalienisch", in: Lexicographica 28 (in stampa).

Melchior, Luca / D'Agostini, Fabio (2011): "Halbkollaborative Wörterbücher Zur Darstellung von Perzeptionsdaten in bilingualen Wörterbüchern", in: Kittler, Judith / Nickenig, Annika / Siebenborn, Eva / del Valle, Victoria (edd.): Repräsentationsformen von Wissen. Beiträge zum XXVI. Forum Junge Romanistik in Bochum (26.-29. Mai 2010), München: Martin Meidenbauer Verlag [=Forum Junge Romanistik 17], 249-273.

A Curated Database for Linguistic Research: The Test Case of Cimbrian Varieties

Stefan Rabanus/Giorgio Maria di Nunzio

In this paper we present the definition of a conceptual approach for the information space entailed by a multidisciplinary and collaborative project, "Cimbrian as a test case for synchronic and diachronic language variation", which provides linguists with a test bed for formal hypotheses concerning human language. Aims of the project are to collect, digitize and tag linguistic data from the German variety of Cimbrian - spoken in three areas of northern Italy: Giazza (VR), Luserna (TN), and Roana (VI) - and to make available on-line a valuable and innovative linguistic resource for the in-depth study of Cimbrian.

Cimbrian is of great interest to three important lines of research in linguistics:

Romance dialectology: linguistic contact phenomena are visible especially at the lexical level,
German dialectology: the language island varieties exhibit a high level of preservation of certain structural characteristics, and
Historical linguistics: the diachronic development of a variety in isolation shows a particularly interesting mixture of preservation and innovation.

In contrast to many other German dialects Cimbrian has a long tradition as written language (first attestation: early 17th century). This enables the reconstruction of language change for at least four empirically attested stages:

1602, "Christlike unt korze Dottrina";
1844, "Novena vun unzar liben Vraun";
1942, "Taut6. Puox tze Lirnan Reidan un Scraiban iz Gareida on Lietzan";
2009/2010, own fieldwork.

The task is addressed by a multidisciplinary team of linguists and computer scientists who, combining their competence, aim to make available new tools for linguistic analysis. The system provides a Graphical User Interface for both classifying/tagging and searching the data. In addition, the search results can be displayed on maps.

Razones históricas en la mezcla prosódica del catalán

Paolo Roseano, Universitat de Barcelona; Universitat Pompeu Fabra / Ana Maria Fernández Planas, Universitat de Barcelona / Eugenio Martínez Celdrán, Universitat de Barcelona / Lourdes Romera Barrios, Universitat de Barcelona

En los últimos años, los efectos del contacto de lenguas en la prosodia han recibido una atención cada vez mayor aunque la literatura sobre el tema sigue siendo limitada, salvo en cuestiones de L2 en adultos. Por otro lado, aunque las descripciones geoprosódicas de algunas variedades están bien desarrolladas (entre otros, Martínez Celdrán y Fernández Planas, 2003; Prieto & Cabré, 2007-2012; Prieto & Roseano, 2009-2010), la dialectometría (Goebl, 1981) de los datos entonativos está en una etapa muy incipiente (Fernández Planas et al., 2012). Este trabajo se inserta en el marco del Atlas Multimedia de Prosodia del Espacio Románico (AMPER) (Contini y Romano, 2003) y presenta los resultados de las consecuencias en la prosodia de siete siglos de contacto lingüístico en L'Alguer (un pueblo de habla catalana en Cerdeña).

La entonación de frases enunciativas e interrogativas pragmáticamente neutras del alguerés se compara con la de otras variedades del catalán (Barcelona, Lleida, Girona, Sant Josep de sa Talaia, Valencia, Tortosa, Castellón de la Plana, Novelda, Palma y Maó), con la de las variedades de otras lenguas habladas en Cerdeña (sardo logudorés de Biddanoa e italiano regional de Porto Torres), y con la entonación de dos variedades continentales toscanas de Italia (Siena y Firenze). Además, en el estudio comparativo se han tenido en cuenta los datos de otras áreas lingüísticas románicas (Agrons y Beivars para friulano, La Laguna y Oviedo para el español). El corpus incluye 2.808 frases pronunciadas por 37 informantes de 18 localidades. El estudio se lleva a cabo por medio de dos aplicaciones dialectométricas basadas en el EMD. La primera aplicación, que se llama Stat-Distances (Rilliard y Lai, 2008) tiene un enfoque fonético y calcula las distancias interdialectales basándose en 33 valores de F0 y 11 de intensidad para cada frase. Con la segunda aplicación, Gabmap (Nerbonne et al, 2011), se han calculado las distancias a partir de un etiquetado fonológico automático realizado con la aplicación AmperEti (Roseano et al, en prensa). Los resultados muestran una proximidad prosódica entre las variedades romances habladas en Cerdeña, a pesar de su pertenencia a tres lenguas diferentes. Las variedades de catalán e italiano en Cerdeña están más cerca entre sí, y más cerca del sardo, que de otros dialectos catalanes e italianos. Sugerimos que los rasgos prosódicos comunes a las tres variedades romances habladas en Cerdeña históricamente se derivan de un sustrato sardo que transmitió sus características prosódicas a las lenguas superpuestas. Esto es coherente con el hecho de que varios aspectos segmentales de alguerés catalán y del italiano de Cerdeña tienen su origen en dicho sustrato (Bosch, 2002). Concluimos: a) que un contacto intensivo entre lenguas puede provocar mezclas en la entonación (lo que puede provocar un cambio diacrónico en la lengua de destino); y b) la dialectometría puede aplicarse con éxito a los estudios de entonación.

References

Bosch, A. (2002): El català de l'Alguer. Publicacions de l'Abadia de Montserrat, Barcelona.

Contini, M. & Romano, A. (coords.) (2003): Atlas Multimédia de la Prosodie de l'Espace Roman, http://amper.limsi.fr/

Fernández Planas, A.M.; Roseano, P.; Martínez Celdrán. E. & Romera Barrios, L. (2012): Un estudio dialectométrico sobre la prosodia del catalán en las Illes Balears respecto a otros puntos del dominio lingüístico. Presentation at the X Congreso Internacional de Lingüística General, Zaragoza 18-20 April 2012.

Goebl, H. (1981): "Eléments d'analyse dialectométrique (avec application à l'AIS)", RLR 45, pp. 349-420.

Martínez Celdrán E. & Fernández Planas A.M. (coords.) (2003): AMPERCAT http://www.ub.edu/labfon/amper/cast/index _ampercat.html

Nerbonne, J.; Colen, R.; Gooskens, C.; Kleiweg, P. & Leinonen, T. (2011): "Gabmap. A Web Application for Dialectology". In: John Nerbonne, Stef Grondelaers, Dirk Speelman & MariaPilar Perea (eds.): Dialectologia. Special Issue II: Production, Perception an Attitude pp. 65-89.

Prieto P. & Cabré T. (coords.) (2007-2012): Atles Interactiu de l'Entonació del Català, http://prosodia.upf.edu/ atlesentonacio/

Prieto P. & Roseano P. (coords.) (2009-2010): Atlas Interactivo de la Entonación del Español, http://prosodia.upf.edu/ atlasentonacion/

Rilliard, A. & Lai J.P (2008): "La Base de Données AMPER et ses interfaces: structure et formats de données, exemple d'utilisation pour une analyse comparative de la prosodie de différents parlers romans". In: de Castro Moutinho L. & Coimbra, R.L. (eds.): Actas das I Jornadas Científicas AMPERPOR, U. Aveiro, 127-139.

Roseano, P.; Fernández Planas, A.M. & Martínez Celdrán, E. (in press): "El etiquetaje entonativo métrico-autosegmental en el marco del AMPER", In: Actas del V CFE. Cáceres 2011, October 2011.

La prosodia del català balear en el mapa lingüístico y político de europa

Ana Maria Fernández Planas, Universitat de Barcelona, Paolo Roseano, Universitat de Barcelona; Universitat Pompeu Fabra / , Universitat de Barcelona / Eugenio Martínez Celdrán, Universitat de Barcelona / Lourdes Romera Barrios, Universitat de Barcelona

Uno de los principales intereses del estudio de la prosodia actualmente se centra en el estudio de las variedades geoprosódicas de los grandes dominios lingüísticos. En este marco, hay diversas aproximaciones en el estudio del catalán. Una de ellas es la que se desarrolla en el Laboratori de Fonètica de la Universitat de Barcelona conocida como AMPER-CAT. Esta línea de trabajo se inserta en un proyecto internacional mucho más amplio que busca el mismo objetivo para las diferentes variedades románicas actuales, tanto en Europa como en América. En este trabajo se localiza en el espacio la prosodia de las Islas Baleares, concretamente de Palma, Maó i Sant Josep -respectivamente en Mallorca, Menora e Ibiza- en relación a otros puntos del dominio lingüístico catalán (Barcelona, Girona, Lleida, Tortosa, València, Castelló, Novelda y L'Alguer) y también en relación a otros puntos de dominios lingüísticos románicos (Palma, Barcelona, Lleida, León, Caravaca, Bullas, Laredo, Oviedo, La Laguna -castella-, Siena -italiano-, Agrons y Beivars -friulano-, Tumieç -italiano de Friul-, Portu Turre -italiano de Cerdeña- Biddanoa Monteleone -sardo logudorés-) y no románicos (Londres -inglés- y Frankfurt am Main -alemán-). La localización en un espacio virtual se realiza a través de las características prosódicas de las vocales de las frases sometidas a análisis (Moutinho et al 2011) y de su etiquetaje métrico autosegmental automátic (Roseano et al en prensa) en este estudio dialectométrico (Goebl, 1981) que trabaja cuantitativamente con un gran volumen de datos empíricos. Las 3213 frases trabajadas de 46 informantes en 28 puntos de encuesta son enunciativas e interrogativas absolutas neutras pragmáticamente, según las directivas del proyecto AMPER (Contini, 2008; Fernández Planas, 2005, Martínez Celdrán, 2007). Los resultados señalan la distribución del catalán balear en relación a los otros puntos considerados y determinan la concentración compacta de todo el dominio catalán frente a los demás.

Referencias

Contini, M. (2008): «Le projet AMPER: passé, présent et avenir », en L. de Castro Moutinho et R.L. Coimbra (org.): Actas das I Jornadas Científicas AMPERPOR, Aveiro, U. de Aveiro, 9-19.

Fernández Planas, A. M. (2005): «Aspectos generales acerca del proyecto internacional AMPER en España», Estudios de fonética experimental, XIV, 327-353.

Goebl, H. (1981): «Eléments d'analyse dialectométrique (avec application à l'AIS)», Revue de Linguistique Romane, 45, 349-420.

Martínez Celdrán, E. (2007): «Los dialectos catalanes y su prosodia», en J. Dorta (ed): Temas de dialectología, Tenerife, Instituto de Estudios Canarios, 123-140.

Moutinho, L. DE C.; R. L. Coimbra; A. Rillard y A. Romano (2011): «Mesure de la variation prosodique diatopique en portugais européen», Estudios de fonética experimental, XX, 33-56.

Roseano, P.; Fernández Planas, A. M. y Martínez Celdrán, E. (en prensa): «El etiquetaje entonativo métrico-autosegmental en el marco del Atlas Multimedia de Prosodia del Espacio Románico», Actas del V Congreso Internacional de Fonética Experimental, Cáceres.