Nachrichten, Gerüchte, Meldungen und Berichte aus der IT-Szene
Redaktion: Heinz Schmitz
Sprache in großem Stil analysieren
Die Entwicklung neuer Methoden, Modelle und Werkzeuge zur Erfassung und Analyse digitaler Sprachbestände steht im Mittelpunkt des neuen Leibniz- WissenschaftsCampus „Empirical Linguistics and Computational Language Modeling“ – einer interdisziplinären Forschungskooperation des Instituts für Deutsche Sprache (IDS) in Mannheim und des Instituts für Computerlinguistik der Universität Heidelberg. Das für einen Zeitraum von vier Jahren bewilligte Verbundprojekt wird mit einer Gesamtsumme von 2,6 Millionen Euro gefördert. Die Forschungsarbeiten auf dem Gebiet der „Empirischen Linguistik und computerlinguistischen Sprachmodellierung“ sollen bereits Anfang 2015 beginnen. Neben der Leibniz-Gemeinschaft werden sie auch vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg finanziell unterstützt.
„Die gewachsenen Möglichkeiten, Sprache in Form von Texten oder Tonaufnahmen elektronisch zu speichern und auszuwerten, besitzen das Potential, bisherige Forschungsmethoden in der Sprachwissenschaft und in den Geistes- und Kulturwissenschaften zu revolutionieren. Um die großen Datenmengen, die Big Data, verwalten, bearbeiten, analysieren und sie für weitere Anwendungsformen nutzbar machen zu können, müssen jedoch neue Herangehensweisen und neue Werkzeuge entwickelt werden“, betont Prof. Dr. Andreas Witt, der designierter Sprecher des Verbundprojekts ist und am Institut für Deutsche Sprache den Programmbereich Forschungsinfrastrukturen leitet. „Dazu sollen im Rahmen des Leibniz- WissenschaftsCampus innovative Forschungsmethoden im Bereich der Linguistik und der Computerlinguistik erarbeitet werden. Darüber hinaus wollen wir diese Methoden und Werkzeuge auch für neue Forschungsfragen in den sogenannten Digital Humanities nutzbar machen“, ergänzt Prof. Dr. Anette Frank, die geschäftsführende Direktorin des Instituts für Computerlinguistik der Universität Heidelberg ist.
Zu den Forschungsschwerpunkten des Leibniz-WissenschaftsCampus gehören unter anderem die Aufbereitung und statistische Analyse umfangreicher Sprachressourcen. Die beteiligten Wissenschaftler wollen darauf aufbauend innovative Sprachverarbeitungsmodelle für das Deutsche entwickeln. Diese Modelle sollen es möglich machen, Sprache verschiedener Genres und Domänen automatisch zu analysieren und damit eine verbesserte Interpretation von Sprachkorpora unterschiedlicher Herkunft und Anwendungsfelder zu leisten – von Texten der sozialen Medien über gesprochene Sprache bis hin zu fachsprachlichen und literarischen Texten. Neben Sprachwissenschaftlern des Instituts für Deutsche Sprache und Computerlinguisten der Universität Heidelberg werden in dem Verbundprojekt als weitere Partner auch Informatiker und Linguisten der Universitäten Mannheim und Heidelberg sowie Computerlinguisten des Heidelberger Instituts für Theoretische Studien (HITS) involviert sein.
Weitere Informationen unter: