Literatur digital erforschen

07/01/2018

Neues Schwerpunktprogramm der Deutschen Forschungsgemeinschaft: Es zielt darauf ab, die digitale Erforschung von Literatur weiter voranzubringen. Koordiniert wird es an der Universität Würzburg.

Literatur mit Computermethoden analysieren: Daran arbeiten Forscher in einem neuen Schwerpunktprogramm. (Foto: NosUA / iStock / Thinkstock)

Im Jahr 2013 brachte die Harry-Potter-Autorin Joanne K. Rowling unter dem Pseudonym Robert Galbraith die Kriminalgeschichte „The Cuckoo's Calling“ heraus. „Dass hinter dem unbekannten Schriftsteller in Wahrheit die berühmte Erfolgsautorin steckte, konnte man auch mit einer computergestützten Stilanalyse zeigen“, sagt Professor Fotis Jannidis, Inhaber des Lehrstuhls für Computerphilologie und neuere deutsche Literaturgeschichte an der Julius-Maximilians-Universität Würzburg (JMU).

Das bedeutet: Algorithmen können erkennen, ob ein Text mit großer Wahrscheinlichkeit von einem bestimmten Autor stammt, wenn von diesem Vergleichstexte vorliegen. Lässt sich diese Methode auch dazu einsetzen, um Textgattungen zu unterscheiden oder um einen Text einer Epoche zuzuschreiben? Unter anderem solche Fragen sollen im bundesweiten Schwerpunktprogramm „Computational Literary Studies“ geklärt werden, das die Deutsche Forschungsgemeinschaft (DFG) einrichten wird.

Deep Learning und andere Technologien

Literarische Texte mit Hilfe von Computern auf Inhalt, Wortwahl oder Sprachstil untersuchen: Dieser Forschungsansatz hat sich in den vergangenen zehn Jahren gut etabliert. Mittlerweile gibt es Tausende von Romanen, Dramen und lyrischen Werken auch in digitaler Form – der literarische Datenschatz ist gewachsen. Gleichzeitig wurden die Methoden der Datenanalyse verbessert. Das eröffnet der Forschung neue Wege, um Erkenntnisse über Strukturen und Entwicklungen von Literatur zu gewinnen.

„Deep Learning und andere Methoden des maschinellen Lernens machen neue Analyseverfahren für Texte möglich“, erklärt Professor Jannidis. Die Technologie des Deep Learning steht unter anderem hinter den inzwischen sehr guten Spracherkennungsverfahren. Diese sorgen beispielsweise dafür, dass Smartphones sich auf die charakteristischen sprachlichen Eigenheiten ihrer Besitzer einstellen können.

Gefühlsverläufe in Romanen aufdecken

Entwicklungspotenzial schlummert laut Jannidis etwa auf dem Gebiet der Gefühlsanalyse: Wie kann man einem Computer beibringen, die Gefühlspolarität von Wörtern zu ermitteln? Herauszufinden, ob Wörter positiv, negativ oder neutral besetzt sind? Mit einem solchen Werkzeug ließe sich beschreiben, welche Grundstimmungen in einem Roman vorherrschen und wie sie sich im Verlauf des Textes ändern. „Es gibt dafür schon spezifische Algorithmen, die aber für Zeitungsnachrichten entwickelt wurden. Man muss sie jetzt speziell für das Gebiet der Literatur anpassen.“

Für Literaturwissenschaftler ist nicht zuletzt die Möglichkeit reizvoll, auf diese Weise die zahlreichen ungelesenen Texte jenseits des Kanons – also der kleinen Liste von Texten, die als unbedingt lesenswert gelten – wieder zugänglich zu machen und so der Forschung zu erschließen.

Sechs Antragsteller stehen hinter dem Programm

Solche Herausforderungen sollen in dem neuen DFG-Schwerpunktprogramm angegangen werden. Fotis Jannidis ist der Koordinator des Programms; fünf weitere Fachleute haben den Antrag zusammen mit ihm ausgearbeitet: Evelyn Gius (Digital Humanities und Literaturwissenschaft, Hamburg), Jonas Kuhn und Nils Reiter (Computerlinguistik, Stuttgart), Christof Schöch (Digital Humanities und Literaturwissenschaft, Trier) und Simone Winko (Literaturwissenschaft, Göttingen).

Insgesamt 10 bis 15 Einzelprojekte sollen unter dem Dach des neuen Programms gefördert werden; die DFG hat die Ausschreibung dazu eben veröffentlicht. Das Programm steht vor allem Forschenden aus der Literaturwissenschaft (Germanistik, Romanistik u.a.), der Computerphilologie und der Informatik offen. Vorgesehen sind bis zu zwei Förderperioden, die jeweils drei Jahre dauern.

Folgende Schwerpunkte stehen im Zentrum:

Ermittlung, welche Verfahren der Informatik und Computerlinguistik für die Analyse literarischer Texte relevant sind,

Anwendung existierender Algorithmen auf neue Datensätze zur Generierung neuer Erkenntnisse über kulturelle Phänomene, Veränderungen und Strukturen,

Forschung über bestehende Algorithmen, um diese zu erweitern, Wege zur Anpassung von Parametern zu finden sowie das Verständnis ihrer Interaktion mit literarischen Texten zu verbessern,

formale Modellierung literaturwissenschaftlich relevanter Konzepte, wobei die Tiefe der formalen Modellierung literarischer Phänomene skalierbar ist,

Integration von Ergebnissen quantitativ-empirischer Forschung in den qualitativ-hermeneutischen Forschungsprozess und die Theorie- und Begriffsbildung.

Für 2019 richtet die DFG insgesamt 14 neue Schwerpunktprogramme ein. Sie wurden aus 53 eingereichten Initiativen ausgewählt. Für die neuen Programme stehen in der ersten Förderperiode rund 80 Millionen Euro zur Verfügung.

Kontakt

Prof. Dr. Fotis Jannidis, Koordinator des DFG-Schwerpunktprogramms „Computational Literary Studies“,
fotis.jannidis@uni-wuerzburg.de

Ausschreibung des DFG-Schwerpunktprogramms „Computational Literary Studies“

Fakten über DFG-Schwerpunktprogramme

Von Robert Emmerich

Back

Hubland Süd, Geb. PH1