Das Seminar gibt eine Einführung in die Grundlagen und Methoden der korpusgestützten Sprachanalyse und einen Überblick über einschlägige Korpora zum Deutschen. Korpora sind Sammlungen schriftlich oder mündlich realisierter (oder transkribierter) authentischer Sprachdaten, die für Forschungs- und Lehrzwecke aufgebaut werden und die typischerweise digital verfügbar sind.
Das Seminar vermittelt zum einen das Hintergrundwissen, das benötigt wird, um Korpora bestmöglich für die empirische Bearbeitung linguistischer Forschungsfragen zu nutzen. Ein besonderer Fokus des Seminars liegt dabei auf der Nutzung sprachtechnologischer Verfahren für die Anreicherung von Korpusdaten um linguistische Strukturinformationen, die in Form von Annotationen gespeichert werden und die die Möglichkeiten der Korpusrecherche erweitern. In diesem Zusammenhang werden auch grundlegende Konzepte aus dem Bereich der Sprach- und Texttechnologie vermittelt, die für ein vertieftes Verständnis der Repräsentation linguistischer Datenstrukturen in Korpora hilfreich sind.
Zum anderen wird im Seminar der Umgang mit unterschiedlichen Typen von Korpora (Korpora geschriebener und gesprochener Sprache, Korpora internetbasierter Kommunikation) selbst erprobt. In Teams bearbeiten die Studierenden ausgewählte linguistische Forschungsfragen, die gemeinsam festgelegt werden. Dabei wird auch der Umgang mit Korpusabfragesprachen eingeübt und diskutiert, wie man Korpusabfragen unter Einbeziehung von Annotationen so formuliert, dass sie möglichst gute Belege zu den untersuchten linguistischen Phänomenen liefern.
|