Kommentar |
Wenn man mittels Korpora die Sprachentwicklung erforschen möchte oder sich mit geschriebenen Äußerungen aus nicht konzeptionell schriftlichen Kontexten befasst (Chats, persönliche Briefe, verschriftlichte Spontansprache), ergeben sich bestimmte Probleme, die in der Untersuchung von Korpora moderner, (offiziell und normiert) geschriebener Sprache nicht oder nicht so häufig auftreten. Einige dieser Probleme werden wir besprechen und praktische Lösungen kennenlernen.
Da Rechner besser zählen und schneller suchen können als Menschen, bietet es sich an, Korpora maschinell statistisch auszuwerten. Wenn wir in nichtnormiert geschriebenen Texten suchen, müssen wir verschiedene Schreibgewohnheiten oder Schreibabweichungen durch eine tolerante Suche auffangen, sodass wir etwa "brauchen", "brauchten", "bräuchten", "brauchte", "gebraucht" etc. auf einmal finden (aber bitte nicht: "brauen", "Gebräu"). Dabei hilft es, zu ahnen, wie Zeichen und Buchstaben im Rechner dargestellt werden: Ist ein "ä" etwas ganz anderes als ein "a" mit zwei Punkten – oder besser nicht? Auch sprachliche und strukturelle Informationen in einem Korpus müssen so beschrieben sein, dass wir sie auszählen lassen können. Während der LV werden diese Themen in praktischen Übungen bearbeitet. |
Voraussetzungen |
* abgeschlossener Grundkurs Linguistik * Bereitschaft, einen Computer zu bedienen und bei Schwierigkeiten Hilfe anzufordern (Rechner und Dozenten beißen nicht!) * Bereitschaft und Fähigkeit, ggf. auch englischsprachige Texte zu konsultieren |