Die Computerlinguistik beschäftigt sich mit der maschinellen Verarbeitung natürlicher Sprache (und den dafür notwendigen Grundlagen). Es geht also um natürliche Sprache, d. h. um von menschlichen Sprachgemeinschaften gesprochene Sprache. Daraus resultieren Herausforderungen: Die Explikationsfähigkeit der Sprachteilnehmer ist gering, d. h. sie können ihre Sprache und ihr sprachliches Verhalten nur zu einem kleinen Teil erklären. Andererseits ist ihre Sprachkompetenz hoch, d. h. sie können komplexe sprachliche Äußerungen erzeugen und verstehen. In diesem Zusammenhang ist eine besonders genaue Beschreibung sprachlicher Zusammenhänge notwendig. Zur Beschreibung bedarf es einer oder mehrerer Metaebenen. Einige davon sind Ihnen wahrscheinlich bekannt: Die Ebene der Satzgliedfunktionen (Subjekt, Objekt, ...) oder der morphosyntaktischen Wortarten (Verb, Nomen, ...). Für eine genaue Beschreibung und die Koordination sind häufig formale Beschreibungen und Notationen sinnvoll, die ein festes und systematisches Inventar an Beschreibungsmitteln beinhalten. Die Computerlinguistik ist ein fester Bestandteil der Linguistik geworden. Ihre Werkzeuge, Methoden und Theorien beeinflussen Arbeitsweise und Inhalte der Forschung und Praxis. Die genaue Beschreibung von Sprache ist ohnehin Anliegen der Linguistik. Die Computerlinguistik zeichnet sich häufig durch die Reflexion und Optimierung der Beschreibungsmittel aus. Viele computerlinguistische Anwendungen sind so komplex, dass die Beschreibungsmittel unter dem Gesichtspunkt der Bewältigung dieser Komplexität entwickelt wurden. Wahrscheinlich folgt daraus, dass Computerlinguisten gute Linguisten sind. Weil dieses Seminar sich an Teilnehmer mit geringen Vorkenntnissen wendet, stehen Beschreibungsmodelle im Mittelpunkt der Betrachtung. Das Wissen darüber ist theoretisch. Die Implementierung ist nicht Gegenstand des Seminars, Computerlinguistik, wie sie hier betrieben wird, erfordert keine Computer! Darüber hinaus gibt es Spezialgebiete der Computerlinguistik. Diese Spezialgebiete berühren und überschneiden sich häufig, zu nennen sind: Das Entwickeln und Anwenden von Theorien als Grundlage der Beschreibung Generell sind die Beschreibungsmittel in der CL formal, d. h. sie sind fest definierten und systematisiert. Die Deklaration (Beschreibung) sprachlicher Sachverhalte, z. B. phonologischen, lexikalischen und grammatischen Wissens. Auf Basis von Deklarationen das Generieren (Erzeugen) und Parsen (Analysieren) von sprachlichen Äußerungen. |