Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1 
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2 
Startseite    Anmelden     
Logout in [min] [minutetext]

Ja, wo hab ich denn bloß...? - Texttechnologische Grundlagen für die Auswertung von Korpora in nichtnormierter Graphie - Einzelansicht

  • Funktionen:
Grunddaten
Veranstaltungsart Proseminar Langtext
Veranstaltungsnummer Kurztext
Semester SS 2010 SWS 2
Erwartete Teilnehmer/-innen Max. Teilnehmer/-innen 44
Credits Belegung Belegpflicht
Zeitfenster
Hyperlink
Sprache Deutsch
Belegungsfristen
Einrichtung :
Germanistik

Einrichtung :
Germanistik
Termine Gruppe: [unbenannt] iCalendar Export für Outlook
  Tag Zeit Rhythmus Dauer Raum Raum-
plan
Status Bemerkung fällt aus am Max. Teilnehmer/-innen E-Learning
Einzeltermine anzeigen
iCalendar Export für Outlook
Di. 10:00 bis 12:00 wöch. 13.04.2010 bis 20.07.2010    findet statt R11 T05 C94 - CIP-Pool   Präsenzveranstaltung
Gruppe [unbenannt]:
Zur Zeit keine Belegung möglich
 


Zugeordnete Person
Zugeordnete Person Zuständigkeit
Fisseni, Bernhard , Dr. verantwort
Zielgruppen/Studiengänge
Zielgruppe/Studiengang Semester Pflichtkennzeichen
LGyGe, Lehramt an Gymnasien u. Gesamtschulen 2 - 2 WP
Bachelor, Bachelor 2 - 2 WP
LBK, Lehramt an Berufskollegs 2 - 2 WP
Zuordnung zu Einrichtungen
Germanistik Linguistik
Inhalt
Kommentar

Wenn man mittels Korpora die Sprachentwicklung erforschen möchte oder sich mit geschriebenen Äußerungen aus nicht konzeptionell schriftlichen Kontexten befasst (Chats, persönliche Briefe, verschriftlichte Spontansprache), ergeben sich bestimmte Probleme, die in der Untersuchung von Korpora moderner, (offiziell und normiert) geschriebener Sprache nicht oder nicht so häufig auftreten.  Einige dieser Probleme werden wir besprechen und praktische Lösungen kennenlernen. 

Da Rechner besser zählen und schneller suchen können als Menschen, bietet es sich an, Korpora maschinell statistisch auszuwerten.  Wenn wir in nichtnormiert geschriebenen Texten suchen, müssen wir verschiedene Schreibgewohnheiten oder Schreibabweichungen durch eine tolerante Suche auffangen, sodass wir etwa "brauchen", "brauchten", "bräuchten", "brauchte", "gebraucht" etc. auf einmal finden (aber bitte nicht: "brauen", "Gebräu").  Dabei hilft es, zu ahnen, wie Zeichen und Buchstaben im Rechner dargestellt werden: Ist ein "ä" etwas ganz anderes als ein "a" mit zwei Punkten – oder besser nicht?  Auch sprachliche und strukturelle Informationen in einem Korpus müssen so beschrieben sein, dass wir sie auszählen lassen können.  Während der LV werden diese Themen in praktischen Übungen bearbeitet.

Literatur

Lobin, Henning (2000): Informationsmodellierung in XML und SGML. Berlin: Springer.
Unicode Homepage.  http://www.unicode.org
http://www.regular-expressions.info/
TITUS -- Thesaurus Indogermanischer Text- und Sprachmaterialien.
http://titus.uni-frankfurt.de/indexd.htm
Sprache und Datenverarbeitung 31(1–2/2007).

Voraussetzungen

* abgeschlossener Grundkurs Linguistik

* Bereitschaft, einen Computer zu bedienen und bei Schwierigkeiten Hilfe anzufordern
   (Rechner und Dozenten beißen nicht!)

* Bereitschaft und Fähigkeit, ggf. auch englischsprachige Texte zu konsultieren


Strukturbaum
Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester SS 2010 , Aktuelles Semester: SoSe 2024