Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2

Startseite

Anmelden

Studentisches Leben Veranstaltungen Einrichtungen Personen Räume und Gebäude

Startseite

Ja, wo hab ich denn bloß...? - Texttechnologische Grundlagen für die Auswertung von Korpora in nichtnormierter Graphie - Einzelansicht

Funktionen:

Seiteninhalt:
Grunddaten
Termine
Zugeordnete Person
Zielgruppen/Studiengänge
Einrichtungen
Inhalt
Strukturbaum

Grunddaten
Veranstaltungsart	Proseminar	Langtext
Veranstaltungsnummer		Kurztext
Semester	SS 2010	SWS	2
Erwartete Teilnehmer/-innen		Max. Teilnehmer/-innen	44
Credits		Belegung	Belegpflicht
Zeitfenster
Hyperlink
Sprache	Deutsch
Belegungsfristen	Einrichtung : Germanistik
Belegungsfristen	Einrichtung : Germanistik

Termine Gruppe: [unbenannt]
	Tag	Zeit	Rhythmus	Dauer	Raum	Raum- plan	Status	Bemerkung	fällt aus am	Max. Teilnehmer/-innen	E-Learning
	Di.	10:00 bis 12:00	wöch.	13.04.2010 bis 20.07.2010			findet statt	R11 T05 C94 - CIP-Pool			Präsenzveranstaltung

Gruppe [unbenannt]:

vormerken

Zur Zeit keine Belegung möglich

Zugeordnete Person
Zugeordnete Person	Zuständigkeit
Fisseni, Bernhard , Dr.	verantwort

Zielgruppen/Studiengänge
Zielgruppe/Studiengang	Semester	Pflichtkennzeichen
LGyGe, Lehramt an Gymnasien u. Gesamtschulen	2 - 2	WP
Bachelor, Bachelor	2 - 2	WP
LBK, Lehramt an Berufskollegs	2 - 2	WP

Zuordnung zu Einrichtungen
Germanistik Linguistik

Inhalt
Kommentar	Wenn man mittels Korpora die Sprachentwicklung erforschen möchte oder sich mit geschriebenen Äußerungen aus nicht konzeptionell schriftlichen Kontexten befasst (Chats, persönliche Briefe, verschriftlichte Spontansprache), ergeben sich bestimmte Probleme, die in der Untersuchung von Korpora moderner, (offiziell und normiert) geschriebener Sprache nicht oder nicht so häufig auftreten. Einige dieser Probleme werden wir besprechen und praktische Lösungen kennenlernen. Da Rechner besser zählen und schneller suchen können als Menschen, bietet es sich an, Korpora maschinell statistisch auszuwerten. Wenn wir in nichtnormiert geschriebenen Texten suchen, müssen wir verschiedene Schreibgewohnheiten oder Schreibabweichungen durch eine tolerante Suche auffangen, sodass wir etwa "brauchen", "brauchten", "bräuchten", "brauchte", "gebraucht" etc. auf einmal finden (aber bitte nicht: "brauen", "Gebräu"). Dabei hilft es, zu ahnen, wie Zeichen und Buchstaben im Rechner dargestellt werden: Ist ein "ä" etwas ganz anderes als ein "a" mit zwei Punkten – oder besser nicht? Auch sprachliche und strukturelle Informationen in einem Korpus müssen so beschrieben sein, dass wir sie auszählen lassen können. Während der LV werden diese Themen in praktischen Übungen bearbeitet.
Literatur	Lobin, Henning (2000): Informationsmodellierung in XML und SGML. Berlin: Springer. Unicode Homepage. http://www.unicode.org http://www.regular-expressions.info/ TITUS -- Thesaurus Indogermanischer Text- und Sprachmaterialien. http://titus.uni-frankfurt.de/indexd.htm Sprache und Datenverarbeitung 31(1–2/2007).
Voraussetzungen	* abgeschlossener Grundkurs Linguistik * Bereitschaft, einen Computer zu bedienen und bei Schwierigkeiten Hilfe anzufordern (Rechner und Dozenten beißen nicht!) * Bereitschaft und Fähigkeit, ggf. auch englischsprachige Texte zu konsultieren

Strukturbaum

Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester SS 2010 , Aktuelles Semester: SoSe 2024

Impressum & Datenschutz Erklärung zur Barrierefreiheit

QIS, LSF und HISinOne sind Produkte der HIS eG