Sprachkorpora bilden in vielen linguistischen Bereichen die wichtigste Grundlage empirischer Sprachforschung. In diesem Seminar soll es um
• Arten von Korpora,
• die Kodierung von Korpora und deren und Anreicherung um Metadaten und Annotationen und
• die Recherche in Korpora
Dabei soll schwerpunktmäßig die Kodierung mit aktuellen texttechnologischen Standards (wie XML, TEI P5 u.ä.) für Textdaten in Sprachkorpora und in Editionen betrachtet werden, so dass die Textdaten
• optimal auswertbar sind,
• unabhängig von bestimmten Computerplattformen verwendbar sind und
• nachhaltig archivierbar sind. |