Wir leben in einer datenreichen Zeit - es gibt Daten wie Sand am Meer. So sind auch die Dimensionen digitaler Textdaten im Sinne von „Big Data“ überwältigend. Um aber die Materialflut bewältigen und ordnen zu können, sind neue digitale Wege zu gehen. In dieser Veranstaltung werden wir daher Verfahren des „Text Mining“ nutzen, um große Textdaten-Sammlungen (d.h. Korpora) effizient mit Algorithmen zu analysieren.
Die Tore in die Welt der maschinellen Textverarbeitung öffnen sich allerdings erst, wenn man in der Lage ist, analytische Ideen in Programm-Code zu gießen. Daten sind das neue Öl? Man muss programmieren können, um aus dem neuen wertvollen Rohstoff "Daten" etwas herausholen zu können. Daher verbindet dieser Kurs eine Einführung in das wissenschaftliche Programmieren - konkret in die Statistiksprache „R“ - mit einer anwendungsorientierten Einführung in Verfahren des Text Mining. Auf dem Weg dahin lernen Sie Daten- und Kontrollstrukturen sowie Techiken des Web Scraping kennen. Sie wissen dann auch, wie man statistische Testverfahren in R implementiert.
Dabei können wir auf die Daten und Analyse-Tools des PolMine-Projekts (polmine.de) zurückgreifen. Mit dem Korpora aller Debatten im Deutschen Bundestag („GermaParl“) sowie in der Generalversammlung der Vereinten Nationen ("UNGA"-Korpus) und den Foliensätzen „Using Corpora in Social Science Research“ stehen Ihnen Ressourcen zur Verfügung, mit denen Sie schnell relevante politikwissenschaftliche Erkenntnisse erzielen können. Als Voraussetzung müssen Sie keinerlei Programmierkenntnisse mitbringen - nur Offenheit und etwas Leidensfähigkeit, Code mit geschweiften und eckigen Klammern zu schreiben. Indem Sie am Ende des Kurses über "data literacy" und Grundlagen des Programmierens verfügen, werden Sie die Welt der Digitalisierung besser verstehen und die wesentlichen Grundlagen haben, um eigene Wege in der Welt des wissenschaftlichen Programmierens zu gehen. |