Lernziele
Das Seminar befähigt die Teilnehmenden, statistische Modelle und grundlegende Machine-Learning-Verfahren zu verstehen, mit R anzuwenden und kritisch zu bewerten.
Sie erlernen, Daten aufzubereiten, geeignete Modellierungsverfahren auszuwählen, deren Annahmen zu prüfen und Modelle anhand relevanter Gütekriterien zu beurteilen.
Die Studierenden erkennen typische Probleme wie Overfitting oder ungeeignete Merkmalsauswahl und können Modellierungsstrategien entsprechend anpassen.
Zudem sind sie in der Lage, Analyseergebnisse klar zu interpretieren und verständlich zu kommunizieren.
Inhalte
Der Kurs behandelt zentrale Konzepte der statistischen Modellierung und des Machine Learning. Dazu gehören Datenaufbereitung, Trainings-/Testaufteilung, Cross-Validation und grundlegendes Feature Engineering. Die Teilnehmenden erlernen die Anwendung und Interpretation zentraler Modellklassen wie lineare und generalisierte lineare Modelle, Entscheidungsbäume, Random Forests, sowie Gradient Boosting.
Weitere Inhalte umfassen Modellgütebewertung, Hyperparameter-Tuning, Modellvergleich und Verfahren zur Interpretation von ML-Modellen. Zusätzlich werden typische Herausforderungen im Modellierungsprozess (z. B. Ausreißer, Imbalance, Multikollinearität, Overfitting) sowie Strategien zu deren Bewältigung behandelt.
|