Modul: Machine Learning Algorithmen & Data Modeling
Du lernst komplexere und weiterführende Machine Learning Algorithmen & Ansätze kennen und erfährst, wie du mit den häufigsten in der Praxis auftretenden Problemen im Datenbestand umgehen kannst.
In diesem Modul gewinnen die Teilnehmenden ein fundiertes technisches Verständnis für die Funktionsweise der wichtigsten Machine-Learning-Algorithmen. Aufbauend auf einem chronologischen Überblick über die Entwicklung von ML-Algorithmen werden grundlegende Konzepte und gängige Missverständnisse beleuchtet. Auch die zugrunde liegenden Optimierungsmethoden werden verständlich erklärt, wobei auf Querverbindungen und wiederkehrende Prinzipien hingewiesen wird. Ziel ist es auch, das Selbstbewusstsein im Umgang mit technischer Dokumentation und Fachliteratur zu stärken.
Ein weiterer Schwerpunkt des Moduls liegt auf der strukturierten Datenaufbereitung und Modellierung. Themen wie Overfitting, Data Leakage und Abhängigkeiten in den Daten werden praxisorientiert behandelt, mit Fokus auf einem sorgfältigen und systematischen Vorgehen. Hier fliessen zentrale Erkenntnisse aus Kaggle-Wettbewerben im Bereich tabellarischer Daten ein.
In der abschliessenden Sitzung widmen wir uns den jüngsten Fortschritten im Bereich Generative KI. Dabei stellen wir wesentliche Innovationen der letzten Jahre vor und erklären das Funktionsprinzip von Transformer-Modellen. Auch die Anwendung von Embeddings wird detailliert besprochen.
Weitere Informationen
Du kennst weiterführende Methoden für Regressionsprobleme.
Du kennst Hierarchische, Density-Based- und Distribution-Based-Clustering-Ansätze und kannst diese in Python umsetzen.
Du kennst die Konzepte hinter den verschiedenen Ensemble-Learning Verfahren (Bagging, Boosting, Stacking) und weisst, welchen Mehrwert die einzelnen Verfahren bringen.
Du weisst, welche Vor- und Nachteile der Einsatz von Ensemble-Learning mit sich bringt.
Du kennst verschiedene Ansätze und Kriterien für die Model-Selection und kannst dies sauber in Python mit Hilfe von Pipelines umsetzen.
Du beherrschst den Umgang mit Frameworks wie z.B. AutoML, um die Model-Selektion und das Fine-Tuning der Hyperparameter zu automatisieren.
Du kennst verschiedene Methoden, um Unsicherheiten in den Daten zu begegnen und bist in der Lage, mit Abhängigkeiten in den Daten korrekt umzugehen.
Du kennst das Class-Imbalance Problem und Strategien wie Oversampling, Undersampling oder Loss Weights, um diesem zu begegnen.
Du kannst sämtliche Algorithmen, Methoden und Verfahren in Python anwenden.
Python
Erwartet wird, dass die Teilnehmenden die Grundkenntnisse zu linearer Algebra, Wahrscheinlichkeitsrechnung und Machine Learning mitbringen.
Als Kursvorbereitung wird empfohlen, sich nochmals mit linearer Algebra auseinander zu setzen sowie die benötigte Entwicklungsumgebung auf dem eigenen Rechner einzurichten. Bitte plane etwa 4 Stunden für die Vorbereitung.
Administratives
Du erhältst in jedem Fall eine Teilnahmebestätigung. Falls du in der festgelegten Leistungsbeurteilung mindestens eine genügende Leistung erbringst, erhältst du einen Nachweis, dass du das Modul erfolgreich bestanden hast.
Teilnehmenden des DAS- oder MAS-Data-Science-Weiterbildungslehrgangs werden die entsprechenden ETCS-Punkte angerechnet.