Skip to main content

Modulbeschreibung - Grundkompetenz Machine Learning

Nummer
gml
ECTS 6.0
Spezifizierung Verstehen, Verwenden und Evaluieren grundlegender Methoden des maschinellen Lernens.
Anspruchsniveau Intermediate
Inhalt Es stehen uns immer mehr Daten zur Verfügung, in der Industrie, aber auch im täglichen Leben. Diese Daten können wir dazu verwenden, Vorhersagen zu machen. Was eine gute Vorhersage ist, hängt von Datensatz und Anwendungszweck ab. Die grossen Datenmengen verlangen weiter nach Möglichkeiten, diese zu komprimieren, zu gruppieren und übersichtlich darzustellen. Methoden, welche es erlauben, diese Bedürfnisse mit Computer-Hilfe umzusetzen, gehören ins Feld des maschinellen Lernens (Machine Learning). In diesem Modul werden die Grundlagen, sowie die Teilgebiete des maschinellen Lernens vermittelt:

Supervised Learning-Methoden können dafür eingesetzt werden Zusammenhänge zwischen Input- und Output-Variablen zu lernen, um mit dem gelernten Zusammenhang Vorhersagen zu machen.

Unsupervised Learning-Methoden ermöglichen es, einen Datensatz hinsichtlich seiner Struktur zu untersuchen, Ausreisser zu identifizieren, den Datensatz in seiner Dimensionalität zu reduzieren und kompakte Visualisierungen zu erstellen.

Wir lernen eine Reihe von Standardalgorithmen und Methoden aus beiden Teilgebieten kennen, einzusetzen und deren Verwendung zu beurteilen.
Lernergebnisse Grundverständnis und Vorgehen
Studierende verstehen die Struktur von Supervised und Unsupervised Learning-Aufgabenstellungen. Sie können weiter Datensätze, welche zur Vorhersage von kontinuierlichen und kategorischen Variablen genutzt werden können, erkennen oder entsprechend strukturieren. Sie sind mit dem Modellierungsprozess und relevanten Aspekten der Modellwahl vertraut (Präprozessieren, Train-Test-Validate, Feature Selection, Bias-Variance-Zerlegung, Overfitting, Hyperparameter Tuning). Sie können durch Verwendung verschiedener Metriken Regressions- und Klassifikationsmodelle evaluieren und Vorhersageergebnisse kritisch untersuchen. Studierende kennen Einsatzmöglichkeiten verschiedener Unsupervised Learning-Methoden und Beispiele für deren Anwendung in der industriellen Praxis.

Theorieverständnis und Methoden Supervised Learning
Studierende kennen die Standardmethoden zur Regression und Klassifikation (lineare Regression, Lasso, Ridge Regression, Kernel Ridge Regression, CART, kNN, MLP, logistische Regression, SVM, Naive Bayes, LDA, etc.) und können diese verwenden. Sie sind mit den dahinterliegenden mathematischen Modellen vertraut und können deren Wirkungsweise erklären. Sie kennen verschiedene Ansätze zur Festlegung der Modell-Komplexität.

Theorieverständnis und Methoden Unsupervised Learning
Studierende kennen die Standardmethoden von Unsupervised Learning (PCA, SVD, NMF, ICA, hierarchisches Clustering, DBSCAN, kMeans, k-Medoids, t-SNE, UMAP, Isolation Forests, LOF, GMM) und können deren mathematische Grundlage beschreiben. Sie wissen wie die verschiedenen Methoden parametrisiert werden. Sie wissen wie die Anwendung von Unsupervised Learning-Methoden quantitativ und grafisch untersucht und beurteilt werden kann (Dissimilarity-Analyse, Elbow-, Silhoutte-Plot, ..).

Anwendung und Praxisverständnis
Studierende kennen die Eigenschaften, die Vor- und Nachteile obiger Methoden und können sie gezielt durch Verwendung entsprechender Bibliotheken (e.g. scikit-learn) einsetzen. Dabei sind sie in der Lage, durch diagnostische Visualisierung systematisch geeignete Modelle zu finden. Sie können Resultate von Vorhersage-Modellen quantitativ sowie durch Visualisierung untersuchen. Sie können mit Beispielen aus Ihrer gesammelten Erfahrung in fachlich korrekter Weise die Anwendung von Machine Learning Methoden diskutieren. Sie wissen um Herausforderungen, welche aus der Struktur von Datensätzen (e.g. Class Imbalance, Ausreisser) ergeben können, sowie um Ansätze wie unter solchen Umständen vorgegangen werden kann. Sie wissen wie Unsupervised Learning als Preprocessing für Supervised Learning eingesetzt werden kann und wie dies zu geschehen hat.
Modulbewertung Note
Baut auf folgenden Modulen auf Lineare Algebra, Analysis, Explorative Datenanalyse, Wahrscheinlichkeitsrechnung
Modultyp Portfoliomodul
Diese Seite teilen: