Viele AI-Anwendungen basieren auf Deep-Learning-Methoden, die seit etwa 2012 einen immer höheren Stellenwert in der Arbeitswelt einnehmen. Dies liegt daran, dass diese rechenintensiven Verfahren erst seitdem durch moderne Rechenmittel realisierbar geworden sind. Insbesondere Anwendungen in der Bildverarbeitung, der Verarbeitung natürlicher Sprachen und der Zeitreihenanalyse profitieren von Deep-Learning-Verfahren. Diese erzielen durch automatisiertes Training mittels spezifischer Trainingsdaten höhere und robustere Genauigkeiten der Datenvorhersagen.
Im CAS Deep Learning lernst du die grundlegenden Architekturen verschiedener Deep-Learning-Verfahren kennen und wie diese in praxisrelevanten Bereichen für Vorhersagen oder zur Datengenerierung (Generative AI), wie beispielsweise bei LLMs, gewinnbringend eingesetzt werden können. Es wird viel Wert auf eine anwendungsorientierte Vermittlung der theoretischen Inhalte gelegt. Theorie wird im Unterricht mit «hands-on»-Übungen begleitet, um das gelernte Wissen praktisch anwenden und vertiefen zu können. Zum Abschluss wird in einem Gebiet der Wahl eine individuelle Projektarbeit durchgeführt.
Modulübersicht
Einführung in Deep Learning und seine Werkzeuge (TensorFlow/PyTorch)
Grundlegende Architekturtypen von tiefen neuronalen Netzwerken, z.B. Multi-Layer Perceptron, CNNs, RNNs, AutoEncoder
Training eines tiefen neuronalen Netzwerkes: Gradient Descent, Backpropagation, Hyperparameter Tuning, Loss-Funktionen
Datensatzaufbereitung
Einführung in die Bildklassifikation
Grundlagen der Convolutional Neural Networks (CNNs)
Fortgeschrittene Komponenten von CNNs, z.B. Inception Module, Residual Ver-bindungen, Squeeze-and-Excitation Blocks, Separable Convolution Blocks
Trainingsstrategien für CNNs: Batch Normalization, Regularisierung
Einführung in Objekterkennung und semantische Segmentierung in Bildern
Grundlagen zu Vektor-Repräsentationen von Dokumenten und Text
Grundlegende Netzwerkarchitekturen und deren Einsatz in Dokument- und Textverarbeitung: RNNs, GRUs, CNNs, Auto-Encoding
Fortgeschrittene Netzwerkarchitekturen für NLP: Multi-Layer/Bi-directional RNNs, Sequence-to-Sequence Modellierung mit Attention-Mechanismus und Transformer Architekturen, Transfer Learning, Representation Learning
NLP-Anwendungen mittels Deep Learning
Performance-Evaluation von NLP Netzwerken, z.B. BLEU Score
Personen mit analytischem Interesse, die sich bereits heute schon mit Datenverwaltung und -auswertung beschäftigen, Grundkenntnisse in Data Science haben und neu Deep-Learning-Anwendungen in Python umsetzen möchten.
14 Kurstage jeweils freitags und samstags. Kurzprüfung nach Abschluss des Kurses an einem gesonderten Termin. Der Zeitaufwand beträgt ca. 300 Stunden, das entspricht 12 ECTS.
Start: Freitag, 6. September 2024
Maximal 16 Personen pro Klasse
Die Aufnahmebedingungen umfassen:
Du beschäftigst dich bereits mit Datenverwaltung und -auswertung.
Du verfügst über Grundkenntnisse in Data Science und etwas praktische Erfahrung mit Data Science Tooling (Python, Pandas, matplotlib). Zudem bringst du ein Grundverständnis in linearer Algebra bzw. Vektoren, Matrizen und Tensoren mit. Diese Grundkenntnisse können im CAS Data Science erworben werden.
Du verfügst über einen Abschluss einer Fachhochschule, Universität, technischen Hochschule oder eine Berufsausbildung mit Praxiserfahrung. Studierende, die über keinen Hochschulabschluss verfügen, können (sur Dossier) zugelassen werden, wenn sich die Befähigung zur Teilnahme aus einem anderen Nachweis ergibt.
Du arbeitest etwa 40-50% der Kurszeit am eigenen Notebook. Wir stellen dir detaillierte Anleitungen und die benötigten Werkzeuge (Software-Tools) zur Verfügung. Bitte installiere diese vorgängig auf dem Laptop und bring diesen jeweils in den Kurs mit.
Ungefähr die Hälfte der Dozierenden dieses Weiterbildungslehrgangs kommen aus der Privatwirtschaft; die restlichen aus der angewandten Forschung. Dies hat den grossen Vorteil, dass die Dozierenden nicht einfach nur den Inhalt aus Lehrbüchern vermitteln, sondern zusätzlich aufgrund ihrer langjährigen Erfahrungen in der Lage sind, begründet zu erklären, welche Konzepte und Technologien sich in verschiedenen Anwendungsfällen der Praxis bewährt haben.