Modul: Computer Vision mit Deep Learning

Die automatische Interpretation von Bild und Video-Daten hat viele Anwendungsgebiete und liefert dank Deep Learning beeindruckende Ergebnisse.

Eckdaten

ECTS-Punkte: 3
Nächster Start: 24.10.2025
Dauer: 3.5 Tage
Unterrichtstage: Fr. / Sa.
Unterrichtssprache: Deutsch
Durchführungsort(e): FHNW Campus Brugg-Windisch
Preis: CHF 1800.–

Jetzt anmelden

Mobile navi goes here!

Computer Vision ist ein Teilgebiet von AI, in welchem der Computer Videos und Bilder «sehen» und interpretieren kann. Es gibt bereits heute viele Anwendungsfälle dafür; hier ein paar Beispiele:

Bereits heute können Computer Personen dank der Gesichtserkennung zuverlässig identifizieren.
Bilddiagnosen unterstützen in der Medizin Ärzt*innen bei der Erkennung von Krebs.
Anhand von Bild- und Video-Daten können defekte Produktionsteile erkannt werden.
In Amazon Go Shops gehören Kassen und Warteschlangen der Vergangenheit an. Es wird unter anderem mit Hilfe von Computer Vision automatisch erkannt, welche Person welche Produkte einpackt oder wieder zurückstellt. Nachdem alle benötigten Produkte in der Tasche sind, wird der Laden verlassen und der Einkauf über das Amazon Konto abgerechnet.
Die Autoindustrie beschäftigt sich stark mit Computer Vision mit dem Ziel, Objekte wie Personen, Schilder oder Verkehrssignale auf der Strasse zu erkennen, um die Sicherheit zu maximieren oder ferner selbstfahrende Autos zu ermöglichen.

Die Fortschritte in diesem Gebiet sind dank Deep Learning höchst beeindruckend, da diese Modelle in gewissen Anwendungsfällen zutreffendere Resultate als der Mensch liefern. Die beeindruckende Performance, zukünftige technologische Entwicklungen und das breite Anwendungsgebiet führen in Zukunft noch zu einigen Meilensteinen. Schon heute können mit Deep Learning Objekte auf Videos in Real-Time erkennen.

Modulübersicht

In diesem Modul gibt es zuerst eine kurze Einführung in die digitale Bildverarbeitung mit Python. Danach vermitteln wir dir die Grundlagen der Convolutional Neuronal Networks (CNNs) und fokussieren darauf, wie Bilddaten mit Hilfe CNNs interpretiert werden. Im Anschluss beschäftigst du dich mit dem Anwendungsfall «Image Classification» (eine oder mehrere Klassen), bei welchem Bilder in Kategorien eingeteilt werden (z.B. Hund oder Katze defektes oder nicht defektes Bauteil, Erkennen von Blumenarten / Hunderassen usw.). Dazu werden wir dir die gängigsten vortrainierten Modelle und Architekturen vorstellen. Du lernst, wie die fürs Training verwendeten Bilddaten vorbereitet werden müssen sowie auch, wie ein Modell trainiert und evaluiert wird. Zudem werden Techniken wie Regularisierung, Image Augmentation oder Hyperparameter Tuning angewendet, um das Modell zu verbessern. Neben dem Trainieren eines komplett neuen Modells lernst du auch, wie ein bereits trainiertes Modell auf einen neuen Anwendungsfall angewendet werden kann (Transfer Learning) .

Du wirst zudem Architekturen für die «Object Detection» und «Semantic Segmentation» kennenlernen und mit ausgewählten Architekturen selbst Modelle trainieren. Im Vergleich zur Bildklassifizierung wird bei der Objekterkennung ein bestimmtes Objekt in einem Bild lokalisiert. Dadurch kann das gleiche Objekt mehrfach in einem Bild gefunden werden oder verschieden Objekte können aus einem Bild extrahiert werden. Bei der semantischen Segmentierung werden die genauen Umrisse eines Objektes gefunden.

Ein wichtiger Bestandteil dieses Moduls ist es, dass du lernst, wie du Modelle auf eigenen Daten trainieren und verbessern kannst. Dazu wird es praktische Übungen in Python geben.

Lernziele

Du kennst verschiedene Anwendungsfälle für Computer Vision.
Du kannst Bilddaten so aufbereiten, damit sich diese für das Training von CNNs eignen.
Du kennst die Funktionsweise von CNN und verschiedene CNN Architekturen.
Du kannst ein neuronales Netzwerk auf der Basis von CNNs für Image Classifications Tasks.
Du kannst dein trainiertes Modell sauber evaluieren und weisst, wie du Overfitting erkennen und dem Problem begegnen kannst.
Du kannst dein Modell durch Anwendung von Hyperparameter Tuning und weiteren Techniken wie Regularisierung oder Image Augmentation ihr Modell.
Du kannst erklären, wie Transfer Learning.
Du kannst ein bereits vorhandenes Modell mit Hilfe von Transfer Learning auf ein neues Anwendungsgebiet übertragen.
Du kannst die grundlegenden Deep Learning Architekturen von «Object Detection» und «Sematic Segmentation» und kannst einzelne davon auf Bilddaten.
Du hast Praxiserfahrung im Trainieren von CNNs und eigenen Bilddaten (TensorFlow und Torchvision).

Technologien

Python 3.11
TensorFlow
Torchvision

Erwartete Vorkenntnisse

Du verfügst über Python-Grundkenntnisse.
Du bist mit den Grundlagen von neuronalen Netzwerken vertraut.

Kursvorbereitungen

Du musst die erforderliche Software installieren sowie einen einleitenden Artikel lesen.
Bitte plane etwa 8 Stunden für die Vorbereitung.

Weitere Informationen

Abschluss

Du erhältst in jedem Fall eine Teilnahmebestätigung. Falls du in der festgelegten Leistungsbeurteilung mindestens eine genügende Leistung erbringst, erhältst du einen Nachweis, dass du das Modul erfolgreich bestanden hast.

Teilnehmenden des DAS- oder MAS-Data-Science-Weiterbildungslehrgangs werden die entsprechenden ETCS-Punkte angerechnet.

Unterrichtstage

24.10.2025
25.10.2025
1.11.2025
5.12.2025

Mindestteilnehmerzahl

8 Teilnehmende

Kosten

CHF 1800.–

Downloads & weitere Informationen

Programm-Reglement Weiterbildung Data Science

Unsere nächsten
Infoanlässe
Jetzt anmelden!

Modul: Computer Vision mit Deep Learning

Eckdaten

Modulübersicht

Weitere Informationen

Downloads & weitere Informationen

Hochschule für Informatik FHNW, Brugg-Windisch

Unsere nächsten Infoanlässe Jetzt anmelden!

Modul: Computer Vision mit Deep Learning

Eckdaten

Modulübersicht

Weitere Informationen

Downloads & weitere Informationen

Hochschule für Informatik FHNW, Brugg-Windisch

Unsere nächsten
Infoanlässe
Jetzt anmelden!