Skip to main content

Modul: Computer Vision mit Deep Learning

Die automatische Interpretation von Bild und Video-Daten hat viele Anwendungsgebiete und liefert dank Deep Learning beeindruckende Ergebnisse.

Eckdaten

ECTS-Punkte
3
Nächster Start
1.11.2024
Dauer
4 Unterrichtstage
Unterrichtssprache
Deutsch
Ort
FHNW Campus Brugg-Windisch
Preis
CHF 1800.–

Computer Vision ist ein Teilgebiet von AI, in welchem der Computer Videos und Bilder «sehen» und interpretieren kann. Es gibt bereits heute viele Anwendungsfälle dafür; hier ein paar Beispiele:

  • Bereits heute können Computer Personen dank der Gesichtserkennung zuverlässig identifizieren.
  • Bilddiagnosen unterstützen in der Medizin Ärzt*innen bei der Erkennung von Krebs.
  • Anhand von Bild- und Video-Daten können defekte Produktionsteile erkannt werden.
  • In Amazon Go Shops gehören Kassen und Warteschlangen der Vergangenheit an. Es wird unter anderem mit Hilfe von Computer Vision automatisch erkannt, welche Person welche Produkte einpackt oder wieder zurückstellt. Nachdem alle benötigten Produkte in der Tasche sind, wird der Laden verlassen und der Einkauf über das Amazon Konto abgerechnet.
  • Die Autoindustrie beschäftigt sich stark mit Computer Vision mit dem Ziel, Objekte wie Personen, Schilder oder Verkehrssignale auf der Strasse zu erkennen, um die Sicherheit zu maximieren oder ferner selbstfahrende Autos zu ermöglichen.

Die Fortschritte in diesem Gebiet sind dank Deep Learning höchst beeindruckend, da diese Modelle in gewissen Anwendungsfällen zutreffendere Resultate als der Mensch liefern. Die beeindruckende Performance, zukünftige technologische Entwicklungen und das breite Anwendungsgebiet führen in Zukunft noch zu einigen Meilensteinen. Schon heute können mit Deep Learning Objekte auf Videos in Real-Time erkennen.

Modulübersicht

In diesem Modul gibt es zuerst eine kurze Einführung in die digitale Bildverarbeitung mit Python. Danach vermitteln wir dir die Grundlagen der Convolutional Neuronal Networks (CNNs) und fokussieren darauf, wie Bilddaten mit Hilfe CNNs interpretiert werden. Im Anschluss beschäftigst du dich mit dem Anwendungsfall «Image Classification» (eine oder mehrere Klassen), bei welchem Bilder in Kategorien eingeteilt werden (z.B. Hund oder Katze defektes oder nicht defektes Bauteil, Erkennen von Blumenarten / Hunderassen usw.). Dazu werden wir dir die gängigsten vortrainierten Modelle und Architekturen vorstellen. Du lernst, wie die fürs Training verwendeten Bilddaten vorbereitet werden müssen sowie auch, wie ein Modell trainiert und evaluiert wird. Zudem werden Techniken wie Regularisierung, Image Augmentation oder Hyperparameter Tuning angewendet, um das Modell zu verbessern. Neben dem Trainieren eines komplett neuen Modells lernst du auch, wie ein bereits trainiertes Modell auf einen neuen Anwendungsfall angewendet werden kann (Transfer Learning) .

Du wirst zudem Architekturen für die «Object Detection» und «Semantic Segmentation» kennenlernen und mit ausgewählten Architekturen selbst Modelle trainieren. Im Vergleich zur Bildklassifizierung wird bei der Objekterkennung ein bestimmtes Objekt in einem Bild lokalisiert. Dadurch kann das gleiche Objekt mehrfach in einem Bild gefunden werden oder verschieden Objekte können aus einem Bild extrahiert werden. Bei der semantischen Segmentierung werden die genauen Umrisse eines Objektes gefunden.

Ein wichtiger Bestandteil dieses Moduls ist es, dass du lernst, wie du Modelle auf eigenen Daten trainieren und verbessern kannst. Dazu wird es praktische Übungen in Python geben.

Weitere Informationen

Downloads & weitere Informationen

Programm-Reglement Weiterbildung Data Science

Diese Seite teilen: