CAS Data Science

    Anwendungsorientierte Einführung in Statistik, Machine Learning, Deep Learning, NLP, Zeitreihenanalyse und Empfehlungssysteme

    Eckdaten

    Abschluss
    CAS
    ECTS-Punkte
    15
    Nächster Start
    23. August 2025
    Dauer
    21 Kurstage
    Unterrichtstage
    Fr./Sa.
    Unterrichtssprache
    Deutsch, Grundkenntnisse in Englisch essenziell
    Durchführungsort(e)
    Windisch
    Preis
    CHF 7’800
    Semesterstart
    2x pro Jahr (Frühling & Herbst)

    Mobile navi goes here!

    Im Kontext der Artificial Intelligence (AI) spielt Data Science für Unternehmen eine immer wichtigere Rolle.  Diese Weiterbildung vermittelt dir die grundlegenden Methoden zur Analyse und Auswertung von Daten: von den Grundlagen wie Lineare Algebra und Statistik über Data Wrangling, Information Visualization und Data Mining bis zu Machine Learning, Deep Learning, NLP, Zeitreihenanalysen und Empfehlungssysteme.

    Die Dozierenden legen viel Wert auf eine anwendungsorientierte Vermittlung der theoretischen Inhalte. Theorie wird im Unterricht mit «hands-on» Übungen begleitet, um das gelernte Wissen praktisch anwenden und vertiefen zu können

    Melde dich bei der Programmleitung, falls du eine individuelle Beratung wünschst oder wenn du dich mit aktuellen oder ehemaligen Teilnehmenden des Weiterbildungsprogramms CAS Data Science austauschen möchtest.

    Modulübersicht

    • Wieso ist Data Science wichtig geworden? Chancen und Risiken
    • Einführung in den Begriff Data Science und Big Data. Wie sind sie gebunden?
    • Herausforderungen, Limitierungen -> Chancen und Risiken
    • Grundaufbau einer Data Science Lösung: Ansätze und Vorgehen
    • Beispiele aus Forschung und Wirtschaft
    • Einführung in Python und Arbeitsplattform, als Beispiel einer Data-Science-Umgebung
    • Vektoren und ihre geometrische Bedeutung
    • Matrizen als mathematische Operatoren: Matrizenprodukt, Inverse, Rang, Determinante
    • Lösung von linearen Gleichungssystemen mit Matrizen und Vektoren
    • Lineare Abbildungen und ihre geometrische Bedeutung
    • Eigenwerte, Eigenvektoren und Diagonalisierung symmetrischer Marizen
    • Auseinandersetzung mit dem Numpy-Paket für Python
    • Einführung Data Mining
      - Was bringt Data Mining?
      - Die Aufwertungskette des Data Minings
    • Data Mining an Objektmengen – Market Basket Analysis
    • Finden von Assoziationsregeln in Daten
    • Data-Mining-Modelle
    • Übungen zu den vorgestellten Verfahren
    • Deskriptive Statistik
    • Zufallsgrössen & Wahrscheinlichkeitsverteilungen
    • Statistische Tests
    • Prüfen von Erwartungswerten (Parametertests)

    Grundlagen

    • Muster in Daten - was ist das?
    • Bewertung von Häufigkeit und Relevanz von Mustern
    • Muster in strukturellen Daten (Strings, Trees, Graphs) finden
    • Live Demos der Algorithmen an verschiedenen Tools
    • Übungen zu den vorgestellten Verfahren

    Fortgeschrittene Anwendungen

    • Methoden zur Klassifikation
    • Logistische Regression
    • Naïve Bayes
    • Decision Trees, Random Forests
    • Support Vector Machines
    • Methoden zur Dimensionsreduktion: PCA, NMF
    • Clustering: KMeans
    • Einführung in Neuronale Netzwerke
    • Multi-Layer Perceptron
    • Deep Learning Konzepte und Architekturen
    • Übersicht ML Projekte in der Praxis
    • Übungen mit Jupyter notebooks, pandas, matplotlib, seaborn, scikit-learn, keras
    • Einleitung: Wofür visualisieren?
    • Daten und grundlegende Grafiken
    • Grammar of Graphics
    • Visuelle Wahrnehmung und Informationsdesign
    • Interaktive Visualisierungssysteme
    • Anwendungen in der Praxis
    • Ausreisser-Analyse
    • Umgang mit unvollständigen / unbalancierten Daten
    • Anreicherung von Daten
    • Anonymisierung von Daten
    • Beschaffung von Daten aus verschiedenen Quellen (API, Web-Crawling, Semantic Web)
    • Charakterisierung von Zeitreihen
    • Zerlegung in Komponenten, Stationarität
    • Modellierung von Zeitreihen als stochastische Prozesse
    • Autoregressive Modelle, Autokorrelationsstruktur, Kreuzkorrelationen
    • Zeitskalen, Grenzen der Zeitreihenanalyse
    • Collaborative Filtering
    • Content-based Filtering
    • Hybrid-Ansätze
    • Übungen mit Jupyter notebook, Google collab
    • Schwierigkeiten und Grenzen, Arten der Repräsentation
    • Textvorverarbeitung (Tokenization, Stemming, Normalization, Eigennamenerkennung)
    • Reguläre Ausdrücke
    • Suchmaschinen (BOW Modell, VectorSpace Model, Elasticsearch)
    • Textklassifizierung
    • Language Models (word2vec, ...)
    • Large Language Models (LLMs)
    • Retrieval Augmented Generation (RAG)
    • mit Übung (benutzte Tools: Jupyter notebook, Google collab)

    Studium

    Personen mit analytischem Interesse, die sich bereits heute mit Datenverwaltung und -auswertung beschäftigen oder neu Data Science in Python umsetzen möchten.

    21 Kurstage jeweils freitags und samstags.
    Der Zeitaufwand beträgt total 375 Stunden, das entspricht 15 ECTS-Punkten.

    Pro ECTS-Punkt wird mit einem durchschnittlichen Zeitaufwand von 25 Stunden gerechnet. Der CAS Data Science hat einen Umfang von 15 ECTS-Punkten. Deshalb ist mit einem Arbeitsaufwand von 375 Stunden zu rechnen.

    Die Hälfte des Zeitaufwands ist dabei für das Selbststudium ausserhalb des Unterrichts für Kursvorbereitungen, Übungen, Repetition des Unterrichtsinhalts, Projektarbeiten und Prüfungsvorbereitungen zu reservieren.

    Maximal 20 Personen pro Klasse

    Die Aufnahmebedingungen umfassen:

    • Personen mit analytischem Interesse, die sich bereits heute schon mit Datenverwaltung und -auswertung beschäftigen oder neu Data Science in Python umsetzen möchten.
    • Abschluss einer Fachhochschule, Universität, technischen Hochschule oder eine Berufsausbildung mit Praxiserfahrung. Studierende, die über keinen Hochschulabschluss verfügen, können (sur Dossier) zugelassen werden, wenn sich die Befähigung zur Teilnahme aus einem anderen Nachweis ergibt.

    Du arbeitest etwa 40-50% der Kurszeit am eigenen Notebook. Wir stellen dir detaillierte Anleitungen und die benötigten Werkzeuge (Software-Tools) zur Verfügung. Bitte installiere diese vorgängig auf dem Laptop und bring diesen jeweils in den Kurs mit.

    Übersicht Weiterbildungsangebote im Bereich Data Science

    laden

    Downloads

    Durchführungsort

    Hochschule für Informatik FHNW, Brugg-Windisch

    Fachhochschule Nordwestschweiz FHNW
    Hochschule für Informatik

    Bahnhofstrasse 6

    5210 Windisch