CAS Data Science
Anwendungsorientierte Einführung in Statistik, Machine Learning, Deep Learning, NLP, Zeitreihenanalyse und Empfehlungssysteme
Eckdaten
- Abschluss
- CAS
- ECTS-Punkte
- 15
- Nächster Start
- 23. August 2025
- Dauer
- 21 Kurstage
- Unterrichtstage
- Fr./Sa.
- Unterrichtssprache
- Deutsch, Grundkenntnisse in Englisch essenziell
- Durchführungsort(e)
- Windisch
- Preis
- CHF 7’800
- Semesterstart
- 2x pro Jahr (Frühling & Herbst)
Im Kontext der Artificial Intelligence (AI) spielt Data Science für Unternehmen eine immer wichtigere Rolle. Diese Weiterbildung vermittelt dir die grundlegenden Methoden zur Analyse und Auswertung von Daten: von den Grundlagen wie Lineare Algebra und Statistik über Data Wrangling, Information Visualization und Data Mining bis zu Machine Learning, Deep Learning, NLP, Zeitreihenanalysen und Empfehlungssysteme.
Die Dozierenden legen viel Wert auf eine anwendungsorientierte Vermittlung der theoretischen Inhalte. Theorie wird im Unterricht mit «hands-on» Übungen begleitet, um das gelernte Wissen praktisch anwenden und vertiefen zu können
Melde dich bei der Programmleitung, falls du eine individuelle Beratung wünschst oder wenn du dich mit aktuellen oder ehemaligen Teilnehmenden des Weiterbildungsprogramms CAS Data Science austauschen möchtest.
- Wieso ist Data Science wichtig geworden? Chancen und Risiken
- Einführung in den Begriff Data Science und Big Data. Wie sind sie gebunden?
- Herausforderungen, Limitierungen -> Chancen und Risiken
- Grundaufbau einer Data Science Lösung: Ansätze und Vorgehen
- Beispiele aus Forschung und Wirtschaft
- Einführung in Python und Arbeitsplattform, als Beispiel einer Data-Science-Umgebung
- Vektoren und ihre geometrische Bedeutung
- Matrizen als mathematische Operatoren: Matrizenprodukt, Inverse, Rang, Determinante
- Lösung von linearen Gleichungssystemen mit Matrizen und Vektoren
- Lineare Abbildungen und ihre geometrische Bedeutung
- Eigenwerte, Eigenvektoren und Diagonalisierung symmetrischer Marizen
- Auseinandersetzung mit dem Numpy-Paket für Python
- Einführung Data Mining
- Was bringt Data Mining?
- Die Aufwertungskette des Data Minings - Data Mining an Objektmengen – Market Basket Analysis
- Finden von Assoziationsregeln in Daten
- Data-Mining-Modelle
- Übungen zu den vorgestellten Verfahren
- Deskriptive Statistik
- Zufallsgrössen & Wahrscheinlichkeitsverteilungen
- Statistische Tests
- Prüfen von Erwartungswerten (Parametertests)
- Muster in Daten - was ist das?
- Bewertung von Häufigkeit und Relevanz von Mustern
- Muster in strukturellen Daten (Strings, Trees, Graphs) finden
- Live Demos der Algorithmen an verschiedenen Tools
- Übungen zu den vorgestellten Verfahren
Fortgeschrittene Anwendungen
- Methoden zur Klassifikation
- Logistische Regression
- Naïve Bayes
- Decision Trees, Random Forests
- Support Vector Machines
- Methoden zur Dimensionsreduktion: PCA, NMF
- Clustering: KMeans
- Einführung in Neuronale Netzwerke
- Multi-Layer Perceptron
- Deep Learning Konzepte und Architekturen
- Übersicht ML Projekte in der Praxis
- Übungen mit Jupyter notebooks, pandas, matplotlib, seaborn, scikit-learn, keras
- Einleitung: Wofür visualisieren?
- Daten und grundlegende Grafiken
- Grammar of Graphics
- Visuelle Wahrnehmung und Informationsdesign
- Interaktive Visualisierungssysteme
- Anwendungen in der Praxis
- Ausreisser-Analyse
- Umgang mit unvollständigen / unbalancierten Daten
- Anreicherung von Daten
- Anonymisierung von Daten
- Beschaffung von Daten aus verschiedenen Quellen (API, Web-Crawling, Semantic Web)
- Charakterisierung von Zeitreihen
- Zerlegung in Komponenten, Stationarität
- Modellierung von Zeitreihen als stochastische Prozesse
- Autoregressive Modelle, Autokorrelationsstruktur, Kreuzkorrelationen
- Zeitskalen, Grenzen der Zeitreihenanalyse
- Collaborative Filtering
- Content-based Filtering
- Hybrid-Ansätze
- Übungen mit Jupyter notebook, Google collab
- Schwierigkeiten und Grenzen, Arten der Repräsentation
- Textvorverarbeitung (Tokenization, Stemming, Normalization, Eigennamenerkennung)
- Reguläre Ausdrücke
- Suchmaschinen (BOW Modell, VectorSpace Model, Elasticsearch)
- Textklassifizierung
- Language Models (word2vec, ...)
- Large Language Models (LLMs)
- Retrieval Augmented Generation (RAG)
- mit Übung (benutzte Tools: Jupyter notebook, Google collab)
Studium
Personen mit analytischem Interesse, die sich bereits heute mit Datenverwaltung und -auswertung beschäftigen oder neu Data Science in Python umsetzen möchten.
21 Kurstage jeweils freitags und samstags.
Der Zeitaufwand beträgt total 375 Stunden, das entspricht 15 ECTS-Punkten.
Pro ECTS-Punkt wird mit einem durchschnittlichen Zeitaufwand von 25 Stunden gerechnet. Der CAS Data Science hat einen Umfang von 15 ECTS-Punkten. Deshalb ist mit einem Arbeitsaufwand von 375 Stunden zu rechnen.
Die Hälfte des Zeitaufwands ist dabei für das Selbststudium ausserhalb des Unterrichts für Kursvorbereitungen, Übungen, Repetition des Unterrichtsinhalts, Projektarbeiten und Prüfungsvorbereitungen zu reservieren.
Maximal 20 Personen pro Klasse
Die Aufnahmebedingungen umfassen:
- Personen mit analytischem Interesse, die sich bereits heute schon mit Datenverwaltung und -auswertung beschäftigen oder neu Data Science in Python umsetzen möchten.
- Abschluss einer Fachhochschule, Universität, technischen Hochschule oder eine Berufsausbildung mit Praxiserfahrung. Studierende, die über keinen Hochschulabschluss verfügen, können (sur Dossier) zugelassen werden, wenn sich die Befähigung zur Teilnahme aus einem anderen Nachweis ergibt.
Du arbeitest etwa 40-50% der Kurszeit am eigenen Notebook. Wir stellen dir detaillierte Anleitungen und die benötigten Werkzeuge (Software-Tools) zur Verfügung. Bitte installiere diese vorgängig auf dem Laptop und bring diesen jeweils in den Kurs mit.
Übersicht Weiterbildungsangebote im Bereich Data Science