Lerne praxisnah zeitgemässe NLP-Verfahren und erfahre, wie vortrainierte Modelle mit Prompting-Techniken und Fine Tuning für Retrieval Augmented Generation (RAG) eingesetzt werden können, um eigene NLP-Projekte erfolgreich umzusetzen.
Daten fungieren als wertvolle Ressource in unserer modernen Informationsgesellschaft. Dabei machen unstrukturierte Textdaten den Grossteil dieser Daten aus. Natural Language Processing (NLP) macht solche unstrukturierten Daten für Computer interpretierbar und ermöglicht das maschinelle Prozessieren der in den Daten enthaltenen Informationen. NLP ist somit ein wichtiger Bestandteil des heutigen Informationszeitalters und birgt grosses Potenzial, einen Mehrwert für Unternehmen zu generieren.
Modulübersicht
Das Modul vermittelt moderne NLP-Verfahren und deren praktische Anwendung in verschiedenen Use-Cases, sodass du nach Abschluss des Moduls eigene NLP-Projekte realisieren kannst.
Du frischst dein Wissen über Vektor-Repräsentationen von Dokumenten auf und lernst verschiedene Netzwerkarchitekturen kennen. Diese reichen von Recurrent Neural Networks (RNN) und Convolutional Neural Networks (CNN) bis hin zu modernen Attention-Mechanismen und Transformer-Architekturen, welche das Fundament der aktuellen Large Language Models (LLM) bilden.
Du lernst, wie vortrainierte Modelle auf neue Problemstellungen angewendet werden können. Du bist in der Lage, jeweils Vor- und Nachteile wie auch die Anwendungsfälle der verschiedenen Modelle zu beurteilen. Zudem erfährst du, wie LLMs mittels Prompting-Techniken und Fine Tuning für gängige Applikationen wie Retrieval Augmented Generation (RAG) eingesetzt werden können.
Neben der Verarbeitung von Textdaten ist auch Acoustic Language Processing (ALP) Teil des Moduls. Hier lernst du, nicht-semantische Informationen wie Emotionen aus gesprochener Sprache zu extrahieren. Ausserdem wird eine Übersicht über NLP Cloud Services und deren Anwendung, beispielsweise für Speech-to-Text, gegeben.
Im ersten Schritt wird jeweils ein grundlegendes Verständnis zu den behandelten NLP-Verfahren und deren Algorithmen vermittelt und im zweiten Schritt wird das erarbeitete Wissen auf ein Praxisbeispiel angewendet und vertieft.
Du kannst einen Textdatensatz mittels explorativer Datenanalyse untersuchen und dir so einen Überblick über den Datensatz verschaffen.
Du weisst, wie Wörter als auch Dokumente als Vektoren abgebildet und wie diese miteinander verglichen werden können.
Du kennst verschiedene Netzwerkarchitekturen von Recurrent Neural Networks (RNN) über Convolutional Neural Networks (CNNs) und moderne Attention-basierte Language Models. Du kannst deren Vor- und Nachteile abschätzen und weisst, wie diese auf Textdaten angewandt werden können.
Du weisst, wie mittels Sequence-to-Sequence (seq2seq)-Modellen variable Inputsequenzen verarbeitet und in variable Outputsequenzen transferiert werden können.
Du verstehst, wie die Transformer-Architektur funktioniert. Du hast einen Überblick über die verschiedenen Transformer-Modelle und kennst deren Vor- und Nachteile.
Du weist, wie vortrainierte Modelle mittels Fine Tuning auf neue Problemstellungen transferiert werden können.
Du hast eine Übersicht über aktuelle Large Language Model Architekturen und verstehst deren Funktionsweise und wie sie mit unterschiedlichen Prompting-Techniken eingesetzt werden.
Du verstehst, wie Unternehmensdaten mittels einem Retrieval Augmented Generation (RAG) Setup mit grossen Sprachmodellen verknüpft werden können, um unternehmensspezifische Informationen zu extrahieren.
Du weisst, wie du ein NLP-Projekt angehst und kannst deine Entscheidung für ein Modell begründen.
Du hast eine Übersicht über NLP Cloud Services und weisst, wie du diese für beispielsweise Speech-to-Text in deine Arbeit einbinden kannst.
Du verstehst die Ansätze von Acoustic Language Processing (ALP) und wie damit nicht-semantische Informationen wie Emotionen aus gesprochener Sprache extrahiert werden.
Python, Scikit-Learn, Tensorflow, Docker
Folgende Vorkenntnisse solltest du mitbringen:
Du verfügst über Python-Grundkenntnisse und kennst Libraries wie Pandas, NumPy und Scikit-Learn.
Du kannst ein einfaches Machine Learning-Modell in Python mit scikit-learn trainieren, evaluieren und anwenden.
Du weisst, was Feedforward Neural Networks sind und wie diese trainiert werden.
Es wird erwartet, dass du vor dem Kursstart:
Eine Google Login erstellst und/oder Docker (möglichst mit GPU Beschleunigung) installiert und getestet hast.
Deine Kenntnisse zu Python, Machine Learning Modellen und Feedforward Neural Networks aufgefrischt hast.
Dich in Tensorflow eingearbeitet hast.
Weitere Informationen
Du erhältst in jedem Fall eine Teilnahmebestätigung. Falls du in der festgelegten Leistungsbeurteilung mindestens eine genügende Leistung erbringst, erhältst du einen Nachweis, dass du das Modul erfolgreich bestanden hast.
Teilnehmenden des DAS- oder MAS-Data-Science-Weiterbildungslehrgangs werden die entsprechenden ETCS-Punkte angerechnet.
Das Modul wird von zwei externen Dozierenden geleitet.