Lernen Sie praxisnah zeitgemässe NLP-Verfahren und erfahren Sie, wie vortrainierte Modelle mit Prompting-Techniken und Fine Tuning für Retrieval Augmented Generation (RAG) eingesetzt werden können, um eigene NLP-Projekte erfolgreich umzusetzen.
Daten fungieren als wertvolle Ressource in unserer modernen Informationsgesellschaft. Dabei machen unstrukturierte Textdaten den Grossteil dieser Daten aus. Natural Language Processing (NLP) macht solche unstrukturierten Daten für Computer interpretierbar und ermöglicht das maschinelle Prozessieren der in den Daten enthaltenen Informationen. NLP ist somit ein wichtiger Bestandteil des heutigen Informationszeitalters und birgt grosses Potenzial, einen Mehrwert für Unternehmen zu generieren.
Modulübersicht
Das Modul vermittelt moderne NLP-Verfahren und deren praktische Anwendung in verschiedenen Use-Cases, sodass Sie nach Abschluss des Moduls eigene NLP-Projekte realisieren können.
Sie frischen Ihr Wissen über Vektor-Repräsentationen von Dokumenten auf und lernen verschiedene Netzwerkarchitekturen kennen. Diese reichen von Recurrent Neural Networks (RNN) und Convolutional Neural Networks (CNN) bis hin zu modernen Attention-Mechanismen und Transformer-Architekturen, welche das Fundament der aktuellen Large Language Models (LLM) bilden.
Sie lernen, wie vortrainierte Modelle auf neue Problemstellungen angewendet werden können. Sie sind in der Lage, jeweils Vor- und Nachteile wie auch die Anwendungsfälle der verschiedenen Modelle zu beurteilen. Zudem erfahren Sie, wie LLMs mittels Prompting-Techniken und Fine Tuning für gängige Applikationen wie Retrieval Augmented Generation (RAG) eingesetzt werden können.
Neben der Verarbeitung von Textdaten ist auch Acoustic Language Processing (ALP) Teil des Moduls. Hier lernen Sie, nicht-semantische Informationen wie Emotionen aus gesprochener Sprache zu extrahieren. Ausserdem wird eine Übersicht über NLP Cloud Services und deren Anwendung, beispielsweise für Speech-to-Text, gegeben.
Im ersten Schritt wird jeweils ein grundlegendes Verständnis zu den behandelten NLP-Verfahren und deren Algorithmen vermittelt und im zweiten Schritt wird das erarbeitete Wissen auf ein Praxisbeispiel angewendet und vertieft.
Sie können einen Textdatensatz mittels explorativer Datenanalyse untersuchen und sich so einen Überblick über den Datensatz verschaffen.
Sie wissen, wie Wörter als auch Dokumente als Vektoren abgebildet und wie diese miteinander verglichen werden können.
Sie kennen verschiedene Netzwerkarchitekturen von Recurrent Neural Networks (RNN) über Convolutional Neural Networks (CNNs) und moderne Attention-basierte Language Models. Sie können deren Vor- und Nachteile abschätzen und wissen, wie diese auf Textdaten angewandt werden können.
Sie wissen, wie mittels Sequence-to-Sequence (seq2seq)-Modellen variable Inputsequenzen verarbeitet und in variable Outputsequenzen transferiert werden können.
Sie verstehen, wie die Transformer-Architektur funktioniert. Sie haben einen Überblick über die verschiedenen Transformer-Modelle und kennen deren Vor- und Nachteile.
Sie wissen, wie vortrainierte Modelle mittels Fine Tuning auf neue Problemstellungen transferiert werden können.
Sie haben eine Übersicht über aktuelle Large Language Model Architekturen und verstehen deren Funktionsweise und wie sie mit unterschiedlichen Prompting-Techniken eingesetzt werden.
Sie verstehen, wie Unternehmensdaten mittels einem Retrieval Augmented Generation (RAG) Setup mit grossen Sprachmodellen verknüpft werden können, um unternehmensspezifische Informationen zu extrahieren.
Sie wissen, wie Sie ein NLP-Projekt angehen und können Ihre Entscheidung für ein Modell begründen.
Sie haben eine Übersicht über NLP Cloud Services und wie sie diese für beispielsweise Speech-to-Text in ihre Arbeit einbinden können.
Sie verstehen die Ansätze von Acoustic Language Processing (ALP) und wie damit nicht-semantische Informationen wie Emotionen aus gesprochener Sprache extrahiert werden.
Python, Scikit-Learn, Tensorflow, Docker.
Folgende Vorkenntnisse sollten Sie mitbringen:
Sie verfügen über Python Grundkenntnisse und können Libraries wie Pandas, NumPy und Scikit-Learn.
Sie können ein einfaches Machine Learning Modell in Python mit scikit-learn trainieren, evaluieren und anwenden.
Sie wissen was Feedforward Neural Networks sind und wie diese trainiert werden.
Es wird erwartet, dass Sie vor dem Kursstart:
Eine Google Login erstellt und/oder Docker (möglichst mit GPU Beschleunigung) installiert und getestet haben.
Ihre Kenntnisse zu Python, Machine Learning Modellen und Feedforward Neural Networks aufgefrischt haben.
Sich in Tensorflow eingearbeitet haben.
Weitere Informationen
Sie erhalten in jedem Fall eine Teilnahmebestätigung. Falls Sie in der festgelegten Leistungsbeurteilung mindestens eine genügende Leistung erbringen, erhalten Sie einen Nachweis, dass Sie das Modul erfolgreich bestanden haben.
Teilnehmenden des DAS- oder MAS-Data-Science-Weiterbildungslehrgangs werden die entsprechenden ETCS-Punkte angerechnet.
Das Modul wird von zwei externen Dozierenden geleitet.