Verbesserung der Überwachung von Drittparteipatenten mit maschinellem Lernen und Natural Language Processing
Die Anwendung moderner NLP-Modelle erhöht die Effizienz der Patentüberwachung durch Dritte in der Ernährungs- und Biowissenschaftsindustrie.
Zielsetzung
Identifizierung relevanter Patente Dritter mit Hilfe von Transformer-basierten Klassifikationsmodellen.
Hintergrund
Jedes Jahr werden weltweit Millionen von Patenten zu einer Vielzahl von Themen veröffentlicht. Patentanmeldungen umfassen in der Regel durchschnittlich etwa 10.000 Wörter und verwenden eine einzigartige, stark kontextabhängige, sorgfältig formulierte Sprache (auch bekannt als «Juristensprache»).
Die Überwachung von Patenten Dritter ist für viele Unternehmen ein entscheidendes Element für die Geschäftsentwicklung und Innovation.
Schlüsselwortbasierte Suchstrategien können dazu beitragen, den Aufwand für das Screening durch Fachexperten zu verringern. Allerdings ist es selbst mit einem stark angepassten Regelwerk schwierig, eine Auswahl zu treffen, die hauptsächlich relevante Patente enthält. Dies führt zu einem erheblichen Zeitaufwand für die manuelle Durchsicht irrelevanter Patentdokumente.
Ergebnisse
Das Institut für Data Science FHNW entwickelte erfolgreich ein transformer-basiertes Klassifikationsmodell, das auf von DSM-Experten annotierten Drittpatenten trainiert wurde. Eine Feldstudie hat gezeigt, dass dieses Modell ein effizienteres Patentscreening ermöglicht und die Arbeitskosten erheblich reduziert. Darüber hinaus ermöglicht das Modell die Erweiterung des Pools der auf Relevanz geprüften Patente und damit die Identifizierung weiterer potenziell relevanter Patente. Auf der Grundlage des PoC-Erfolgs beabsichtigt DSM, die Lösung in einem nächsten Schritt vor Ort zu implementieren.
Information
Auftraggeber | DSM Nutritional Products Ltd. |
Ausführung | Institut für Data Science FHNW |
Dauer | 6 Monate |
Projektteam | Prof. Dr. Daniel Perruchoud, Dr. Fernando Benites, Dominik Frefel, Joshua Meier |
Kontakt
Dozent für Data Science