Am Institut für Data Science erzeugen wir in Forschungsprojekten eine Vielzahl von Datenprodukten.
Einige davon sind für alle frei zugänglich. Es handelt sich dabei um Datenarchive, Datensets für Machine Learning und Tools, die den Zugriff auf Daten sowie deren Untersuchung und Analyse unterstützen: User Interfaces, Bildverarbeitungs- und Machine-Learning-Algorithmen oder Datenvisualisierungsoftware.
Freie Datenprodukte entstehen beispielsweise im Zusammenhang mit öffentlich finanzierten Forschungsprojekten in der Sonnenphysik. Aber auch Projekte aus den Bereichen Spracherkennung oder Textverarbeitung generieren wissenschaftliche Datenprodukte, die frei für alle verfügbar sind und für weitere Untersuchungen benutzt werden können. Einzige Ausnahmen sind Produkte, bei denen Datenschutzgründe oder Vertraulichkeitsvereinbarungen mit Kundinnen und Kunden dies verhindern.
Frei zugängliche Datenprodukte
Der Swiss Parliaments Corpus (SPC) ist ein automatisch aligniertes Korpus für schweizerdeutsche Spracherkennung. Konkret besteht dieses aus Paaren von schweizerdeutschem Audio und hochdeutschem Text auf Satzlevel. Die aktuelle Version basiert auf öffentlich verfügbaren Daten des Berner Kantonsparlaments und beinhaltet 293 Stunden transkribiertes Audiomaterial.
Funktionalitäten, um Level2-Daten des die Sonne beobachtenden Satelliten IRIS zu lesen und für grosse Datenanwendungen zu verarbeiten. Der IRISreader funktioniert am besten mit einem Jupyter-Notebook.
Daten: GOES-Röntgenfluss, SDO AIA 171, SOHO EIT 171
Zeitspanne: 1981 - heute (nahezu in Echtzeit)
Besonderheit: Die Vorschaubilder sind mit der NASA-Visualisierungsanwendung helioviewer.org verlinkt, um interessante Sonnenereignisse im Detail zu untersuchen
Web-Anwendung: keine Software-Installation erforderlich
Eine App zur Vorhersage der Wahrscheinlichkeit, dass sich in gegebener Zeit ein Sonnenflare ereignen wird. Daten: Magnetogramme (HMI) des Solar Dynamics Observatory SDO
Web-Anwendung: keine Software-Installation erforderlich