Pilotprojekt Künstliche Intelligenz für die Arealstatistik der Schweiz
Im Rahmen des Projekts wird ein Software Workflow konzipiert und als Prototyp implementiert, der Klassifikationsentscheidungen für die Stichprobenpunkte der Arealstatistik mittels modernster Methoden des Maschinellen Lernens aus Deep Neural Networks und Random Forests herbeiführt.
Within this project, a software workflow will be designed and implemented, with the objective to provide a data driven land use / land cover classification for the area statistics of Switzerland. The resulting prototype is based on state-of-the-art machine learning methods from Deep Neural Networks and Random Forests.
Zusammenfassung
Das Bundesamt für Statistik (BFS) klassifiziert im Rhythmus von ca. 6 Jahren die Bodennutzung und -bedeckung der Schweiz anhand von Luftbildern mit ca. 4.2 Mio. Stichprobenpunkten im Abstand von jeweils hundert Metern. So wird eine schweizweit einheitliche Arealstatistik erstellt, welche die Datengrundlage für viele öffentliche Planungsentscheidungen darstellt. In einem zeit- und personalintensiven Prozess muss dabei jeder Punkt auf einem Luftbild durch zwei Mitarbeiter jeweils einer von 27 Bodenbedeckungs- und 46 Landnutzungsklassen zugewiesen werden.
Das Institut Geomatik der FHNW konzipiert und implementiert im Rahmen eines Pilotprojekts auf der Grundlage der Dateninnovationsstrategie des BFS in einer Kooperation mit dem GeoTech-Startup ExoLabs GmbH einen Softwareprototypen, der mittels modernster Algorithmen des Maschinellen Lernens und einer Multisensorfusion aus Luft- (RGB, Infrarot, Höhe), Zeitreihen aus multispektralen Satellitenbildern sowie weiteren Datenquellen das Automatisierungspotenzial der Arealstatistik untersucht. Durch eine auf künstlicher Intelligenz basierenden Klassifikation der Stichprobenpunkte soll zukünftig eine deutliche operative Effizienzsteigerung erreicht werden.
Methoden
Der Softwareprototyp führt mittels einer Kombination aus Convolutional Neural Network (CNN) Architektur und Random Forest (RF) Entscheidungsbäumen die automatische Klassifikation der Stichprobenpunkte bezüglich vorgegebener Bodenbedeckungs- (LC) und Landnutzungsklassen (LU) herbei. Hierzu werden die Luftbilder der Swisstopo (SwissImage) in Echtfarben (RGB) und Falschfarbeninfrarot kachelweise durch eine Daten-getriebene Bildanalyse (CNN) prozessiert. Auf Basis der bildbasierten Vorklassifizierung integriert ein Postklassifikator (RF) anschliessend eine Vielzahl weiterer Zusatzdaten, wie etwa Satellitenbild-basierte Zeitreihenindizes, Höhenmodelle, Daten der amtlichen Vermessung oder das Vegetationshöhenmodell der WSL (Eidgenössische Forschungsanstalt für Wald, Schnee und Landschaft).
Ergebnisse
Die umfangreichen und äusserst gut validierten Trainingsdaten aus mehreren Millionen Datenpunkten tragen zusammen mit den komplementären Informationen aus der Multisensorfusion zu zuverlässigen Klassifikationsergebnissen des Prototyps bei. Hierbei unterstützt die flexible und modulare Umsetzung des Software Workflows eine einfache Integration weiterer Informationskanäle und zusätzlicher Stichproben sowie Untersuchungen unterschiedlicher Klassifikationsparadigmen im Rahmen der Arealstatistik.
In ersten Validierungen erreichte der Prototyp reproduzierbare Klassifikationsgenauigkeiten von 85% für Landnutzung (46 Klassen) und 90% für Landbedeckung (27 Klassen). Einzelne umfangreiche Klassen, die einen hohen und monotonen manuellen Arbeitsaufwand zur Erstellung der Arealstatistik erfordern, können sogar mit deutlich höheren Genauigkeiten klassifiziert werden (exemplarische Auswahl):
Anzahl eingesparte Stichproben | Klasse | Genauigkeit | LU/LC |
1,346 Mio (36%) | Gras- und Krautvegetation | >95% | LC |
0,880 Mio (23,5%) | Geschlossene Baumbestände | >95% | LC |
0,006 Mio (0,1%) | Reben | >90% | LC |
0,106 Mio (2,7%) | Gletscher/Firn | >90% | LC |
0,349 Mio (9,3%) | Ackerland | >90% | LU |
1,052 Mio (28%) | Waldbestände | >95% | LU |
0,146 Mio (4%) | Seen und Gewässer | >99% | LU/LC |
Mit diesen Leistungs-Eckdaten kann der Prototyp gewinnbringend und arbeitsunterstützend im Rahmen der Aufgabenstellungen der Arealstatistik eingesetzt werden und so zukünftige Erhebungen beispielsweise in zeitlich und räumlich höheren Auflösungen ermöglichen.
Publikationen
- Jordan D, Lack N, Hochuli S, Meyer AF, Schär M: Automatisierte Klassifizierung der Landnutzung: Deep Learning basierter Ansatz für die Arealstatistik der Schweiz. Geomatik Schweiz 2019; 9: 260-4
- A Novel Approach for Automated LU-LC Classification Using Machine Learning and Multisensor Fusion. In Vorbereitung 2021
- Leuenberger M, Facchinetti C, Meyer A, Milani G: ADELE : Overview of a deep learning application for land use and land cover classification in Switzerland. EGU General Assembly Vienna 2019
- Lutz N: Deep Learning für die Arealstatistik der Schweiz: Ein multimodaler Zugang mit maschinellem Lernen. Bachelor Thesis, Institut Geomatik, Fachhochschule Nordwestschweiz 2019
- Hochuli S: Deep Learning für die Arealstatistik der Schweiz, Bachelor Thesis, Institut Geomatik, Fachhochschule Nordwestschweiz 2018
- Schär M: Einsatz von Deep Learning zur Aktualisierung der Arealstatistik der Schweiz - erste Untersuchungen. Dreiländertagung PFGK. 2. Platz Karl-Kraus-Nachwuchsförderpreises 2018
- Schlussbericht des Projektes für das BFS
Eckdaten des Projekts
Projektlaufzeit: | 08.2018 – 10.2020 |
Projektleiter: | Prof. Dr. Denis Jordan |
Projektmitarbeitende (intern): | Adrian Meyer, Natalie Lack, Nicolas Lutz, Maria Schönholzer |
Projektmitarbeitende (extern, Exolabs): | Dr. Reik Leiterer, Gillian Milani |