Bereits zum dritten Mal in Folge wurde im September 2020 die Data Science Summer School im Rahmen des Masterstudiengangs Data Science ausgerichtet – aufgrund der aktuellen Corona Situation das erste Mal in einem komplett virtuellen Format. Im Rahmen der Data Science Summer School wird das im Studium vermittelte theoretische Data Science Methodenwissen anhand von praktischen Anwendungsfällen verprobt und um kreative Fragetechniken, Visualisierungsformen sowie Story Telling erweitert und vertieft.
Von der Praxisseite konnte mit der Wien Energie ein führender europäischer Energieversorger gewonnen werden, der die Data Science Summer School mit zwei herausfordernden Anwendungsfällen zu Predictive Maintenance und Energie Effizienz inhaltlich versorgt hat. Als Datengrundlage wurden hochfrequente Sensordaten von ausgewählten Gebietsumformern des Wiener Fernwärmenetzes zur Verfügung gestellt.
Damit die Wien Energie jederzeit die Hoheit über die bereitgestellten Daten, die erzeugten Prognosemodelle und die Ergebnisse behält, wurde die KI as a Service Umgebung der LandesCloud eingesetzt – eine Cloud-Plattform, welche im Höchstleistungsrechenzentrum Stuttgart (HLRS) betrieben wird. Mit der LandesCloud wurde den Studierenden die KI Kollaborationsumgebung CROWDiQ sowie die KI Plattform AltaSigma mit den notwendigen Data Science Werkzeugen und Algorithmen zur Verarbeitung der Sensordaten zur Verfügung gestellt. Oberste Prämisse war die Sicherheit der Daten, so dass diese nicht den sicheren Datenraum der LandesCloud verlassen können (z.B. per Download oder per Copy/Paste).
Über die KI Kollaborationsumgebung CROWDiQ wurde die Bearbeitung der Anwendungsfälle seitens der Wien Energie in Form von vier Missionen administriert - pro Mission wurden jeweils 8 Studierende eingeladen und zugeteilt. Neben Details zu den Anwendungsfällen und den dazugehörigen Sensordaten wurden auch die erwarteten Outputs und Analyseziele für die nächsten 5 Tage im Detail aufgeführt.
Am Vormittag des ersten Tages wurde seitens des Professorenteams Prof. Dr. Stefan Ruf und Prof. Dr. Nils Herda der organisatorische Rahmen der ersten virtuellen Data Science Summer School vorgestellt und die Veranstaltung offiziell eröffnet. Im Anschluss präsentierte Ines Lindmeier die einzelnen Arbeitspakete der Predictive Maintenance und Energie Effizienz Anwendungsfälle der Wien Energie. Zum Abschluss des Vormittags wurde von Stefan Weingaertner – Geschäftsführer der LandesCloud GmbH– die virtuelle Arbeitsumgebung der LandesCloud vorgestellt. Punkt 13.00 Uhr wurde über CROWDiQ allen Teams zeitgleich der Zugriff auf die KI Plattform AltaSigma gewährt, um mit der Bearbeitung der jeweiligen Anwendungsfälle zu starten. Dabei wurde seitens der Studierenden zunächst die Datenqualität der Sensordaten bezüglich Datenlücken, Datenausreißer und Zeitschrittweiten verifiziert.
Am zweiten Tag stand die Integration und Transformation der Sensordaten im Fokus. Dabei wurden in der AltaSigma Plattform Features algorithmenspezifisch abgeleitet und eine erste Plausibilisierung und Konkretisierung der Anwendungsfälle durchgeführt und somit die Grundlage für den folgenden Tag gelegt.
Tag 3 nutzten die Teams, um eine umfassende Exploration, Visualisierung und Deutung der IIoT-Sensordaten in Bezug auf die Zielfragestellung durchzuführen. Dabei wurden innovative Visualisierungstechniken wie z.B. Violin-Plots verwendet, um Eigenschaften verschiedener Betriebszustände mehrdimensional darzustellen.
Am vierten Tag ging es algorithmisch ans Eingemachte. Mit scikit-learn und anderen interessanten Forecasting-Bibliotheken wie Prophet wurden Anomalie-, Klassifikations- und Prognose-Modelle trainiert und evaluiert. Die Ergebnisse wurden von den Teams bezüglich Verwendbarkeit, Praxistauglichkeit und Einsparungspotenzialen plausibilisiert und in Form einer Abschlusspräsentation dokumentiert.
Die Data Science Summer School fand seinen Höhepunkt am fünften und abschließenden Tag: um 9.00 Uhr wurden über CROWDiQ die “Schotten dicht gemacht“, d.h. der Zugriff auf die AltaSigma KI Plattform wurde automatisiert geschlossen und die Bühne eröffnet für die Ergebnispräsentationen der vier Teams. Neben innovativen Methoden und Vorgehensmodellen wurden neue Konzepte zur Monetarisierung des KI-Einsatzes entlang der Anwendungsfälle präsentiert und diskutiert.
Zusammenfassend ist allen Beteiligten ein großes Dankeschön und Lob auszusprechen, dass die Data Science Summer School in diesem Jahr trotz aller Corona-Widrigkeiten virtuell stattfinden konnte und so viele neue Erkenntnisse und nutzstiftende Ergebnisse hervorbringen konnte – virtuelle KI Kollaboration vom Feinsten.