Die Bewertung von Risiken und Einschätzung von Entwicklungen der Trinkwasserversorgung unter Einfluss des Klimawandels erfordert zuverlässige Vorhersagen des zukünftigen Pro-Kopf-Trinkwasserbedarf und Wasserdargebot über längere Zeiträume. Es ist naheliegend, dass der Verbrauch von Trinkwasser und Wasserdargebot stark von verschiedenen Umweltaspekten abhängig ist, wie beispielsweise der Temperatur, dem Niederschlag, Anzahl der Sommer und heißen Tagen die direkt vom Klimawandel beeinflusst werden. Derzeit gibt es kein etabliertes mathematisches Modell, welches anhand der begrenzt vorhandenen Messdaten und soziologischen Datenerhebungen zuverlässige Vorhersagen treffen kann. Daher ist das erklärte Ziel unseres Forschungsvorhabens eine Strategie für Maschinelles Lernen (ML) zu entwickeln, die es ermöglicht ML-Modelle zu generieren, welche verlässliche Vorhersagen des Wasserbedarfs und Wasserdargebots im Kontext des Klimawandels erlauben.
Zu den Besonderheiten dieser Challenge für ML-Strategien gehört eine relativ geringe Anzahl an Trainingssamples pro einzelnem, lokalen Wasserversorger. Dies ist unumgänglich, da eine signifikante Anzahl lokaler Wasserversorger den Verbrauch und Dargebot nur monatlich erfasst und oft über keine durchgehende Überwachung der eigenen Datenbank verfügt. Diese lokale Datenknappheit erfordert auf datenarme Anwendungen spezialisierte ML-Modelle.
Eine relativ hohe Anzahl an lokalen Trainingsdatensätzen, welche für diese Aufgabe verwendet werden sollen, macht die Automatisierung des Trainingsprozesses besonders attraktiv. Seit einigen Jahren erfreut sich das Konzept des automatisierten ML (AutoML) steigender Popularität. AutoML konzentriert sich auf die automatische Auswahl von Modellen, die Auswahl von Modellkomponenten, die Hyperparameter-Abstimmung von Modellen und die Bewertung von Modellen. Wir beabsichtigen eine AutoML-Strategie für datenarme Anwendungen zu entwickeln, welche den Fokus auf die Vorhersage des Wasserbedarfs und des Wasserdargebots in Abhängigkeit von Klimaparametern setzt. Mit Hilfe der von AutoML produzierten ML-Modelle wäre es möglich, Einzel- und Ensemblevorhersagen über den Trinkwasserverbrauch und Trinkwasserdargebot bei jedem der lokalen Wasserversorger zu treffen. Für das Training der Modelle sollen Daten von Wasserversorgern aus dem gesamten süddeutschen Raum verwendet werden. Das Ergebnis dieser Arbeit würde es ermöglichen, jedem örtlichen Wasserversorger ein Frühwarnsystem zur Verfügung zu stellen, mit dem Ziel, rechtzeitig bestimmte Maßnahmen für ein besseres Management der Wasserressourcennutzung festzulegen.