fwf_umlauf

Gefördertes FWF Einzelprojekt

Der FWF fördert das Projekt "Probabilistisches Maschinelles Lernen " von Nikolaus Umlauf. Das Projekt wird mit der Unterstützung von Johannes Seiler, Stefan Lang and Kenneth Hartgen (ETH Zürich) durchgeführt.

Dieses Projekt zielt darauf ab, die Probleme der Unterernährung von Kindern in Ländern mit niedrigem und mittlerem Einkommen durch probabilistisches maschinelles Lernen besser zu erklären und zur Überwachung der Ziele der nachhaltigen Entwicklung (Sustainable Development Goals, SGD) beizutragen, die auf der Konferenz der Vereinten Nationen über nachhaltige Entwicklung in Rio de Janeiro 2012 vorgeschlagen wurden.

Die neuere Literatur betont die hohe Heterogenität sowohl auf nationaler als auch auf subnationaler Ebene und konzentriert sich auf die Identifizierung von Treibern der Unterernährung mit flexiblen Regressionsmodellen. Obwohl die angewandten Methoden komplexe Modellierungsansätze beinhalten, reichen sie nicht aus, um alle wichtigen Wechselwirkungen zu berücksichtigen, d.h. bestimmte Faktoren bleiben unentdeckt, die einen wesentlichen Beitrag zur Gesamtsituation leisten könnten. Wir streben eine deutliche Verbesserung des Monitorings durch: (a) eine verbesserte Datenbasis und (b) die Entwicklung neuer Algorithmen für Nicht-Standardinteraktionen, die in den Rahmen vollständig probabilistischer Verteilungsregressionsmodelle eingebettet werden.

Die neuartigen Algorithmen werden auf Ideen aus dem maschinellen Lernen basieren, wie z.B. Entscheidungsbäume (und Zufallsentscheidungswälder) und Algorithmen vom Typ stochastischer Gradientenabstieg, die für sehr große Datensätze geeignet sind.

Die vorgestellten Methoden können für eine Vielzahl von Anwendungen eingesetzt werden. Der Modellierungsansatz konzentriert sich auf die Zerlegung in Haupteffekte und (möglicherweise) komplexe, aber interpretierbare Wechselwirkungen. Die neuen Algorithmen sind extrem speichereffizient (einschließlich der Variablenauswahl) und können auf praktisch jede Anzahl von Beobachtungen auf einem herkömmlichen Computer angewendet werden. Mit den bisher entwickelten Methoden ist es nicht möglich, so große probabilistische Modelle zu berechnen. Daher sind die Methoden auch für andere Anwendungen, z.B. im Bereich der Meteorologie, Immobilienmodellierung, Ökologie, Medizin usw., sehr nützlich.

 

 

Nach oben scrollen