Quantenroboter lernen rascher

14.08.2014

Künstliche Intelligenz wird immer wichtiger. Forscher um Hans Briegel haben nun gezeigt, dass mit Hilfe der Quantenphysik künstliche Agenten rascherEntscheidungen auf der Grundlage früherer Erfahrungen treffen können. Das erlaubt eine quadratische Zunahme der Lerngeschwindigkeit in Situationen, bei denen der Agent seine Umgebung aktiv erkundet.

Roboter und autonome Maschinen übernehmen immer mehr Aufgaben in unserer Gesellschaft. Zukünftige Maschinen sollen zunehmend flexibel sein und auf intelligente Weise arbeiten, so dass sie aus Erfahrungen lernen und selbständig auf Veränderungen in der Umgebung reagieren können. Je komplexer aber die Umgebung wird, umso länger benötigt eine Maschine, eine gegebene Situation mit vergangenen Erfahrungen abzugleichen und so zu einer Handlungsentscheidung zu kommen. „Unser Modell eines Agenten kommt schneller zu einem rationalen Schluss, weil es mit Hilfe der Quantenphysik früher gemachte Erfahrungen gewissermaßen parallel durchforsten kann“, berichtet der Theoretiker Hans Briegel vom Institut für Quantenoptik und Quanteninformation der Österreichischen Akademie der Wissenschaften und vom Institut für Theoretische Physik der Universität Innsbruck. Gemeinsam mit Forschern um Miguel Angel Martin-Delgado vom Institut für Theoretische Physik der Complutense-Universität in Madrid hat seine Gruppe ein Modell für einen künstlichen Agenten entwickelt, das eine Form von Quantenparallelismus ausnutzt.

Projektive Simulation

Bereits vor zwei Jahren hat Hans Briegel ein Modell vorgeschlagen, in dem ein künstlicher Agent Eindrücke aus der Umwelt aufnimmt, diese in einem Gedächtnis verarbeitet und mögliche Handlungsweisen durchspielt. In seinem episodischen und kompositorischen Gedächtnis sind viele einzelne Erfahrungsfragmente gespeichert und netzwerkartig miteinander verbunden. Ist der Agent mit einem neuen Ereignis konfrontiert, werden in einer Zufallsbewegung damit zusammenhängende Erfahrungen abgerufen. Der Erinnerungsweg durch das Gedächtnis wird durch Übergangswahrscheinlichkeiten bestimmt, die vom Agenten aufgrund früherer Erfahrungen selbst modifiziert werden. So lernt die Maschine aus Erfolg und Misserfolg und kann auch selbst fiktive Erfahrungsfragmente erzeugen, die in der Folge wie reale Erfahrungen behandelt werden. Dieses Konzept der projektiven Simulation haben die Wissenschaftler nun mit Prinzipien der Quanteninformationsverarbeitung kombiniert. „Die Zufallsbewegung wird nun von quantenstochastischen Prozessen gesteuert und ermöglicht so ein effizienteres Überprüfen der bisher gelernten Erfahrungsinhalte“, erklärt Nachwuchsforscher Vedran Dunjko. „Deshalb kommt der Quantenagent deutlich schneller - um genauer zu sein quadratisch - schneller zu einer Entscheidung als ein herkömmlich arbeitender Agent.“ In vielen Anwendungen kann dieser Unterschied entscheidend sein, man denke nur an die derzeit heiß diskutierte Vision von selbstfahrenden Autos.

Aktives Lernen

Die Schnelligkeit der Entscheidungsfindung von Agenten ist vor allem für aktives Lernen wichtig. Roboter, die in unbekannten und sich zeitlich ändernden Umgebungen arbeiten, erkunden diese mit ihrem jeweils eigenen Tempo. Schneller entscheidende Agenten kommen deshalb in veränderlichen Umgebungen leichter zu recht und haben mehr Spielraum, Neues auszuprobieren und erfolgreiche Verhaltensmuster zu entwickeln.
Die Anwendung von Methoden der Quantenphysik auf Probleme der künstlichen Intelligenz steckt noch in den Kinderschuhen, betont Hans Briegel. „Die Entwicklung und der Einsatz von autonomen und lernfähigen Systemen in Laboren der Quantenphysik könnte die Forschung in neue und spannende Richtungen lenken.“

Finanziell unterstützt wurde die Forschungsarbeit vom österreichischen Wissenschaftsfonds FWF und der amerikanischen Templeton-Stiftung.