Maschinelles Lernen von Aktionen
Autoren
Mehr zum Buch
Bei bestimmten Problemen müssen Aktionen in Abhängigkeit von der aktuellen Situation ausgewählt werden. Manchmal lassen sich diese Aktionen auf analytischem Weg nur schwer bestimmen. Hier bietet sich der Einsatz von Reinforcement Learning Algorithmen an. Dabei wird dem Computer kein Lösungsweg vorgegeben. Er erhält lediglich Belohnungs- oder Bestrafungssignale. Bei komplexeren Problemen ist die Anzahl der möglichen Situationen jedoch so großdass über verschiedene Situationen generalisiert werden muss und Funktionsapproximatoren eingesetzt werden müssen. Da sich die zu approximierenden Funktionen während des Lernprozesses verändernist es wünschenswertden Approximator möglichst adaptiv zu gestalten. Das vorliegende Buch beschreibt einen solchen adaptiven Approximator auf der Basis von Selbstorganisierenden Karten. Die Anwendung des Approximators zum Lernen von diskreten Aktionen und kontinuierlichen Aktionswerten wird anhand von verschiedenen Beispielen demonstriert. Das Buch wendet sich in erster Linie an Forscher und Entwicklerspricht aber mit Einleitungskapiteln über Reinforcement Learning und Selbstorganisierende Karten auch interessierte Neulinge an.