TU Darmstadt / ULB / TUbiblio

Mean squared advantage minimization as a consequence of entropic policy improvement regularization

Belousov, B. ; Peters, J. (2018)
Mean squared advantage minimization as a consequence of entropic policy improvement regularization.
The 14th European Workshop on Reinforcement Learning (EWRL 2018). Lille, France (October 1-3, 2018)
Konferenzveröffentlichung, Bibliographie

Typ des Eintrags: Konferenzveröffentlichung
Erschienen: 2018
Autor(en): Belousov, B. ; Peters, J.
Art des Eintrags: Bibliographie
Titel: Mean squared advantage minimization as a consequence of entropic policy improvement regularization
Sprache: Englisch
Publikationsjahr: 2018
Veranstaltungstitel: The 14th European Workshop on Reinforcement Learning (EWRL 2018)
Veranstaltungsort: Lille, France
Veranstaltungsdatum: October 1-3, 2018
URL / URN: https://www.ias.informatik.tu-darmstadt.de/uploads/Team/Bori...
Fachbereich(e)/-gebiet(e): 20 Fachbereich Informatik
20 Fachbereich Informatik > Intelligente Autonome Systeme
Hinterlegungsdatum: 31 Okt 2018 09:34
Letzte Änderung: 31 Okt 2018 09:34
PPN:
Export:
Suche nach Titel in: TUfind oder in Google
Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen