TU Darmstadt
ULB
TUbiblio
Blättern nach Person
Ebene hoch |
Anzahl der Einträge: 2.
Parmas, P. ; Doya, K. ; Rasmussen, C. ; Peters, J. (2018)
PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos.
In: International Conference on Machine Learning
Artikel, Bibliographie
Morimura, T. ; Uchibe, E. ; Yoshimoto, J. ; Peters, J. ; Doya, K. (2010)
Derivatives of Logarithmic Stationary Distributions for Policy Gradient Reinforcement Learning.
In: Neural Computation, 22(2), pp.342-376
Artikel, Bibliographie