TU Darmstadt
ULB
TUbiblio
Blättern nach Person
Ebene hoch |
Anzahl der Einträge: 1.
Artikel
Morimura, T. ; Uchibe, E. ; Yoshimoto, J. ; Peters, J. ; Doya, K. (2010)
Derivatives of Logarithmic Stationary Distributions for Policy Gradient Reinforcement Learning.
In: Neural Computation, 22(2), pp.342-376
Artikel, Bibliographie