TU Darmstadt
ULB
TUbiblio
Blättern nach Person
Ebene hoch |
Anzahl der Einträge: 2.
Daniel, Christian (2016)
Learning Hierarchical Policies from Human Feedback.
Technische Universität Darmstadt
Dissertation, Erstveröffentlichung
Daniel, Christian ; Hoof, Herke van ; Peters, Jan ; Neumann, Gerhard (2016)
Probabilistic Inference for Determining Options in Reinforcement Learning.
In: Machine Learning, 104 (2-3)
Artikel, Bibliographie