TU Darmstadt / ULB / TUbiblio

Distributed optimization methods for N-cluster games

Tatarenko, Tatiana ; Zimmermann, Jan (2023)
Distributed optimization methods for N-cluster games.
In: at - Automatisierungstechnik, 2022, 70 (3)
doi: 10.26083/tuprints-00023282
Artikel, Zweitveröffentlichung, Verlagsversion

WarnungEs ist eine neuere Version dieses Eintrags verfügbar.

Kurzbeschreibung (Abstract)

This work provides methodological approaches to solve convex optimization problems arising in multi-agent systems which can be reformulated in terms of a so called N-cluster game. We consider different settings of information available to each agent in the system. First, we present a centralized algorithm, which requires a central coordinator having full access to information about agents’ actions and gradients of their cost functions, to demonstrate how the standard gradient descent method can be applied to achieve an optimal output in N-cluster games. After that we relax the full information setting and assume that only partial information is available to each agent. Focus lies on the following two cases. In the first case, the agents have access to their gradient functions and are allowed to exchange information with their local neighbors over a communication graph that connects the whole system. In the second case, the agents do not know the functional form of their objectives/gradients and can only access the current values of their objective functions at some query point. Moreover, the agents are allowed to communicate only with their local neighbors within the cluster to which they belong. For both settings we present the convergent optimization procedures and analyse their efficiency in simulations.

Typ des Eintrags: Artikel
Erschienen: 2023
Autor(en): Tatarenko, Tatiana ; Zimmermann, Jan
Art des Eintrags: Zweitveröffentlichung
Titel: Distributed optimization methods for N-cluster games
Sprache: Englisch
Publikationsjahr: 2023
Ort: Darmstadt
Publikationsdatum der Erstveröffentlichung: 2022
Verlag: De Gruyter
Titel der Zeitschrift, Zeitung oder Schriftenreihe: at - Automatisierungstechnik
Jahrgang/Volume einer Zeitschrift: 70
(Heft-)Nummer: 3
DOI: 10.26083/tuprints-00023282
URL / URN: https://tuprints.ulb.tu-darmstadt.de/23282
Zugehörige Links:
Herkunft: Zweitveröffentlichungsservice
Kurzbeschreibung (Abstract):

This work provides methodological approaches to solve convex optimization problems arising in multi-agent systems which can be reformulated in terms of a so called N-cluster game. We consider different settings of information available to each agent in the system. First, we present a centralized algorithm, which requires a central coordinator having full access to information about agents’ actions and gradients of their cost functions, to demonstrate how the standard gradient descent method can be applied to achieve an optimal output in N-cluster games. After that we relax the full information setting and assume that only partial information is available to each agent. Focus lies on the following two cases. In the first case, the agents have access to their gradient functions and are allowed to exchange information with their local neighbors over a communication graph that connects the whole system. In the second case, the agents do not know the functional form of their objectives/gradients and can only access the current values of their objective functions at some query point. Moreover, the agents are allowed to communicate only with their local neighbors within the cluster to which they belong. For both settings we present the convergent optimization procedures and analyse their efficiency in simulations.

Alternatives oder übersetztes Abstract:
Alternatives AbstractSprache

Diese Arbeit stellt methodische Herangehensweisen zur Lösung von konvexen Optimierungsproblemen in Multi-Agenten-Systemen, formuliert als sogenannte Multi-Cluster Spiele, vor. In diesem Zusammenhang beschäftigen wir uns mit unterschiedlichen Aufteilungen von Informationen auf die Agenten. Zunächst stellen wir einen zentralen Algorithmus vor, der einen zentralen Koordinator mit uneingeschränktem Zugang zu den Aktionen der Agenten und den Gradienten ihrer Kostenfunktionen benötigt. Mit diesem Algorithmus soll demonstriert werden, wie die bekannte Methode des Gradientenabstiegs angewendet werden kann, um ein optimales Ergebnis bezüglich des N-Cluster Spiels zu erzeugen. Anschließend relaxieren wir die Annahme von uneingeschränkter Information und nehmen an, dass jedem Agenten nur ein Teil der Gesamtinformationen zur Verfügung steht. Hierbei liegt der Fokus auf den folgenden zwei Fällen. Im ersten Fall haben die Agenten Zugang zu den Gradienten ihrer eigenen Funktionen und Informationen können über einen das gesamte System vernetzenden Kommunikationsgraphen mit den direkten Nachbarn ausgetauscht werden. Im zweiten Fall kennen die Agenten die funktionale Form ihrer eigenen Zielfunktionen/Gradienten nicht und können den aktuellen Wert ihrer Zielfunktion nur an bestimmten Punkten abfragen. Zusätzlich ist es den Agenten nur erlaubt, Informationen mit den Agenten des eigenen Clusters auszutauschen. Für beide Fälle stellen wir konvergierende Optimierungsprozesse vor und analysieren deren Effizienz in Simulationen.

Deutsch
Freie Schlagworte: multi-agent systems, distributed optimization, game theory, discrete-time methods, Multi-Agenten-Systeme, verteilte Optimierung, Spieltheorie, zeitdiskrete Methoden
Status: Verlagsversion
URN: urn:nbn:de:tuda-tuprints-232823
Sachgruppe der Dewey Dezimalklassifikatin (DDC): 600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften und Maschinenbau
Fachbereich(e)/-gebiet(e): 18 Fachbereich Elektrotechnik und Informationstechnik
18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Automatisierungstechnik und Mechatronik
18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Automatisierungstechnik und Mechatronik > Regelungsmethoden und Intelligente Systeme
Hinterlegungsdatum: 28 Feb 2023 10:24
Letzte Änderung: 06 Mär 2023 12:31
PPN:
Export:
Suche nach Titel in: TUfind oder in Google

Verfügbare Versionen dieses Eintrags

Frage zum Eintrag Frage zum Eintrag

Optionen (nur für Redakteure)
Redaktionelle Details anzeigen Redaktionelle Details anzeigen