Wolfheimer, Felix (2008)
Entwicklung und Evaluierung von Parallelisierungsstrategien für Particle-In-Cell Simulationen auf Multicomputern.
Technische Universität Darmstadt
Dissertation, Erstveröffentlichung
Kurzbeschreibung (Abstract)
Der Particle-In-Cell Algorithmus kann zur numerischen Berechnung der Dynamik von Vielteilchensystemen herangezogen werden, wie sie beispielsweise in der Plasma- und der Beschleunigerphysik auftreten. Für viele praxisrelevante Problemstellungen erfordert eine 3D Simulation jedoch so viele Rechnerressourcen, dass sie auf einem gewöhnlichen Arbeitsplatzrechner nicht durchführbar ist. Unter Rechnerressourcen sind hier der Bedarf an Arbeitsspeicher sowie die Anzahl der Rechenoperationen zu verstehen, welche zur Lösung des Simulationsproblems benötigt werden. Ein Parallelrechner, welcher sich aus mehreren miteinander vernetzten Einzelrechnern zusammensetzt, ein sogenannter Multicomputer, bietet die Möglichkeit diesem Problem zu begegnen und ausreichende Ressourcen zur Lösung derartiger Simulationsprobleme bereitzustellen. Die Nutzung eines Multicomputers erfordert die Parallelisierung der verwendeten Algorithmen, das heißt, dass sämtliche von dem Algorithmus durchzuführende Rechenoperationen den verfügbaren Verarbeitungseinheiten (Prozessoren) des Parallelrechners zugeordnet werden müssen. Ebenso müssen alle während der Simulation erzeugten Daten auf die Speichermodule der Einzelrechner des Multicomputers verteilt werden. Sowohl die Zuordnung der Rechenoperationen als auch diejenige der Simulationsdaten ist entscheidend für eine optimale Nutzung der durch den Parallelrechner zur Verfügung stehenden Ressourcen und entscheidet auch oftmals darüber, ob eine Berechnung überhaupt durchführbar ist. Diese Zuordnung muss vom Programmentwickler unter Berücksichtigung der Architekturmerkmale des Parallelrechners vorgenommen werden. In der vorliegenden Arbeit werden, nach Erläuterung der algorithmischen Grundlagen für Particle-In-Cell Simulationen sowie den Grundlagen des parallelen Rechnens, verschiedene Parallelisierungsstrategien entwickelt, mit deren Hilfe die oben beschriebene Zuordnung für Multicomputer, bestehend aus einer beliebigen Anzahl an Einzelrechnern verschiedener Leistungsfähigkeit, erfolgen kann. Bei einer Parallelisierungsstrategie handelt es sich um einen Algorithmus, welcher für jedes in der Simulation auftretende Datenobjekt eine Prozessorzugehörigkeit liefert, so dass die Rechnerressourcen möglichst gut genutzt werden und somit die benötigte Laufzeit minimiert wird. Das Ziel der Laufzeitminimierung lässt sich, basierend auf einem mathematischen Modell des Parallelrechners sowie des durch die Simulation erzeugten Speicherzugriffsmusters, als diskretes Optimierungsproblem formulieren. Eine exakte Lösung dieses Optimierungsproblems ist für praxisrelevante Problemstellungen jedoch im Allgemeinen nicht praktikabel, da dies zum einen zu einem unvertretbar großen Rechenaufwand führen würde, und zum anderen die mathematischen Modelle für Parallelrechner, auf denen das Optimierungsproblem basiert, keine exakte Vorhersage der zu erwartenden Laufzeiten, sondern nur eine mehr oder weniger grobe Abschätzung derselben liefern können. Bei den entwickelten Parallelisierungsstrategien handelt es sich daher um Heuristiken, die mit geringem Aufwand an Laufzeit eine für praktische Zwecke zufriedenstellende Approximation an die optimale Zuordnung der Daten und Berechnungsoperationen liefern. Die Parallelisierungsstrategien werden so weit wie möglich theoretisch untersucht. Das Verhalten von Implementierungen der Strategien wird anhand von Benchmarkproblemen, welche basierend auf realen Simulationsproblemen aus dem Feld der Beschleunigerphysik entwickelt wurden, auf dem Parallelrechner des Instituts für Theorie Elektromagnetischer Felder der Technischen Universität Darmstadt evaluiert. Die Simulation einer realen Anordnung aus dem Anwendungsfeld der Beschleunigerphysik, welche mit Hilfe der im Rahmen der Arbeit entstandenen Software durchgeführt wurde, schließt die Arbeit ab. Bei diesem Anwendungsbeispiel handelt es sich um die in der Entwicklung befindliche Elektronenquelle für das europäische XFEL~Projekt bei DESY, Hamburg.
Typ des Eintrags: | Dissertation | ||||
---|---|---|---|---|---|
Erschienen: | 2008 | ||||
Autor(en): | Wolfheimer, Felix | ||||
Art des Eintrags: | Erstveröffentlichung | ||||
Titel: | Entwicklung und Evaluierung von Parallelisierungsstrategien für Particle-In-Cell Simulationen auf Multicomputern | ||||
Sprache: | Deutsch | ||||
Referenten: | Weiland, Prof. Dr.- Thomas ; Schäfer, Prof. Dr.- Michael | ||||
Publikationsjahr: | 20 August 2008 | ||||
Ort: | Darmstadt | ||||
Verlag: | Technische Universität | ||||
Datum der mündlichen Prüfung: | 10 Juli 2008 | ||||
URL / URN: | urn:nbn:de:tuda-tuprints-10850 | ||||
Kurzbeschreibung (Abstract): | Der Particle-In-Cell Algorithmus kann zur numerischen Berechnung der Dynamik von Vielteilchensystemen herangezogen werden, wie sie beispielsweise in der Plasma- und der Beschleunigerphysik auftreten. Für viele praxisrelevante Problemstellungen erfordert eine 3D Simulation jedoch so viele Rechnerressourcen, dass sie auf einem gewöhnlichen Arbeitsplatzrechner nicht durchführbar ist. Unter Rechnerressourcen sind hier der Bedarf an Arbeitsspeicher sowie die Anzahl der Rechenoperationen zu verstehen, welche zur Lösung des Simulationsproblems benötigt werden. Ein Parallelrechner, welcher sich aus mehreren miteinander vernetzten Einzelrechnern zusammensetzt, ein sogenannter Multicomputer, bietet die Möglichkeit diesem Problem zu begegnen und ausreichende Ressourcen zur Lösung derartiger Simulationsprobleme bereitzustellen. Die Nutzung eines Multicomputers erfordert die Parallelisierung der verwendeten Algorithmen, das heißt, dass sämtliche von dem Algorithmus durchzuführende Rechenoperationen den verfügbaren Verarbeitungseinheiten (Prozessoren) des Parallelrechners zugeordnet werden müssen. Ebenso müssen alle während der Simulation erzeugten Daten auf die Speichermodule der Einzelrechner des Multicomputers verteilt werden. Sowohl die Zuordnung der Rechenoperationen als auch diejenige der Simulationsdaten ist entscheidend für eine optimale Nutzung der durch den Parallelrechner zur Verfügung stehenden Ressourcen und entscheidet auch oftmals darüber, ob eine Berechnung überhaupt durchführbar ist. Diese Zuordnung muss vom Programmentwickler unter Berücksichtigung der Architekturmerkmale des Parallelrechners vorgenommen werden. In der vorliegenden Arbeit werden, nach Erläuterung der algorithmischen Grundlagen für Particle-In-Cell Simulationen sowie den Grundlagen des parallelen Rechnens, verschiedene Parallelisierungsstrategien entwickelt, mit deren Hilfe die oben beschriebene Zuordnung für Multicomputer, bestehend aus einer beliebigen Anzahl an Einzelrechnern verschiedener Leistungsfähigkeit, erfolgen kann. Bei einer Parallelisierungsstrategie handelt es sich um einen Algorithmus, welcher für jedes in der Simulation auftretende Datenobjekt eine Prozessorzugehörigkeit liefert, so dass die Rechnerressourcen möglichst gut genutzt werden und somit die benötigte Laufzeit minimiert wird. Das Ziel der Laufzeitminimierung lässt sich, basierend auf einem mathematischen Modell des Parallelrechners sowie des durch die Simulation erzeugten Speicherzugriffsmusters, als diskretes Optimierungsproblem formulieren. Eine exakte Lösung dieses Optimierungsproblems ist für praxisrelevante Problemstellungen jedoch im Allgemeinen nicht praktikabel, da dies zum einen zu einem unvertretbar großen Rechenaufwand führen würde, und zum anderen die mathematischen Modelle für Parallelrechner, auf denen das Optimierungsproblem basiert, keine exakte Vorhersage der zu erwartenden Laufzeiten, sondern nur eine mehr oder weniger grobe Abschätzung derselben liefern können. Bei den entwickelten Parallelisierungsstrategien handelt es sich daher um Heuristiken, die mit geringem Aufwand an Laufzeit eine für praktische Zwecke zufriedenstellende Approximation an die optimale Zuordnung der Daten und Berechnungsoperationen liefern. Die Parallelisierungsstrategien werden so weit wie möglich theoretisch untersucht. Das Verhalten von Implementierungen der Strategien wird anhand von Benchmarkproblemen, welche basierend auf realen Simulationsproblemen aus dem Feld der Beschleunigerphysik entwickelt wurden, auf dem Parallelrechner des Instituts für Theorie Elektromagnetischer Felder der Technischen Universität Darmstadt evaluiert. Die Simulation einer realen Anordnung aus dem Anwendungsfeld der Beschleunigerphysik, welche mit Hilfe der im Rahmen der Arbeit entstandenen Software durchgeführt wurde, schließt die Arbeit ab. Bei diesem Anwendungsbeispiel handelt es sich um die in der Entwicklung befindliche Elektronenquelle für das europäische XFEL~Projekt bei DESY, Hamburg. |
||||
Alternatives oder übersetztes Abstract: |
|
||||
Freie Schlagworte: | Parallelisierung Particle-In-Cell Cluster Simulation | ||||
Sachgruppe der Dewey Dezimalklassifikatin (DDC): | 600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften und Maschinenbau 000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik |
||||
Fachbereich(e)/-gebiet(e): | 18 Fachbereich Elektrotechnik und Informationstechnik | ||||
Hinterlegungsdatum: | 17 Okt 2008 09:23 | ||||
Letzte Änderung: | 26 Aug 2018 21:25 | ||||
PPN: | |||||
Referenten: | Weiland, Prof. Dr.- Thomas ; Schäfer, Prof. Dr.- Michael | ||||
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: | 10 Juli 2008 | ||||
Export: | |||||
Suche nach Titel in: | TUfind oder in Google |
Frage zum Eintrag |
Optionen (nur für Redakteure)
Redaktionelle Details anzeigen |