Schönberger, Alex (2016)
Abschätzung der Leistungssteigerung durch 3D-DRAM und Evaluation einer lokalitätsbasierten Architektur.
Technische Universität Darmstadt
Dissertation, Erstveröffentlichung
Kurzbeschreibung (Abstract)
Das Speichersystem moderner Rechner ist in den meisten Fällen aus mehreren heterogenen Komponenten aufgebaut. Dabei bilden diese Komponenten eine Hierarchie, deren Ebenen sich durch wachsende Speicherkapazität und gleichzeitig zunehmende Zugriffszeit unterscheiden. Eine dieser Ebenen ist DRAM. Dieser Speicher ist in der Lage mehrere Gigabytes an Informationen aufzunehmen, wobei seine Leistungsfähigkeit gegenüber der CPU um bis zu vier Größenordnungen geringer ist. Diese Differenz in der Leistungsfähigkeit wird als "memory wall" bezeichnet und erfordert zusätzliche Maßnahmen im Gesamtsystem. Ein weiterer Zweig der Technologie der integrierten Schaltungen stellt die Stapeltechnik dar. Dabei können mehrere Halbleiterschichten übereinander gestapelt werden. Fortschritte in dieser Technologie, die es erlauben, Zwischenverbindungen innerhalb der Schichten in großer Zahl und an beliebiger Stelle zu platzieren, könnten eine Alternative für diese Maßnahmen bilden und so die Leistungsfähigkeit des Gesamtsystems steigern. Inwiefern es möglich ist und wie stark die Verbesserungen sein könnten, ist Gegenstand der Untersuchungen dieser Arbeit.
Die entscheidende Größe für die Leistungsfähigkeit eines Systems ist die Ausführungszeit einer Applikation. Dabei benötigt diese Ausführung eine bestimmte Anzahl von Taktzyklen. Wenn jeder Speicherzugriff innerhalb eines Taktes ausgeführt werden kann, dann liegt ein idealer Speicher vor und die benötigte Ausführungszeit stellt eine Obergrenze für mögliche Verbesserungen am Speichersystem dar. Innerhalb der Speicherhierarchie bildet die oberste Ebene mit der geringsten Kapazität das Verhalten eines idealen Speichers ab. An diesen Verhältnissen hat sich seit Beginn der Zunahme der Integrationsdichte von digitalen Schaltungen nichts Grundlegendes verändert. Der Schlüssel für den Erfolg dieser Lösung liegt in einer Eigenschaft, wie die CPU den Speicher während der Ausführung nutzt. Manche Instruktionen und Daten werden im Vergleich zu anderen sehr viel häufiger gebraucht. Diesen Zusammenhang, besser bekannt als Lokalitätsprinzip, hatte Denning bereits 1968 beschrieben und damit den Weg für den erfolgreichen Einsatz vom Pufferspeicher geebnet.
Der physikalische Aufbau eines DRAM bietet durchaus Ansätze, um die Leistungsfähigkeit zu steigern, es sind vielmehr wirtschaftliche Aspekte, die dieser Entwicklung im Weg stehen. Zudem führt das Lokalitätsprinzip dazu, dass diese Steigerungen nur im geringen Maße das Gesamtsystem beeinflussen. Der untersuchte Lösungsansatz dieser Arbeit kombiniert diese beiden Erkenntnisse. Die Stapeltechnik erlaubt es die DRAM-Architektur um eine Schicht zu ergänzen, die einerseits auf Latenz optimiert ist und andererseits häufig genutzte Daten enthält. Die Platzierung erfolgt per Software.
Für die Untersuchungen wird ein allgemeines, auf keine speziellen Aufgaben zugeschnittenes System verwendet. Es werden sowohl Einkern- als auch Mehrkernarchitekturen betrachtet. Als Testapplikationen werden Implementierungen von unterschiedlichen Kompressionsalgorithmen verwendet. Für die Ausführung werden sowohl die Eingabedaten als auch ihre Menge variiert, um unter anderem den Einfluss des Pufferspeichers zu erkennen und aus der Untersuchung möglichst herauszunehmen. Darüber hinaus wird das Potential der Leistungssteigerung durch Stapeltechnik mittels künstlicher Manipulation der Lokalität geschätzt. Als ein Gegenbeweis wird zudem der volumenbasierte Ansatz ausgewertet.
Die Untersuchungen zeigen, dass die Stapeltechnik durchaus in der Lage ist, die Leistungsfähigkeit des Systems zu steigern. Die Vorteile dieser Technik liegen aber nicht primär in höherer Leistung, da die "memory wall" für das Gesamtsystem nur eine geringe Rolle spielt. Der vorgeschlagene Ansatz zeigt bessere Resultate als Vergleichsmessungen, der Grad der Verbesserung ist aber stark applikationsabhängig und dessen Auswirkungen auf das Gesamtsystem hängen von der Taktfrequenz ab.
Typ des Eintrags: | Dissertation | ||||
---|---|---|---|---|---|
Erschienen: | 2016 | ||||
Autor(en): | Schönberger, Alex | ||||
Art des Eintrags: | Erstveröffentlichung | ||||
Titel: | Abschätzung der Leistungssteigerung durch 3D-DRAM und Evaluation einer lokalitätsbasierten Architektur | ||||
Sprache: | Deutsch | ||||
Referenten: | Hofmann, Prof. Klaus ; Becker, Prof. Jürgen | ||||
Publikationsjahr: | 2016 | ||||
Ort: | Darmstadt | ||||
Datum der mündlichen Prüfung: | 10 Juni 2016 | ||||
URL / URN: | http://tuprints.ulb.tu-darmstadt.de/5551 | ||||
Kurzbeschreibung (Abstract): | Das Speichersystem moderner Rechner ist in den meisten Fällen aus mehreren heterogenen Komponenten aufgebaut. Dabei bilden diese Komponenten eine Hierarchie, deren Ebenen sich durch wachsende Speicherkapazität und gleichzeitig zunehmende Zugriffszeit unterscheiden. Eine dieser Ebenen ist DRAM. Dieser Speicher ist in der Lage mehrere Gigabytes an Informationen aufzunehmen, wobei seine Leistungsfähigkeit gegenüber der CPU um bis zu vier Größenordnungen geringer ist. Diese Differenz in der Leistungsfähigkeit wird als "memory wall" bezeichnet und erfordert zusätzliche Maßnahmen im Gesamtsystem. Ein weiterer Zweig der Technologie der integrierten Schaltungen stellt die Stapeltechnik dar. Dabei können mehrere Halbleiterschichten übereinander gestapelt werden. Fortschritte in dieser Technologie, die es erlauben, Zwischenverbindungen innerhalb der Schichten in großer Zahl und an beliebiger Stelle zu platzieren, könnten eine Alternative für diese Maßnahmen bilden und so die Leistungsfähigkeit des Gesamtsystems steigern. Inwiefern es möglich ist und wie stark die Verbesserungen sein könnten, ist Gegenstand der Untersuchungen dieser Arbeit. Die entscheidende Größe für die Leistungsfähigkeit eines Systems ist die Ausführungszeit einer Applikation. Dabei benötigt diese Ausführung eine bestimmte Anzahl von Taktzyklen. Wenn jeder Speicherzugriff innerhalb eines Taktes ausgeführt werden kann, dann liegt ein idealer Speicher vor und die benötigte Ausführungszeit stellt eine Obergrenze für mögliche Verbesserungen am Speichersystem dar. Innerhalb der Speicherhierarchie bildet die oberste Ebene mit der geringsten Kapazität das Verhalten eines idealen Speichers ab. An diesen Verhältnissen hat sich seit Beginn der Zunahme der Integrationsdichte von digitalen Schaltungen nichts Grundlegendes verändert. Der Schlüssel für den Erfolg dieser Lösung liegt in einer Eigenschaft, wie die CPU den Speicher während der Ausführung nutzt. Manche Instruktionen und Daten werden im Vergleich zu anderen sehr viel häufiger gebraucht. Diesen Zusammenhang, besser bekannt als Lokalitätsprinzip, hatte Denning bereits 1968 beschrieben und damit den Weg für den erfolgreichen Einsatz vom Pufferspeicher geebnet. Der physikalische Aufbau eines DRAM bietet durchaus Ansätze, um die Leistungsfähigkeit zu steigern, es sind vielmehr wirtschaftliche Aspekte, die dieser Entwicklung im Weg stehen. Zudem führt das Lokalitätsprinzip dazu, dass diese Steigerungen nur im geringen Maße das Gesamtsystem beeinflussen. Der untersuchte Lösungsansatz dieser Arbeit kombiniert diese beiden Erkenntnisse. Die Stapeltechnik erlaubt es die DRAM-Architektur um eine Schicht zu ergänzen, die einerseits auf Latenz optimiert ist und andererseits häufig genutzte Daten enthält. Die Platzierung erfolgt per Software. Für die Untersuchungen wird ein allgemeines, auf keine speziellen Aufgaben zugeschnittenes System verwendet. Es werden sowohl Einkern- als auch Mehrkernarchitekturen betrachtet. Als Testapplikationen werden Implementierungen von unterschiedlichen Kompressionsalgorithmen verwendet. Für die Ausführung werden sowohl die Eingabedaten als auch ihre Menge variiert, um unter anderem den Einfluss des Pufferspeichers zu erkennen und aus der Untersuchung möglichst herauszunehmen. Darüber hinaus wird das Potential der Leistungssteigerung durch Stapeltechnik mittels künstlicher Manipulation der Lokalität geschätzt. Als ein Gegenbeweis wird zudem der volumenbasierte Ansatz ausgewertet. Die Untersuchungen zeigen, dass die Stapeltechnik durchaus in der Lage ist, die Leistungsfähigkeit des Systems zu steigern. Die Vorteile dieser Technik liegen aber nicht primär in höherer Leistung, da die "memory wall" für das Gesamtsystem nur eine geringe Rolle spielt. Der vorgeschlagene Ansatz zeigt bessere Resultate als Vergleichsmessungen, der Grad der Verbesserung ist aber stark applikationsabhängig und dessen Auswirkungen auf das Gesamtsystem hängen von der Taktfrequenz ab. |
||||
Alternatives oder übersetztes Abstract: |
|
||||
Freie Schlagworte: | 3D-DRAM, cache | ||||
URN: | urn:nbn:de:tuda-tuprints-55516 | ||||
Sachgruppe der Dewey Dezimalklassifikatin (DDC): | 600 Technik, Medizin, angewandte Wissenschaften > 620 Ingenieurwissenschaften und Maschinenbau | ||||
Fachbereich(e)/-gebiet(e): | 18 Fachbereich Elektrotechnik und Informationstechnik 18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Datentechnik > Integrierte Elektronische Systeme (IES) 18 Fachbereich Elektrotechnik und Informationstechnik > Institut für Datentechnik |
||||
Hinterlegungsdatum: | 17 Jul 2016 19:55 | ||||
Letzte Änderung: | 17 Jul 2016 19:55 | ||||
PPN: | |||||
Referenten: | Hofmann, Prof. Klaus ; Becker, Prof. Jürgen | ||||
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: | 10 Juni 2016 | ||||
Export: | |||||
Suche nach Titel in: | TUfind oder in Google |
Frage zum Eintrag |
Optionen (nur für Redakteure)
Redaktionelle Details anzeigen |