Heim > Backend-Entwicklung > C++ > Wie können wir eine Monte-Carlo-Simulation deoptimieren, um Engpässe in der Intel Sandybridge-Pipeline aufzudecken?

Wie können wir eine Monte-Carlo-Simulation deoptimieren, um Engpässe in der Intel Sandybridge-Pipeline aufzudecken?

Linda Hamilton
Freigeben: 2024-12-09 00:48:10
Original
476 Leute haben es durchsucht

How Can We Deoptimize a Monte Carlo Simulation to Expose Intel Sandybridge Pipeline Bottlenecks?

Deoptimierung eines Programms für die Pipeline in CPUs der Intel Sandybridge-Familie

Das Ziel dieser Aufgabe besteht darin, ein bestimmtes Programm zu modifizieren, um es zu erstellen langsamer laufen, während der gleiche Algorithmus beibehalten wird. Dadurch soll ein tieferes Verständnis dafür erlangt werden, wie die Intel i7-Pipeline funktioniert und wie Befehlspfade neu angeordnet werden können, um Gefahren einzuführen.

Programmübersicht

Das Programm ist eine Monte-Carlo-Simulation, die europäische Vanille-Call- und -Put-Optionen bewertet. Es verwendet den Box-Muller-Algorithmus, um Gaußsche Zufallszahlen zu generieren, und führt eine große Anzahl von Simulationen durch, um die Optionspreise zu schätzen.

Teuflische Inkompetenz

Das Ziel besteht darin, absichtlich Erstellen Sie inkompetenten Code, der die Ausführung des Programms verlangsamt. Hier sind einige Ideen, die diesen Ansatz mit „teuflischer Inkompetenz“ rechtfertigen:

False Sharing

  • Erstellen Sie gemeinsame Datenstrukturen, auf die von mehreren Threads zugegriffen wird, dies aber nicht der Fall ist nicht richtig synchronisiert. Dies kann zu einem Ping-Ponging in der Cache-Zeile und zum Löschen von Fehlspekulationen in der Speicherreihenfolge führen.

Store-Forwarding-Störungen

  • Vermeiden Sie die Verwendung der „-“-Operator für Gleitkommavariablen. Stattdessen wird das High-Byte mit 0x80 XOR-verknüpft, um das Vorzeichenbit umzudrehen, was zu Verzögerungen bei der Speicherweiterleitung führt.

Übermäßige Zeitmessung

  • Zeit für jede Iteration der Hauptschleife mit einer schweren Operation wie CPUID/RDTSC, die Anweisungen serialisiert und blockiert Pipeline.

Ungünstige mathematische Operationen

  • Ersetzen Sie Multiplikationen durch Konstanten durch Divisionen durch ihren Kehrwert („zur leichteren Lesbarkeit“). Die Division ist langsamer und nicht vollständig gepipelinet.

Ineffiziente Vektorisierung

  • Vektorisieren Sie die Multiplikations-/Quadratoperationen mit AVX, verwenden Sie jedoch vzeroupper nicht vor dem Aufruf Skalare Mathematikbibliotheksfunktionen, die einen AVX<>SSE-Übergang verursachen bleibt stehen.

Datenstrukturen

  • Speichern Sie die RNG-Ausgabe in einer verknüpften Liste oder in Arrays, die in der falschen Reihenfolge durchlaufen werden. Machen Sie dasselbe für das Ergebnis jeder Iteration und summieren Sie es am Ende. Dies führt zu Zeigerverfolgungslasten und verhindert die Cache-Lokalität.

Multi-Threading-Missbrauch

  • Multithreading des Programms, aber erzwingen die gemeinsame Nutzung beider Threads den gleichen Schleifenzähler (mit atomaren Inkrementen), um falsches Teilen und Konflikte zu erzeugen. Dies führt auch zu unnötigem Overhead durch die atomaren Operationen.

Weitere Vorschläge

  • Führen Sie unvorhersehbare Verzweigungen ein, um Fehlvorhersagen und Pipeline-Leerungen zu erzeugen.
  • Verwenden Sie teuflisch inkompetente Begründungen, um die Länge von Schleifenabhängigkeitsketten zu erhöhen.
  • Führen Sie nicht zusammenhängende Speicherzugriffsmuster ein um die Cache-Auslastung zu minimieren.
  • Für Extras Credit:Schreiben Sie Ihren eigenen Quadratwurzelalgorithmus, um den in der Aufgabe bereitgestellten zu ersetzen.

Auswirkungen von Änderungen

Diese Änderungen werden voraussichtlich erheblich sein Verlangsamen Sie die Ausführung des Programms, indem Sie Pipeline-Störungen, Cache-Fehler und andere Leistungsengpässe verursachen. Die Aufgabe fördert die Kreativität und die Bereitschaft, verschiedene Methoden zur Pessimierung des Codes zu erkunden und dabei den ursprünglichen Algorithmus beizubehalten.

Das obige ist der detaillierte Inhalt vonWie können wir eine Monte-Carlo-Simulation deoptimieren, um Engpässe in der Intel Sandybridge-Pipeline aufzudecken?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage