Bestimmen der Funktionsexitzeit mit __gnu_mcount_nc
Bei dem Versuch, Leistungsprofilierungen auf einer eingebetteten Plattform durchzuführen, wurde festgestellt, dass die GCCs - Das pg-Flag fügt beim Eintritt in jede Funktion Thunks in __gnu_mcount_nc ein. Obwohl keine Implementierung von __gnu_mcount_nc ohne weiteres verfügbar ist, haben sich benutzerdefinierte Implementierungen, die den Stack-Frame und die aktuelle Zyklusanzahl aufzeichnen, als nützlich erwiesen, um Aufrufer-/Angerufene-Diagramme zu sammeln und häufig aufgerufene Funktionen zu identifizieren.
Allerdings erfassen sie Informationen über die darin verbrachte Zeit Funktionskörper bleiben eine Herausforderung, die ausschließlich auf Einstiegspunkten basiert. Bestehende Ansätze, wie die Verwaltung eines Schatten-Callstacks und die Manipulation der Rücksprungadresse, führen zu Einschränkungen und Overhead.
Um die Frage nach einer alternativen __gnu_mcount_nc-Implementierung zu beantworten, die die Erfassung von Funktionsexitzeiten ermöglicht, schauen wir uns den tatsächlichen Ansatz an, der von verwendet wird gprof.
Wie gprof die Funktion misst Zeit
Entgegen anfänglichen Annahmen verwendet gprof __gnu_mcount_nc nicht für die zeitliche Steuerung des Ein- oder Ausstiegs von Funktionen. Stattdessen stützt es sich auf die Selbstzeit, die durch das Zählen von PC-Proben in jeder Routine erfasst wird. Diese Stichproben werden dann zusammen mit der Anzahl der Funktionsaufrufe verwendet, um den Anteil der Eigenzeit abzuschätzen, der den Anrufern zugeordnet werden sollte.
Anrufzählung vs. Stack-Sampling
Ein weiterer Ansatz ist das Stack-Sampling, bei dem in regelmäßigen Abständen eine Stichprobe des Stapels erfasst wird. Obwohl es teurer als die PC-Abtastung ist, liefert es genauere Messungen, da es nicht zwischen kurzen und langen Aufrufen unterscheidet und auch nicht durch I/O oder nicht instrumentierte Bibliotheksroutinen beeinflusst wird.
Identifizierung kostspieliger Vorgänge
Der Schlüssel zum Auffinden von Leistungsengpässen liegt in der Analyse roher Stack-Beispiele und deren Zuordnung zum Quellcode. Anstatt sich auf Aufrufdiagramme oder Hotspots zu konzentrieren, kann die Untersuchung einzelner Stack-Beispiele die spezifischen Gründe aufdecken, warum bestimmte Vorgänge viel Zeit in Anspruch nehmen, und mögliche Optimierungen vorschlagen.
Jenseits ausgefallener Visualisierungen
Obwohl Visualisierungen wie Flammendiagramme und Baumkarten optisch ansprechend sein können, versäumen sie es oft, Leistungsprobleme hervorzuheben, die darauf zurückzuführen sind, dass Code mehrmals von verschiedenen Standorten aus aufgerufen wird. Das Aggregieren und Sortieren von Daten nach Funktion statt nur nach Zeit bietet einen umfassenderen Überblick über die Codeausführung.
Fazit
Während __gnu_mcount_nc wertvolle Informationen über Funktionseintrittspunkte liefern kann, sollten alternative Methoden wie Stack-Sampling zur Erfassung von Funktionsausstiegszeiten in Betracht gezogen werden. Durch die Konzentration auf die Analyse tatsächlicher Stack-Beispiele und die Vermeidung von Ablenkungen durch auffällige Visualisierungen können Entwickler Leistungsengpässe effektiv erkennen und Optimierungen implementieren.
Das obige ist der detaillierte Inhalt vonWie können wir die Beendigungszeiten von Funktionen bei der Leistungsprofilerstellung über die Verwendung von „__gnu_mcount_nc' hinaus genau messen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!