ホームページ > バックエンド開発 > Golang > golang のパフォーマンス診断については、この記事を読むだけで十分です

golang のパフォーマンス診断については、この記事を読むだけで十分です

リリース: 2023-07-24 16:18:33
転載
1787 人が閲覧しました
私たちは日常的にパフォーマンス診断の問題にさらされていますが、これは一般に 2 つの状況に分けられます。1 つは、オンライン アプリケーションに実際にパフォーマンスの問題があるということです。もう 1 つは、システムのパフォーマンスを推定する必要があるということです。オンラインにする準備ができています。後者にはストレス テストが必要です。補助的な進行状況はここには示されていません。
GO アプリケーションの場合、パフォーマンス診断ツールは主に OS レベルと GO アプリケーション レベルの 2 つの層に分かれています (go tools pprof /trace /gc)


OS 診断


## システム診断では、通常、CPU、メモリ、I/O の 3 つの側面に重点を置きます。

##1.1 CPU

#CPU 診断は、主に負荷平均、CPU 使用率、コンテキスト スイッチに焦点を当てます。一般的に使用される
top
コマンドは、CPU 使用率とサーバー負荷を確認するために使用されます。

平均負荷: 0.14 0.07 0.06 は、それぞれ過去 1 分、5 分、15 分の平均マシン負荷を表します。経験によれば、負荷値が小さい場合は、 0.7*CPU 以上の数値は正常ですが、CPU コア数の 4 ~ 5 倍を超えると、明らかにシステム負荷が高くなります。 golang のパフォーマンス診断については、この記事を読むだけで十分です

CPU コンテキストの切り替えは、

vmstat コマンドを使用して表示できます。コンテキストの切り替えが発生するシナリオは次のとおりです。タイプ:

タイム スライスが使い果たされた場合、CPU は通常、次のタスクをスケジュールします
  1. ## は優先度の高い他のタスクがプリエンプトされます
  2. 実行タスクが I/O ブロックに遭遇すると、現在のタスクは一時停止され、次のタスクに切り替えられます。 task
  3. ユーザー コードは現在のタスクをアクティブに一時停止して、CPU を放棄します
  4. マルチタスクはリソースを使用できないためリソースを占有し、一時停止されました。
  5. #ハードウェア割り込み

##1.2 メモリ

##オペレーティング システムの観点からは、メモリがアプリケーション プロセスに十分であるかどうかに焦点を当てます。free -m コマンドを使用してメモリ使用量を確認できます。
top コマンドを使用すると、プロセスによって使用される仮想メモリ VIRT と物理メモリ RES を表示できます。式 VIRT = SWAP RES に従って、特定のアプリケーションによって使用されるスワップ パーティション (Swap) を計算できます。スワップ パーティションの使用量が多すぎると、アプリケーションのパフォーマンスに影響します。スワップの値をできるだけ小さく調整できます。


##1.3 I/O

I/O にはディスク I/O が含まれますO およびネットワーク I/O、ディスクは一般に I/O ボトルネックになりやすいです。

iostat

を通じてディスクの読み取りおよび書き込みステータスを確認でき、CPU の I/O 待機を通じてディスク I/O が正常かどうかを確認できます。 ディスク I/O が常に高い状態にある場合は、ディスクが遅すぎるか障害があり、パフォーマンスのボトルネックになっていることを意味します。アプリケーションの最適化またはディスクの交換が必要です。 top、ps、vmstat、iostat などの一般的に使用されるコマンドに加えて、mpstat、tcpdump、netstat、pidstat、sar など、システムの問題を診断できる他の Linux ツールもあります。以下に示す Linux パフォーマンス診断ツール:

golang のパフォーマンス診断については、この記事を読むだけで十分です

GO Application Diagnostics


#Go エコシステムは、Go アプリケーションのパフォーマンス問題の解決に役立つ多数の API と診断ツールを提供してきました。私たちが一般的に使用するものは、おおまかに 2 つのカテゴリに分類できます。
##プロファイリングは、プログラム実行中に特定のイベントを収集し、問題の正確な位置を特定しやすくするためにサンプリング統計を収集します。
トレース コードをインストルメント化して、呼び出しまたはユーザー リクエストのライフ サイクル全体のレイテンシーを分析する方法。複数の Go プロセスにまたがることができます。

    #2.1 プロファイリング

    プロファイルは、一般にパフォーマンス分析と呼ばれます。プログラムの場合、CPU 使用率、メモリ状態、スレッド状態など、プログラム実行時のさまざまな概要情報です。高価なプログラムや頻繁に呼び出されるプログラムのシナリオを分析するのに便利です。 #########使い方?
    #1. 最初の プロファイリング コードは

    import _ "net/http/pprof"
    
    
    func main() {
        go func() {
            log.Println(http.ListenAndServe("0.0.0.0:9090", nil))
        }()
        ...
    }
    ログイン後にコピー

    # に埋め込まれています

    #2. ヒープ情報の保存など、特定の時点でプロファイルを保存します。

    curl http://localhost:6060/debug/pprof/heap --output heap.tar.gz
    ログイン後にコピー

    3. go を使用します。上記のヒープ情報の分析など、保存されたプロファイル スナップショットを分析するためのツール pprof

    #
    go tool pprof heap.tar.gz
    ログイン後にコピー

    #2.1. 1 CPU プロファイリング

    pprof は、関数の実行が遅いという問題の分析に役立ちます

    C
    過剰な PU 使用率の問題

    go tool pprof http://localhost:6060/debug/pprof/profile?second=10
    ログイン後にコピー
    コマンド ライン モード: 共通コマンド トップ リスト トレースtop: メモリまたは CPU ごとにソートされた上位 10 個の関数情報を表示use

    flat: 現在の関数が占有する CPU 時間 (

    関数が呼び出す他の関数を除く)

    • flat% : 合計 CPU 時間に対する現在の関数によって使用されている CPU の割合 sum%: 前の各行のフラット パーセンテージの合計

    • cum: 累積量。現在の関数とそのサブ関数が CPU を占有する時間

    • cum%: 累積量は、次の割合を占めます。総量###

    cum>=flat

    list: 查看某个函数的代码 以及该函数每行代码的指标信息

    traces:打印所有函数调用栈 以及调用栈的指标信息

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    UI界面方式:从服务器download下生成的sample文件

    go tool pprof -http=:8080 pprof.xxx.samples.cpu.001.pb.gz
    ログイン後にコピー

    golang のパフォーマンス診断については、この記事を読むだけで十分です


    golang のパフォーマンス診断については、この記事を読むだけで十分です

    Flame graph很清晰得可以看到当前CPU被哪些函数执行栈占用


    1.2 Heap Profiling

    go tool pprof http://localhost:6060/debug/pprof/heap?second=10
    ログイン後にコピー

    命令行 UI查看方式 同理

    golang のパフォーマンス診断については、この記事を読むだけで十分です


    golang のパフォーマンス診断については、この記事を読むだけで十分です



    graph中方框越大 占用内存越多 火焰图 宽度越大 占用内存越多

    SAMPLE->inuse_objects可以查看当前的对象数量 这个参数对于分析gc线程占用较高cpu时很有用处 它侧重查看对象数量

    inuse_space图可以查看具体的内存占用

    毕竟对于10个100m的对象和1亿个10字节的对象占用内存几乎一样大,但是回收起来一亿个小对象肯定比10个大对象要慢很多。

    go tool pprof -inuse_space http://localhost:6060/debug/pprof/heap : 分析应用程序的常驻内存占用情况 (默认)
    go tool pprof -alloc_objects http://localhost:6060/debug/pprof/heap: 分析应用程序的内存临时分配情况
    ログイン後にコピー


    1.3 并发请求问题 查看方式跟上面类似。

    go tool pprof http://localhost:6060/debug/pprof/goroutine
    go tool pprof http://localhost:6060/debug/pprof/block
    go tool pprof http://localhost:6060/debug/pprof/mutex
    ログイン後にコピー


    2.2 tracing

    trace并不是万能的,它更侧重于记录分析 采样时间内运行时系统具体干了什么。

    收集trace数据的三种方式:

    1. 使用runtime/trace包 调用trace.Start()和trace.Stop()

    2. 使用go test -trace=测试标识

    3. 使用debug/pprof/trace handler 获取运行时系统最好的方法

    例如,通过

    go tool pprof http://localhost:6060/debug/pprof/trace?seconds=20 > trace.out
    ログイン後にコピー

    获取运行时服务的trace信息,使用

    go tool trace trace.out
    ログイン後にコピー

    会自动打开浏览器展示出UI界面

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    其中trace view 只能使用chrome浏览器查看,这里go截止1.14版本存在一个 bug,解决办法如下:

    go tool trace trace.out 无法查看trace view
    go bug:https://github.com/golang/go/issues/25151
    mac 解决版本:安装gotip
    go get golang.org/dl/gotip
    gotip download
    then  使用 gotip tool trace trace.out即可
    ログイン後にコピー

    获取的trace.out 二进制文件也可以转化为pprof格式的文件

    go tool trace -pprof=TYPE trace.out > TYPE.pprof
    Tips:生成的profile文件 支持 network profiling、synchronization profiling、syscall profiling、scheduler profiling
    go tool pprof TYPE.pprof
    ログイン後にコピー


    使用gotip tool trace trace.out可以查看到trace view的丰富操作界面:

    操作技巧:

    ctrl + 1 选择信息

    ctrl + 2 移动选区

    ctrl + 3 放大选区

    ctrl + 4 指定选区区间

    shift + ? 帮助信息

    AWSD跟游戏快捷键类似 玩起来跟顺手

    整体的控制台信息 如下图:

    golang のパフォーマンス診断については、この記事を読むだけで十分です


    • 时间线: 显示执行的时间单元 根据时间的纬度不同 可以调整区间

    • 堆: 显示执行期间内存的分配和释放情况

    • 协程(Goroutine): 显示每个时间点哪些Goroutine在运行 哪些goroutine等待调度 ,其包含 GC 等待(GCWaiting)、可运行(Runnable)、运行中(Running)这三种状态。

    goroutine区域选中时间区间

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    OS线程(Machine): 显示在执行期间有多少个线程在运行,其包含正在调用 Syscall(InSyscall)、运行中(Running)这两种状态。

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    • 虚拟处理器Processor: 每个虚拟处理器显示一行,虚拟处理器的数量一般默认为系统内核数。数量由环境变量GOMAXPROCS控制

    • 协程和事件: 显示在每个虚拟处理器上有什么 Goroutine 正在运行,而连线行为代表事件关联。

    每个Processor分两层,上一层表示Processor上运行的goroutine的信息,下一层表示processor附加的事件比如SysCall 或runtime system events

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    ctrl+3 放大选区,选中goroutine 可以查看,特定时间点 特定goroutine的执行堆栈信息以及关联的事件信息

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    goroutine analysis

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    点击goroutine的id 可以跳到trace view 详细查看goroutine具体干了什么

    名称
    含义
    Execution执行时间
    Network wait网络等待时间
    Sync Block同步阻塞时间
    Blocking syscall系统调用阻塞时间
    Scheduler wait调度等待时间
    GC SweepingGC清扫时间
    GC PauseGC暂停时间


    实践 一个延迟问题诊断

    当我们一个执行关键任务的协程从运行中被阻塞。这里可能的原因:被syscall阻塞 、阻塞在共享内存(channel/mutex etc)、阻塞在运行时(如 GC)、甚至有可能是运行时调度器不工作导致的。这种问题使用pprof很难排查,

    使用trace只要我们确定了时间范围就可以在proc区域很容易找到问题的源头

    golang のパフォーマンス診断については、この記事を読むだけで十分です

    上图可见,GC 的MARK阶段阻塞了主协程的运行



    2.3 GC

    golang的gc算法是根据标记清除改进的三色标记法,大概流程:

    初始所有对象都是白色

    1. Stack scan阶段:从root出发扫描所有可达对象,标记为灰色并放入待处理队列;root包括全局指针和goroutine栈上的指针

    2. Mark阶段:1.从待处理队列取出灰色对象,将其引用的对象标记为灰色并放入队列,自身标记为黑色 2. re-scan全局指针和栈,因为mark和用户程序并行运行,故过程1的时候可能会有新的对象分配,这时需要通过写屏障(write barrier)记录下来;re-scan再完成检查;

    3. 重复步骤Mark阶段,直到灰色对象队列为空,执行清扫工作(白色即为垃圾对象)

    go的三色标记法也存在STW(Stop The World),大致有两个场景
    1. GC即将开始时,需要STW 做一些准备工作, 如enable write barrier

    2. re-scan也需要STW,否则上面Mark阶段的re-scan无法终止

    通过GODEBUG=gctrace=1可以开启gc日志,查看gc的结果信息

    $ GODEBUG=gctrace=1 go run main.go   
    gc 1 @0.001s 19%: 0.014+3.7+0.015 ms clock, 0.11+2.8/5.7/3.2+0.12 ms cpu, 5->6->6 MB, 6 MB goal, 8 P
    gc 2 @0.024s 6%: 0.004+3.4+0.010 ms clock, 0.032+1.4/4.5/5.3+0.085 ms cpu, 13->14->13 MB, 14 MB goal, 8 P
    gc 3 @0.093s 3%: 0.004+6.1+0.027 ms clock, 0.032+0.19/11/15+0.22 ms cpu, 24->25->22 MB, 26 MB goal, 8 P
    scvg: 0 MB released
    scvg: inuse: 4, idle: 58, sys: 63, released: 58, consumed: 4 (MB)
    scvg: 0 MB released
    scvg: inuse: 4, idle: 58, sys: 63, released: 58, consumed: 4 (MB)
    scvg: 0 MB released
    scvg: inuse: 4, idle: 58, sys: 63, released: 58, consumed: 4 (MB)
    scvg: 0 MB released
    scvg: inuse: 4, idle: 58, sys: 63, released: 58, consumed: 4 (MB)
    ログイン後にコピー


    格式

    gc # @#s #%: #+#+# ms clock, #+#/#/#+# ms cpu, #->#-># MB, # MB goal, # P

    含义

    gc#:GC 执行次数的编号,每次叠加。

    @#s:自程序启动后到当前的具体秒数。

    #%:自程序启动以来在GC中花费的时间百分比。

    #+...+#:GC 的标记工作共使用的 CPU 时间占总 CPU 时间的百分比。

    #->#-># MB:分别表示 GC 启动时, GC 结束时, GC 活动时的堆大小.

    #MB goal:下一次触发 GC 的内存占用阈值。

    #P:当前使用的处理器 P 的数量。



    拓展


    当我们的程序陷入CPU 和IO混和负载过高时,我们使用pprof profile只能检测出CPU耗时的函数,但是屏蔽了IO等待过长的函数。

    https://github.com/felixge/fgprof 给出了一个解决方案:

    具体做法是:用一个后台协程在采样时间区间内每秒99次调用runtime.GoruntineProfile,返回的结果忽略了协程当时消耗CPU还是非消耗CPU的区别 进行统计,保存在内存中的map中,可导出转化为pprof

    具体用法:

    package main
     
    import(
        _ "net/http/pprof"
        "github.com/felixge/fgprof"
    )
     
    func main() {
        http.DefaultServeMux.Handle("/debug/fgprof", fgprof.Handler())
        go func() {
            log.Println(http.ListenAndServe(":6060", nil))
        }()
     
        // <code to profile>
    }
     
    git clone https://github.com/brendangregg/FlameGraph
    cd FlameGraph
    curl -s &#39;localhost:6060/debug/fgprof?seconds=3&#39; > fgprof.fold
    ./flamegraph.pl fgprof.fold > fgprof.svg
    ログイン後にコピー

    如果遇到这种CPU消耗型和非CPU消耗型混合的情况下 可以试试排查下。

    以上がgolang のパフォーマンス診断については、この記事を読むだけで十分ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

    関連ラベル:
    ソース:Go语言进阶学习
    このウェブサイトの声明
    この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
    最新の問題
    人気のチュートリアル
    詳細>
    最新のダウンロード
    詳細>
    ウェブエフェクト
    公式サイト
    サイト素材
    フロントエンドテンプレート