社群

學習

工具庫

AI工具

休閒

繁体中文

目錄

問題內容

解決方法

首頁

後端開發

Golang

在這個數組存取微基準測試中（相對於 GCC），Go 的效能損失了 4 倍，是什麼原因造成的？

在這個數組存取微基準測試中（相對於 GCC），Go 的效能損失了 4 倍，是什麼原因造成的？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 10, 2024 am 08:51 AM

go語言編譯錯誤

在这个数组访问微基准测试中（相对于 GCC），Go 的性能损失了 4 倍，是什么原因造成的？

在這個陣列存取微基準測試中（相對於GCC），Go的效能損失了4倍，是什麼原因造成的？這個問題牽涉到Go語言的執行時間機制和編譯器最佳化等多個面向。首先，Go語言在數組存取時使用了邊界檢查機制，即每次存取數組元素時都會進行邊界檢查，這會帶來一定的效能損失。其次，Go語言的編譯器在最佳化方面相對較弱，無法對陣列存取進行良好的最佳化。此外，Go語言的垃圾回收機制也會對效能造成一定的影響。綜上所述，這些因素共同導致了Go語言在陣列存取微基準測試中效能損失了4倍的情況。

問題內容

我寫這個微基準測試是為了更好地了解 go 的效能特徵，以便我能夠在何時使用它方面做出明智的選擇。

從效能開銷的角度來看，我認為這將是 go 的理想場景：

循環內沒有分配/釋放
陣列存取顯然在邊界內（可以刪除邊界檢查）

儘管如此，我發現相對於 amd64 上的 gcc -o3 速度有 4 倍的差異。這是為什麼？

（使用shell計時。每次需要幾秒鐘，因此啟動可以忽略）

package main

import "fmt"

func main() {
    fmt.println("started");

    var n int32 = 1024 * 32

    a := make([]int32, n, n)
    b := make([]int32, n, n)

    var it, i, j int32

    for i = 0; i < n; i++ {
        a[i] =  i
        b[i] = -i
    }

    var r int32 = 10
    var sum int32 = 0

    for it = 0; it < r; it++ {
        for i = 0; i < n; i++ {
            for j = 0; j < n; j++ {
                sum += (a[i] + b[j]) * (it + 1)
            }
        }
    }
    fmt.printf("n = %d, r = %d, sum = %d\n", n, r, sum)
}

登入後複製

c 版本：

#include <stdio.h>
#include <stdlib.h>


int main() {
    printf("started\n");

    int32_t n = 1024 * 32;

    int32_t* a = malloc(sizeof(int32_t) * n);
    int32_t* b = malloc(sizeof(int32_t) * n);

    for(int32_t i = 0; i < n; ++i) {
        a[i] =  i;
        b[i] = -i;
    }

    int32_t r = 10;
    int32_t sum = 0;

    for(int32_t it = 0; it < r; ++it) {
        for(int32_t i = 0; i < n; ++i) {
            for(int32_t j = 0; j < n; ++j) {
                sum += (a[i] + b[j]) * (it + 1);
            }
        }
    }
    printf("n = %d, r = %d, sum = %d\n", n, r, sum);

    free(a);
    free(b);
}

登入後複製

更新：

依照建議使用 range，可以將 go 速度提高 2 倍。
另一方面，在我的測試中，-march=native 將 c 速度提高了 2 倍。（並且-mno-sse給出編譯錯誤，顯然與-o3不相容）
gccgo 在這裡看起來與 gcc 相當（並且不需要 range）

解決方法

看看C 程式與Go 程式的組譯程式輸出，至少在我使用的Go 和GCC 版本（分別為1.19.6 和12.2.0）上，最直接和明顯的區別是GCC自動向量化C 程序，而Go 編譯器似乎無法做到這一點。

這也很好地解釋了為什麼您會看到效能提高了四倍，因為 GCC 在不針對特定架構時使用 SSE 而不是 AVX，這意味著 32 位元標量指令寬度是四倍運作。事實上，新增 -march=native 為我帶來了兩倍的效能提升，因為這使得 GCC 在我的 CPU 上輸出 AVX 程式碼。

我對 Go 還不夠熟悉，無法告訴你 Go 編譯器是否本質上無法進行自動向量化，或者是否只是這個特定的程式由於某種原因導致它出錯，但這似乎是根本原因.

以上是在這個數組存取微基準測試中（相對於 GCC），Go 的效能損失了 4 倍，是什麼原因造成的？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

顯示更多

熱門文章

<🎜>：種植花園 - 完整的突變指南

3 週前 By DDD

<🎜>：泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

如何修復KB5055612無法在Windows 10中安裝？

3 週前 By DDD

藍王子：如何到達地下室

1 個月前 By DDD

北端：融合系統，解釋

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

顯示更多

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

顯示更多

熱門話題

Java教學

1664

14

CakePHP 教程

1423

52

Laravel 教程

1321

25

PHP教程

1269

29

C# 教程

1249

24

顯示更多

Related knowledge

在Go語言中使用Redis Stream實現消息隊列時，如何解決user_id類型轉換問題？

在Go語言中使用Redis Stream實現消息隊列時，如何解決user_id類型轉換問題？ Apr 02, 2025 pm 04:54 PM

Go語言中使用RedisStream實現消息隊列時類型轉換問題在使用Go語言與Redis...

c語言函數名定義

c語言函數名定義 Apr 03, 2025 pm 10:03 PM

C語言函數名定義包括：返回值類型、函數名、參數列表和函數體。函數名應清晰、簡潔、統一風格，避免與關鍵字衝突。函數名具有作用域，可在聲明後使用。函數指針允許將函數作為參數傳遞或賦值。常見錯誤包括命名衝突、參數類型不匹配和未聲明的函數。性能優化重點在函數設計和實現上，而清晰、易讀的代碼至關重要。

GoLand中自定義結構體標籤不顯示怎麼辦？

GoLand中自定義結構體標籤不顯示怎麼辦？ Apr 02, 2025 pm 05:09 PM

GoLand中自定義結構體標籤不顯示怎麼辦？在使用GoLand進行Go語言開發時，很多開發者會遇到自定義結構體標籤在�...

Go的爬蟲Colly中Queue線程的問題是什麼？

Go的爬蟲Colly中Queue線程的問題是什麼？ Apr 02, 2025 pm 02:09 PM

Go爬蟲Colly中的Queue線程問題探討在使用Go語言的Colly爬蟲庫時，開發者常常會遇到關於線程和請求隊列的問題。 �...

Go語言中用於浮點數運算的庫有哪些？

Go語言中用於浮點數運算的庫有哪些？ Apr 02, 2025 pm 02:06 PM

Go語言中用於浮點數運算的庫介紹在Go語言（也稱為Golang）中，進行浮點數的加減乘除運算時，如何確保精度是�...

在 Go 語言中，為什麼使用 Println 和 string() 函數打印字符串會出現不同的效果？

在 Go 語言中，為什麼使用 Println 和 string() 函數打印字符串會出現不同的效果？ Apr 02, 2025 pm 02:03 PM

Go語言中字符串打印的區別：使用Println與string()函數的效果差異在Go...

Go語言中哪些庫是由大公司開發或知名的開源項目提供的？

Go語言中哪些庫是由大公司開發或知名的開源項目提供的？ Apr 02, 2025 pm 04:12 PM

Go語言中哪些庫是大公司開發或知名開源項目？在使用Go語言進行編程時，開發者常常會遇到一些常見的需求，�...

在Go編程中，如何正確管理Mysql和Redis的連接與釋放資源？

在Go編程中，如何正確管理Mysql和Redis的連接與釋放資源？ Apr 02, 2025 pm 05:03 PM

Go編程中的資源管理：Mysql和Redis的連接與釋放在學習Go編程過程中，如何正確管理資源，特別是與數據庫和緩存�...

See all articles