社区

学习

工具库

AI工具

休闲

简体中文

目录

问题内容

解决方法

首页

后端开发

Golang

在这个数组访问微基准测试中（相对于 GCC），Go 的性能损失了 4 倍，是什么原因造成的？

在这个数组访问微基准测试中（相对于 GCC），Go 的性能损失了 4 倍，是什么原因造成的？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 10, 2024 am 08:51 AM

go语言编译错误

在这个数组访问微基准测试中（相对于 GCC），Go 的性能损失了 4 倍，是什么原因造成的？

在这个数组访问微基准测试中（相对于GCC），Go的性能损失了4倍，是什么原因造成的？这个问题涉及到Go语言的运行时机制和编译器优化等多个方面。首先，Go语言在数组访问时使用了边界检查机制，即在每次访问数组元素时都会进行边界检查，这会带来一定的性能损失。其次，Go语言的编译器在优化方面相对较弱，无法对数组访问进行很好的优化。此外，Go语言的垃圾回收机制也会对性能造成一定的影响。综上所述，这些因素共同导致了Go语言在数组访问微基准测试中性能损失了4倍的情况。

问题内容

我编写这个微基准测试是为了更好地了解 go 的性能特征，以便我能够在何时使用它方面做出明智的选择。

从性能开销的角度来看，我认为这将是 go 的理想场景：

循环内没有分配/释放
数组访问显然在边界内（可以删除边界检查）

尽管如此，我发现相对于 amd64 上的 gcc -o3 速度有 4 倍的差异。这是为什么？

（使用shell计时。每次需要几秒钟，因此启动可以忽略不计）

package main

import "fmt"

func main() {
    fmt.println("started");

    var n int32 = 1024 * 32

    a := make([]int32, n, n)
    b := make([]int32, n, n)

    var it, i, j int32

    for i = 0; i < n; i++ {
        a[i] =  i
        b[i] = -i
    }

    var r int32 = 10
    var sum int32 = 0

    for it = 0; it < r; it++ {
        for i = 0; i < n; i++ {
            for j = 0; j < n; j++ {
                sum += (a[i] + b[j]) * (it + 1)
            }
        }
    }
    fmt.printf("n = %d, r = %d, sum = %d\n", n, r, sum)
}

登录后复制

c 版本：

#include <stdio.h>
#include <stdlib.h>


int main() {
    printf("started\n");

    int32_t n = 1024 * 32;

    int32_t* a = malloc(sizeof(int32_t) * n);
    int32_t* b = malloc(sizeof(int32_t) * n);

    for(int32_t i = 0; i < n; ++i) {
        a[i] =  i;
        b[i] = -i;
    }

    int32_t r = 10;
    int32_t sum = 0;

    for(int32_t it = 0; it < r; ++it) {
        for(int32_t i = 0; i < n; ++i) {
            for(int32_t j = 0; j < n; ++j) {
                sum += (a[i] + b[j]) * (it + 1);
            }
        }
    }
    printf("n = %d, r = %d, sum = %d\n", n, r, sum);

    free(a);
    free(b);
}

登录后复制

更新：

按照建议使用 range，可以将 go 速度提高 2 倍。
另一方面，在我的测试中，-march=native 将 c 速度提高了 2 倍。（并且-mno-sse给出编译错误，显然与-o3不兼容）
gccgo 在这里看起来与 gcc 相当（并且不需要 range）

解决方法

看看 C 程序与 Go 程序的汇编程序输出，至少在我使用的 Go 和 GCC 版本（分别为 1.19.6 和 12.2.0）上，最直接和明显的区别是 GCC自动向量化 C 程序，而 Go 编译器似乎无法做到这一点。

这也很好地解释了为什么您会看到性能提高了四倍，因为 GCC 在不针对特定架构时使用 SSE 而不是 AVX，这意味着 32 位标量指令宽度是四倍运营。事实上，添加 -march=native 为我带来了两倍的性能提升，因为这使得 GCC 在我的 CPU 上输出 AVX 代码。

我对 Go 还不够熟悉，无法告诉你 Go 编译器是否本质上无法进行自动向量化，或者是否只是这个特定的程序由于某种原因导致它出错，但这似乎是根本原因.

以上是在这个数组访问微基准测试中（相对于 GCC），Go 的性能损失了 4 倍，是什么原因造成的？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

显示更多

热门文章

R.E.P.O.能量晶体解释及其做什么（黄色晶体）

3 周前 By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳图形设置

3 周前 By 尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影：贝壳谜语解决方案

2 周前 By DDD

R.E.P.O.如果您听不到任何人，如何修复音频

3 周前 By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解锁Myrise中的所有内容

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

显示更多

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7480

15

CakePHP 教程

1377

52

steam的账户名称是什么格式

77

11

win11激活密钥永久

51

19

NYT连接提示和答案

19

33

显示更多

Related knowledge

Go语言中用于浮点数运算的库有哪些？

Go语言中用于浮点数运算的库有哪些？ Apr 02, 2025 pm 02:06 PM

Go语言中用于浮点数运算的库介绍在Go语言（也称为Golang）中，进行浮点数的加减乘除运算时，如何确保精度是�...

Go的爬虫Colly中Queue线程的问题是什么？

Go的爬虫Colly中Queue线程的问题是什么？ Apr 02, 2025 pm 02:09 PM

Go爬虫Colly中的Queue线程问题探讨在使用Go语言的Colly爬虫库时，开发者常常会遇到关于线程和请求队列的问题。�...

Go语言中哪些库是由大公司开发或知名的开源项目提供的？

Go语言中哪些库是由大公司开发或知名的开源项目提供的？ Apr 02, 2025 pm 04:12 PM

Go语言中哪些库是大公司开发或知名开源项目？在使用Go语言进行编程时，开发者常常会遇到一些常见的需求，�...

Go语言中`var`和`type`关键字定义结构体的区别是什么？

Go语言中`var`和`type`关键字定义结构体的区别是什么？ Apr 02, 2025 pm 12:57 PM

Go语言中结构体定义的两种方式：var与type关键字的差异Go语言在定义结构体时，经常会看到两种不同的写法：一�...

在 Go 语言中，为什么使用 Println 和 string() 函数打印字符串会出现不同的效果？

在 Go 语言中，为什么使用 Println 和 string() 函数打印字符串会出现不同的效果？ Apr 02, 2025 pm 02:03 PM

Go语言中字符串打印的区别：使用Println与string()函数的效果差异在Go...

GoLand中自定义结构体标签不显示怎么办？

GoLand中自定义结构体标签不显示怎么办？ Apr 02, 2025 pm 05:09 PM

GoLand中自定义结构体标签不显示怎么办？在使用GoLand进行Go语言开发时，很多开发者会遇到自定义结构体标签在�...

在Go语言中使用Redis Stream实现消息队列时，如何解决user_id类型转换问题？

在Go语言中使用Redis Stream实现消息队列时，如何解决user_id类型转换问题？ Apr 02, 2025 pm 04:54 PM

Go语言中使用RedisStream实现消息队列时类型转换问题在使用Go语言与Redis...

在使用Go语言和viper库时，为什么传递指针的指针是必要的？

在使用Go语言和viper库时，为什么传递指针的指针是必要的？ Apr 02, 2025 pm 04:00 PM

Go指针语法及viper库使用中的寻址问题在使用Go语言进行编程时，理解指针的语法和使用方法至关重要，尤其是在...

See all articles