目录
问题内容
解决方法
首页 后端开发 Golang 在这个数组访问微基准测试中(相对于 GCC),Go 的性能损失了 4 倍,是什么原因造成的?

在这个数组访问微基准测试中(相对于 GCC),Go 的性能损失了 4 倍,是什么原因造成的?

Feb 10, 2024 am 08:51 AM
go语言 编译错误

在这个数组访问微基准测试中(相对于 GCC),Go 的性能损失了 4 倍,是什么原因造成的?

在这个数组访问微基准测试中(相对于GCC),Go的性能损失了4倍,是什么原因造成的?这个问题涉及到Go语言的运行时机制和编译器优化等多个方面。首先,Go语言在数组访问时使用了边界检查机制,即在每次访问数组元素时都会进行边界检查,这会带来一定的性能损失。其次,Go语言的编译器在优化方面相对较弱,无法对数组访问进行很好的优化。此外,Go语言的垃圾回收机制也会对性能造成一定的影响。综上所述,这些因素共同导致了Go语言在数组访问微基准测试中性能损失了4倍的情况。

问题内容

我编写这个微基准测试是为了更好地了解 go 的性能特征,以便我能够在何时使用它方面做出明智的选择。

从性能开销的角度来看,我认为这将是 go 的理想场景:

  • 循环内没有分配/释放
  • 数组访问显然在边界内(可以删除边界检查)

尽管如此,我发现相对于 amd64 上的 gcc -o3 速度有 4 倍的差异。这是为什么?

(使用shell计时。每次需要几秒钟,因此启动可以忽略不计)

package main

import "fmt"

func main() {
    fmt.println("started");

    var n int32 = 1024 * 32

    a := make([]int32, n, n)
    b := make([]int32, n, n)

    var it, i, j int32

    for i = 0; i < n; i++ {
        a[i] =  i
        b[i] = -i
    }

    var r int32 = 10
    var sum int32 = 0

    for it = 0; it < r; it++ {
        for i = 0; i < n; i++ {
            for j = 0; j < n; j++ {
                sum += (a[i] + b[j]) * (it + 1)
            }
        }
    }
    fmt.printf("n = %d, r = %d, sum = %d\n", n, r, sum)
}
登录后复制

c 版本:

#include <stdio.h>
#include <stdlib.h>


int main() {
    printf("started\n");

    int32_t n = 1024 * 32;

    int32_t* a = malloc(sizeof(int32_t) * n);
    int32_t* b = malloc(sizeof(int32_t) * n);

    for(int32_t i = 0; i < n; ++i) {
        a[i] =  i;
        b[i] = -i;
    }

    int32_t r = 10;
    int32_t sum = 0;

    for(int32_t it = 0; it < r; ++it) {
        for(int32_t i = 0; i < n; ++i) {
            for(int32_t j = 0; j < n; ++j) {
                sum += (a[i] + b[j]) * (it + 1);
            }
        }
    }
    printf("n = %d, r = %d, sum = %d\n", n, r, sum);

    free(a);
    free(b);
}
登录后复制

更新:

  • 按照建议使用 range,可以将 go 速度提高 2 倍。
  • 另一方面,在我的测试中,-march=native 将 c 速度提高了 2 倍。 (并且-mno-sse给出编译错误,显然与-o3不兼容)
  • gccgo 在这里看起来与 gcc 相当(并且不需要 range

解决方法

看看 C 程序与 Go 程序的汇编程序输出,至少在我使用的 Go 和 GCC 版本(分别为 1.19.6 和 12.2.0)上,最直接和明显的区别是 GCC自动向量化 C 程序,而 Go 编译器似乎无法做到这一点。

这也很好地解释了为什么您会看到性能提高了四倍,因为 GCC 在不针对特定架构时使用 SSE 而不是 AVX,这意味着 32 位标量指令宽度是四倍运营。事实上,添加 -march=native 为我带来了两倍的性能提升,因为这使得 GCC 在我的 CPU 上输出 AVX 代码。

我对 Go 还不够熟悉,无法告诉你 Go 编译器是否本质上无法进行自动向量化,或者是否只是这个特定的程序由于某种原因导致它出错,但这似乎是根本原因.

以上是在这个数组访问微基准测试中(相对于 GCC),Go 的性能损失了 4 倍,是什么原因造成的?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

golang 如何使用反射访问私有字段和方法 golang 如何使用反射访问私有字段和方法 May 03, 2024 pm 12:15 PM

Go语言中可以使用反射来访问私有字段和方法:访问私有字段:通过reflect.ValueOf()获取值的反射值,再使用FieldByName()获取字段的反射值,并调用String()方法打印字段的值。调用私有方法:同样通过reflect.ValueOf()获取值的反射值,再使用MethodByName()获取方法的反射值,最后调用Call()方法执行方法。实战案例:通过反射修改私有字段值和调用私有方法,实现对对象的控制和单元测试覆盖。

C++ 函数继承详解:如何在继承中使用'基类指针”和'派生类指针”? C++ 函数继承详解:如何在继承中使用'基类指针”和'派生类指针”? May 01, 2024 pm 10:27 PM

在函数继承中,使用“基类指针”和“派生类指针”来理解继承机制:基类指针指向派生类对象时,执行向上转型,只访问基类成员。派生类指针指向基类对象时,执行向下转型(不安全),必须谨慎使用。

Go语言中的性能测试与单元测试的区别 Go语言中的性能测试与单元测试的区别 May 08, 2024 pm 03:09 PM

性能测试评估应用程序在不同负载下的性能,而单元测试验证单个代码单元的正确性。性能测试侧重于测量响应时间和吞吐量,而单元测试关注函数输出和代码覆盖率。性能测试通过高负载和并发模拟实际环境,而单元测试在低负载和串行条件下运行。性能测试的目标是识别性能瓶颈和优化应用程序,而单元测试的目标是确保代码正确性和健壮性。

c++中const和static的区别 c++中const和static的区别 May 01, 2024 am 10:54 AM

const 修饰符表示常量,值不可修改;static 修饰符指示变量的生存期和作用域。const 修饰的数据成员在初始化后不可修改,static 修饰的变量在程序启动时初始化,在程序结束时销毁,即使没有活动对象也会存在,并且可以跨函数访问。const 修饰局部变量必须声明时初始化,static 修饰的局部变量可以稍后初始化。const 修饰类成员变量必须在构造函数或初始化列表中初始化,static 修饰的类成员变量可以在类外部初始化。

Golang技术在设计分布式系统时应注意哪些陷阱? Golang技术在设计分布式系统时应注意哪些陷阱? May 07, 2024 pm 12:39 PM

在设计分布式系统时,Go语言中的陷阱Go是一门流行的语言,用于开发分布式系统。然而,在使用Go时要注意一些陷阱,这可能会破坏你系统的健壮性、性能和正确性。本文将探讨一些常见陷阱,并提供实战案例来说明如何避免它们。1.过度使用并发Go是一种并发性语言,鼓励开发人员使用goroutine来提高并行性。然而,过度使用并发可能会导致系统不稳定,因为过多的goroutine会竞争资源并导致上下文切换开销。实战案例:过度使用并发导致服务响应延迟和资源竞争,表现为CPU利用率高和垃圾回收开销大。

如何在 Java 泛型方法中限制类型参数? 如何在 Java 泛型方法中限制类型参数? Apr 30, 2024 pm 01:30 PM

为了在Java泛型方法中限制类型参数,需使用语法,其中Bound为类型或接口。如此,参数仅接受继承自Bound类型或实现Bound接口的类型。例如,限制T为可与自身比较的类型。

Golang技术在机器学习中使用的库和工具 Golang技术在机器学习中使用的库和工具 May 08, 2024 pm 09:42 PM

Go语言中适用于机器学习的库和工具包括:TensorFlow:流行的机器学习库,提供构建、训练和部署模型的工具。GoLearn:一系列分类、回归和聚类算法.Gonum:科学计算库,提供矩阵操作和线性代数功能。

c++中的min函数怎么用 c++中的min函数怎么用 May 06, 2024 pm 05:18 PM

C++ 中的 min() 函数返回两个或更多值中的最小值,它是一个泛型函数,可以比较不同类型的值。用法如下:比较两个值:min(a, b)比较多个值:min(a, b, c)比较不同类型的值:min(a, b, c)(需显式指定类型)适用于数组和容器中的元素比较

See all articles