我们如何取消优化英特尔 Sandybridge 处理器的蒙特卡洛模拟?
对 Intel Sandybridge 系列 CPU 中的管道进行去优化
简介
任务是通过利用 Intel Sandybridge 处理器来降低 Monte-Carlo 模拟程序的效率 建筑学。该处理器具有无序管道,具有寄存器重命名和存储缓冲等功能,因此降低指令级并行性 (ILP) 并引入危险具有挑战性。
程序分析
该程序是蒙特卡罗模拟,用于计算欧洲普通看涨期权和看跌期权的价格。该程序的关键组件是:
- 迭代指定次数的循环
- 高斯随机数生成
- Black-Scholes 期权定价公式
优化技术
以下技术可用于降低程序效率:
- 错误依赖关系:在指令之间引入不必要的依赖关系,以增加危险停顿。
- 内存瓶颈:导致缓存未命中和内存访问由于数据不对齐或使用非连续内存访问模式而导致延迟。
- 延迟指令:使用具有较长延迟且可能被管道延迟的指令。
- 效率较低的运算:使用效率较低的数学运算,例如除法,而不是乘法。
- 分支错误预测:引入不可预测的分支导致管道刷新。
- 存储转发停顿:使用双精度高字节异或等技术引起存储转发
- 指令缓存未命中:将例程分成小块以导致指令缓存未命中。
具体建议
基于上述技术,这里有一些悲观化的具体建议节目:
- 使用 std::atomic
; for 循环计数器并使其不对齐。 - 在非原子变量之间引入错误共享。
- 具有单个共享 std::atomic
循环计数器的多线程。 - 用关联/分配等价重写表达式以增加工作。
- 小心使用内部函数以避免管道停顿。
- 使用内联汇编来分解 uop 缓存。
- 使用 CPUID/RDTSC 来计时每次迭代并引发序列化.
- 以非连续顺序遍历数组并使用带填充和未对齐的数组元素。
- 使用 双精度 精度代替 float 来增加延迟。
- 强制从整数转换为浮点数,然后再返回。
- 使用 -O0 禁用编译器优化并使用-march=i386 用于较慢的指令。
- 经常设置不同 CPU 的 CPU 关联性。
以上是我们如何取消优化英特尔 Sandybridge 处理器的蒙特卡洛模拟?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

C语言数据结构:树和图的数据表示与操作树是一个层次结构的数据结构由节点组成,每个节点包含一个数据元素和指向其子节点的指针二叉树是一种特殊类型的树,其中每个节点最多有两个子节点数据表示structTreeNode{intdata;structTreeNode*left;structTreeNode*right;};操作创建树遍历树(先序、中序、后序)搜索树插入节点删除节点图是一个集合的数据结构,其中的元素是顶点,它们通过边连接在一起边可以是带权或无权的数据表示邻

文章讨论了在C中有效使用RVALUE参考,以进行移动语义,完美的转发和资源管理,重点介绍最佳实践和性能改进。(159个字符)

文件操作难题的真相:文件打开失败:权限不足、路径错误、文件被占用。数据写入失败:缓冲区已满、文件不可写、磁盘空间不足。其他常见问题:文件遍历缓慢、文本文件编码不正确、二进制文件读取错误。

C 20范围通过表现力,合成性和效率增强数据操作。它们简化了复杂的转换并集成到现有代码库中,以提高性能和可维护性。

C35 的计算本质上是组合数学,代表从 5 个元素中选择 3 个的组合数,其计算公式为 C53 = 5! / (3! * 2!),可通过循环避免直接计算阶乘以提高效率和避免溢出。另外,理解组合的本质和掌握高效的计算方法对于解决概率统计、密码学、算法设计等领域的许多问题至关重要。

本文讨论了使用C中的移动语义来通过避免不必要的复制来提高性能。它涵盖了使用std :: Move的实施移动构造函数和任务运算符,并确定了关键方案和陷阱以有效

本文讨论了C中的动态调度,其性能成本和优化策略。它突出了动态调度会影响性能并将其与静态调度进行比较的场景,强调性能和之间的权衡

C语言函数是代码模块化和程序搭建的基础。它们由声明(函数头)和定义(函数体)组成。C语言默认使用值传递参数,但也可使用地址传递修改外部变量。函数可以有返回值或无返回值,返回值类型必须与声明一致。函数命名应清晰易懂,使用驼峰或下划线命名法。遵循单一职责原则,保持函数简洁性,以提高可维护性和可读性。
