pu游戏优化加速软件 游戏优化( 二 )


Windows 10 1903中Zen架构的优化之一是内核的调度逻辑 , 它首先调用同一个CCX中的内核 。
因此 , 即使游戏针对多核进行了优化 , 也需要在核心调度上付出更多努力 , 才能达到最佳性能 。很高兴微软已经意识到了相关问题 , 并在Windows 10 1903中做了一次优化 。系统将优先调度同一CCX中的内核 , 以避免交叉CCX造成的延迟 。如果想充分发挥AMD锐龙处理器的性能 , 还是要升级到Windows 10 1903 。
2CPU单核性能真的是挤牙膏?
CPU性能真的是挤牙膏吗?有人认为 , 目前CPU在频率方面很难有性能上的突破 , 架构也很难进一步提高效率 。核心堆是提高性能的唯一方法 。有朋友从英特尔的“挤牙膏”中论证了这一观点 , 认为CPU的同频性能已经停滞多年 , 而AMD的Zen2架构 , 虽然效率较上一代大幅提升 , 但也只是赶上了竞争对手的水平 。几年前用4核CPU玩游戏和现在用4核CPU玩游戏 , 在体验上似乎没有区别 , 这也是一个有力的证据 。但事实是这样吗?
其实这种观点是片面的 。CPU之所以在几年前的一些测试和游戏中表现出色 , 是因为这些测试和游戏并没有对新CPU的指令集进行优化 。近年来 , 新CPU的一大价值在于增加了AVX、AVX2、TSX等指令集 。如果代码调用相应的指令集 , 它可以更有效地利用像FMA这样的浮点加乘混合单元 , 减少空闲的CPU流水线 , 并大幅提高性能 。
这些都是近十年来一直在增加的指令集 , 不是说没有核堆或者挤牙膏 。
以著名的渲染软件C信息资源网inebench为例 , 这是一款DIY玩家熟悉的CPU测试工具 。与旧版本的Cinebench R15相比 , 最新版本的Cinebench R20增加了对AVX指令集的支持 。凭借CPU对AVX指令集的良好支持 , 同样的渲染项目在Cinebench R20中运行的速度甚至是Cinebench R15的两倍以上!这表明新的指令集可以大大提高性能 。
Zen2的单核性能提升这么多 , 很大程度上是因为AVX2的性能提升很大 。
支持AVX或更新版本的指令集已经逐渐成为渲染、视频压缩和科学计算等专业领域的规范 。著名的Linux发行版Fedora 32甚至计划不支持没有AVX指令集的CPU 。但是 , 仍然有大量的游戏没有跟进新的指令集 , 如AVX , 只支持旧的SSE 。自然 , 用新CPU运行这些游戏和旧CPU差别不大 。在指令集支持方面 , 游戏还是缺乏对CPU的适当优化 。
著名的游戏性能测试组件3DMark已经意识到了这一点 。在新的Time Spy极限测试项目中 , 加入了AVX、AVX2甚至AVX512指令集支持 , 调用AVX512信息资源网络指令集运行评分 , 比SSE3的评分高出一倍以上 。
像AVX这样的新指令集在实际游戏中变得越来越重要 。比如《刺客信条:奥德赛》甚至不支持没有AVX指令集的CPU(因为太激进了 , 又得兼容老CPU) 。比如一些使用D加密的游戏 , 需要FMA3指令集解密才能正确运行 , 早期的“神U”e 1230v 2只能发呆;如果你是PS3模拟器玩家 , 你也体验过TSX指令集下的性能飞跃 。
育碧的新作《刺客信条》曾经不支持没有AVX指令的处理器 , 新游戏会越来越重视高级指令集 。
总的来说 , 大部分游戏的指令集优化还是不够 。在没有指令集优化的情况下 , 老CPU和新CPU的游戏性能拉不出太大的差别 。但支持新指令集是游戏对CPU优化不可回避的环节 。只有使用新的指令集 , 新的CPU才能显示出应有的价值 。希望更多游戏优化新CPU指令集 。
(在讲故事时)待后处理的事物无论是增加CPU内核的多线程 , 还是使用新的指令集来提高SIMD性能 , 都可以大大提升CPU的性能 。就消费市场而言 , AMD似乎更走多核路线 , 而英特尔则致力于实现新的指令集 。但无论是哪种发展方向 , 都需要相应的软件来优化 , 才能充分发挥CPU应有的性能 。
不再是不修改一行代码就能发挥新CPU全部性能的时代了 。多核和高级指令集受限于缺乏游戏支持的现状 , 不得不沦为“为未来而战” 。CPU不是挤牙膏 , 游戏对CPU的优化远没有结束 。希望以后能看到更多能发挥CPU真正威力的游戏 。
【pu游戏优化加速软件 游戏优化】


推荐阅读