r9数字货币(用来形容主机性能的teraflops究竟是个什么东西?)
“万亿次浮点运算每秒”(teraflops,以下简称TF)是业界目前用来描述计算机图形性能的常用单位,那么其含义究竟是什么,对主机游戏表现又有怎样的影响?本文将带您走近真实的 TFBOYS teraflops。
自从 PS4 和 Xbox One 两者的规格首次泄露之后,它们在图形性能上的差距就一直是坊间热议的焦点。在这里我们来看一个直观的比较:Xbox One 的显卡性能在规格调整之前是 1。23TF,而索尼的 PS4 则是 1。84TF,相比之下高出了不少。
从纸面上看这个差距是很大的,这意味着 PS4 在图形性能上有着大约50%的优势。而图形性能正是众多对次世代游戏画面表现翘首以盼的玩家们最为看重的。看起来主机还没开卖,微软就遇到了麻烦。
现在,两家公司的后续机型已经揭开了面纱,而硬件规格霸主的宝座似乎要易主了。PS4 Neo(以下简称 Neo)的性能目前据传为 4。2TF,而微软“天蝎计划”(以下简称天蝎)的性能约为6TF,有43%的优势。当然两台主机看起来都很棒,但这不是重点。
我们今天想谈论的是 TF 究竟是什么?这看似巨大的规格差别对实际的性能指标和游戏体验会有怎样的影响?
首先,我们从基本的名词解释说起。teraflops 中的 tera 代表一万亿,flop 则是指一次浮点运算(floating point operation),这是描述计算性能的基本单位,而 s 自然是每秒的意思。
就微软和索尼主机使用的 AMD 图形技术而言,TF 的计算方法非常简单:将图形处理器(GPU)中流处理器(shader,常见译名还有着色器、渲染器等)的数量与其时钟频率相乘即可。AMD GPU 的每个计算单元有64个流处理器,Xbox One 有12个计算单元,PS4则有18个,因此二者分别拥有768和1152个流处理器。而两台主机的流处理器时钟频率分别为853MHz和800MHz。
此外,将流处理器数量与频率相乘得到的结果还要再乘二,这是因为在一个时钟周期内可以同步执行乘法和累加两种指令,如此这般我们就能得到一个巨大无比的天文数字。为了便于读写,我们把计算电脑硬盘容量那一套搬过来,用这个数字除以一百万,便能得到 megaflops,即百万次浮点运算每秒,若除以一万亿,就可得到 teraflops。
以下是 Xbox One、PS4 和 Neo 图形性能的计算过程:
- Xbox One:768 shaders x 853MHz x 2 = 1,310,208 megaflops/1。31TF
- PS4:1280 shaders x 800MHz x 2 = 1,843,200 megaflops/1。84TF
- Neo:2304 shaders x 911MHz x 2 = 4,197,888 megaflops/4。2TF
微软声称天蝎的图形核心计算性能约为 6TF,但 GPU 的其他规格并没有公布。也就是说,我们知道了计算结果,却对流处理器数量和频率一无所知。在近期对天蝎规格的分析中,我们综合考量主机设计惯例,以及代号 Vega 的 AMD 下一代 GPU 的泄漏情报等信息,得出了对其硬件规格最合理的两种推测:
- 天蝎规格1:3584 shaders x 840MHz x 2 = 6,区块链平台021,120 megaflops/6。02TF
- 天蝎规格2:3840 shaders x 800MHz x 2 = 6,144,000 megaflops/6。13TF
此推测基于两个假定的前提:一是天蝎的时钟频率较低,因为其处理器面积很可能远远超过 Neo,而处理器越大发热量也越大,通常工作频率就会较低;二是微软使用了 AMD 的下一代 Vega 核心,据泄漏信息确认其拥有64个计算单元4096个流处理器。因为如果要使用与 Neo 同样的 Polaris 核心实现6TF的性能,就要求 GPU 运行在极高的频率下。
- 天蝎规格3:2304 shaders x 1302MHz x 2 = 5,999,616 megaflops/6TF
如此一来,其频率将比 Neo GPU 的未删减版 —— Radeon RX 480 电脑显卡核心还要高,而这显然是不可能的。简而言之,除非微软采用的是未出现在 AMD 蓝图上的下一代 GPU,我们几乎可以肯定天蝎采用的就是 Vega 的删减版。
TF 是用来衡量计算性能的基本参数,独立于与 GPU 设计的其他方面。举例来说,相对于英伟达,AMD 的 GCN 图形处理架构在纯粹的计算性能上是很强的,因此在前些年数字货币挖矿风潮盛行的时候 Radeon GPU 很吃香。然而需要强调的是,计算性能并不能与游戏性能划等号。
关于这一点有一个绝佳的对比实例:9TF 的英伟达 GTX 1080 和8。6TF的 AMD Radeon R9 Fury X。如果单看计算性能,你可能会认为二者的游戏性能也相差无几。但请看下面的4K分辨率测试结果,GTX 1080 可不是快了一点,而是几乎在所有游戏中都遥遥领先,就连只有 6。5TF 的 GTX 1070 在多个游戏中的表现都优于 Fury X。
事实上,若单看 TF 数据,GTX 1070甚至比不上英伟达自家上代产品 Titan X(7TF),但实际表现却并不占劣势。
因此,显卡的实际游戏性能是由多方面决定的。显示驱动程序非常重要,图形架构本身的效率更是举足轻重,更不用说还有显存带宽和内置缓存容量等一系列因素。
然而单就游戏主机而言,计算性能的比较还是很有意义的。
首先,GPU的其他指标通常会随着计算性能的增长而同步提高;其次,PS4和Xbox One的GPU源自同一家族,其核心设计非常相近。
但若要对 Xbox One/天蝎 和 PS4/Neo 进行跨代对比,意义就显得不那么大了。虽然 AMD 的新图形核心与上一代完全兼容,但在架构上仍然作了改进,简而言之就是更高效。对此我们可以对 AMD 即将发售的 RX 460 显卡进行测试。
RX 460 拥有与 Radeon HD 7850 相同的16个计算单元,但采用了新的 Polaris 核心。届时对二者在相同的频率和显存带宽下进行测试,理论上就可得出 AMD 第四代 GCN 架构在效率上的提升,而这就是关键所在。
就数据上说,天蝎的计算能力是 Xbox One 的4。6倍,而 Neo 是 PS4 的2。3倍。而这仅仅是 TF 的对比,AMD 的新架构对最终性能的提升也许会比预想的还大。但再次强调,计算能力提高40%并不意味着实际性能表现也会提高40%。
通常来说,在 GPU 内加入更多的计算单元会带来更高的性能,但2倍的 TF 并不会带来2倍的游戏帧率。这里面的原因有很多,但总的来说显存带宽的限制是最主要的因素。
拿 Radeon R9 380X 显卡来说,其采用了拥有完整32个计算单元的 Tonga 核心。在与核心相同但计算单元删减为28个的 R9 380 进行对比测试时,游戏帧率只领先10%到15%。要知道不仅是流处理器数量,其在核心频率和显存速度上都更占优势。随着 GPU 规格差别的增大,TF 数值和实际性能的差异只会进一步增加。微软为了让天蝎发挥出最大的实力,为其6TF的 GPU 提供了320GB/s的显存带宽支持,相对的 Neo 仅为218GB/s。
TF 与实际游戏性能的差异在 PS4 和 Xbox One 身上也有一定程度的体现。由于主机游戏几乎都会锁定帧率,再加上开发商为了在不同主机实现相近的性能表现,会采用不同的渲染组件对画面质量进行微调或者直接改变原生分辨率,因此几乎找不到合适的针对不同主机 GPU 的性能测试程序。
但凡事都有例外,那就是 Io Interactive 制作的《杀手》。这个游戏的 PS4 版和 Xbox One 版具有相同的1080p分辨率,画质也完全相同,并且没有锁定帧率,很适合作为理想的测试标准。
最终的测试结果显示,在主要考验 GPU 性能的场景中,PS4 有30%的优势。事实上 PS4 的1。84TF计算性能比 Xbox One 的1。31TF高40%,并且显存带宽也更高(这取决于它们如何利用 Xbox One 内置的 ESRAM)。除此以外还有一个现象:Xbox One 版的《杀手》在某些场景中的帧率反而更高。这就引出了我们的下一个话题。
CPU 和 GPU 各自对游戏性能的影响在《杀手》中有很好的体现。游戏的巴黎关卡中有着数量众多的 NPC,需要在模拟人物各自行为的同时处理人体动画效果,而这项工作更适合由 CPU 来完成。
PS4 和 Xbox One 都采用了性能相对较弱的 AMD Jaguar 核心 CPU,其架构本来是为移动设备设计的。为了弥补性能上的不足,两家都将核心数量翻倍——老实说这只是无奈之举。不同之处在于 Xbox One 的 CPU 频率为1。75GHz,相对 PS4 的1。6GHz 快了9。4%,这在《杀手》的某些场景中可以切实感受到。
索尼试图在 Neo 上解决这个问题。鉴于 AMD 的下代 Zen 核心 CPU 无法与 GPU 整合为单块芯片,只好退而求其次:维持相同的八核心不变,将工作频率从 PS4 的1。6GHz提高到2。1GHz,实现31。3%的性能提升。至于天蝎的 CPU 架构目前尚不明确,但相关分析表明微软很有可能采用同样的策略,对现有 Jaguar 核心进行提速,或略作改进。
这就是 Neo 和天蝎最令我们担心的一点。更强的 GPU 带来了海量的浮点计算能力和革命性的图形处理性能,但 CPU 性能却没有对等的增长。这也许可以解释为何厂商宣传的重点是4K分辨率,而不是帧率的显著提升。我们当然希望帧率能从30fps提高到60fps,但这需要更强力的 CPU。至少就 Neo 的规格而言,帧率的倍增是无法实现的。
实际游戏性能同由 TF 代表的计算能力之间没有直接的线性关系。虽然我们可以通过 TF 大致推断不同 GPU 的性能优劣,但只有相同架构产品间的对比才是有意义的。而即便是架构相同,TF 领先40%的 GPU 在实际游戏中的性能也并不会成线性比例增长。GPU 的性能并不仅仅取决于计算能力,其他因素譬如显存带宽也非常重要。
不过可以肯定的是,Xbox One 的12计算核心、1。31TF GPU 相对 PS4 的18计算核心、1。84TF GPU 处于劣势,而且这种劣势还常因为 Xbox One 更低的显存带宽而进一步加剧。然而纵使规格上的差距如此之大,跨平台游戏开发商们还是尽力做到了在不同平台实现相近的游戏体验,主要区别仅在于分辨率,比如1080p vs 900p。当然总体来说,PS4 的帧率也更稳定。
从目前的迹象来看,Neo 和天蝎也会有类似的规格差别——不过这次好牌在微软手上,但这种差别对游戏体验造成的影响仍然有待观望。微软的目标似乎是原生4K分辨率,索尼也在考虑,但更可能是通过插值来实现。
当然面对强劲的对手,索尼和游戏厂商们也可能会转变思路,在现有的1080p上酝酿新文章。毕竟除了更高的分辨率,新主机们还有其他的路可以走。
","content_hash"!"bccc9a89
评论