自2011年末公布GCN架构后直到现在,AMD都没有彻底革命性架构的新显卡问世。包括当前旗舰R9 Fury X在内,所有的显示核心都是在第一代GCN架构上修修补补、增加一些新特性得来。而且芯片工艺依旧是多年不变的28nm……近5年之后,AMD终于放出下代“Polaris”(北极星)GPU架构将大幅革新的消息。而且这一次, 随着半导体新工艺的攻克,新核心将使用先进的14nm工艺。
双重利好究竟能为新GPU带来什么优势?
能否帮助AMD完成性能上相对竞品的逆袭,夺回高端市场份额?
距离新卡发布还有一段时间,但各种消息已经勾起了玩家们对北极星的极大兴趣。所以让我们这就来抢先打探一番,通过现有信息预估一下新核心的特性和性能。
AMD上一次宣布如此重要的产品还是2011年底,当时GCN架构横空出世,一扫AMD此前VLIW架构硬件利用率较低的阴霾,使AMD在GPU架构和产品性能上拥有了将当时称雄的英伟达Fermi架构产品挑于马下的实力。从2012年起,GCN架构不断地通过调整规格、推陈出新,为AMD赢得了市场认可和玩家的青睐。但不得不说的是,自那时起至今,AMD都在吃GCN的老本。近几代GPU产品在架构方面都没有革命性改进,只是在原来架构的基础上不断地优化,通过增添功能、缩放规模获得产品迭代。有些人说这是迫于工艺原地踏步的无奈,但NVIDIA却能在工艺没升级的情况下,通过架构改进获得能耗比的大幅提升,让AMD相当被动。
其实AMD并不缺乏创新,比如后一代GCN架构就率先用上了跨时代的HBM显存。作为GCN架构后的巅峰,去年发布的R9 Fury X已经在芯片面积上达到600平方毫米水平,这是AMD自推崇小核心甜点策略以来,很久没有尝试过的大核心产品了。虽说有HBM显存的增益,但是GCN架构与生俱来的能耗比较低、架构效率不高等问题依旧无法得到彻底改善,甚至都没法完美发挥出HBM的高带宽优势。在R9 Fury X核心面积已经和GTX TITAN X相差无几的情况下,性能却明显落后对手,无法帮助AMD重新夺回高端市场的玩家认可度。很显然,架构换代的需求已经刻不容缓。好在AMD终于在加州举办了图形技术峰会,公布了全新的代号为“Polaris”的GPU产品。宣称要为用户带来一场极其值得期待的史诗级架构革命,希望重拾用户信心。
很显然,AMD敢称史诗级架构革命,那么新显卡的GPU架构势必不再是基于老旧GCN的修补版,即使不是推倒重来的全新设计,也绝对是大刀阔斧式的全新改版。那么该架构是否能帮AMD重新获得竞争优势?让我们这就来看看它都具备哪些特殊设计。
之前AMD的GPU架构代号都是各种热带海岛,甚至还有海南岛(“Hainan”,被用在笔记本电脑上,一般对应Radeon R5 M230 GPU)出现。但是这一次AMD一反常态,使用了“Polaris”北极星作为新GPU的代号,这是为什么呢?
对此,AMD给出的解释是:AMD的目标是高效率地驱动每个设备上的每一个像素。星星是全宇宙高效率的光子生成器,这给了AMD灵感。看起来挺诗意的,想不到一贯以来给人们刻板印象的极客程序员和架构师们,还有如此温情的一面。
了解半导体的玩家应该非常明白,无论是CPU还是GPU或是其他芯片,更优秀的工艺都是性能提高的重要条件。当一个芯片能借助新工艺容纳更多的晶体管时,就能实现更多的功能和更强大的性能。无论架构设计得再合理,缺少优秀工艺都难以发挥芯片应有性能。反之,优秀的工艺却能在很多时候弥补芯片设计上的不足。但无可奈何的是,显示芯片厂商一直以来都采用代工制造模式,工艺水平取决于代工厂TSMC的发展情况。而TSMC近几年来工艺发展并不顺利,近5年都只能提供成熟的28nm产品。导致AMD和NVIDIA的产品换代非常被动。显然,在五年后的今天,28nm工艺已经不能满足GPU发展的需求了,尤其是DirectX 12等技术的出现,推动了整个图形业界的技术再次跃进,GPU也需要全新工艺来满足新架构产品的设计和制造,以带来跨越式的性能和功能改善。因此,无论是AMD还是NVIDIA,都准备在全新一代GPU上采用新工艺。但不同的是,NVIDIA应该还会继续和老伙伴TSMC合作,使用TSMC新的高性能16nm工艺生产下一代“帕斯卡”架构核心。而AMD则很可能将代工订单转投到GlobalFoundries和三星。GlobalFoundries(本文简称GF)大家应该很熟悉,就是从AMD剥离出去的半导体制造厂,是AMD CPU的指定代工厂。三星的加入显得比较意外,实际上没有三星提供的14nm技术支持,GF想给AMD代工GPU都难。
AMD认为GPU不仅仅是一个图形处理器,将会是一个多功能的协处理器,和CPU一起构成多方面应用的计算中心。
Polaris若能按计划使用14nm FinFET工艺,那就将是AMD首次将GPU拿给TSMC以外的工厂代工。
这一次AMD之所以没有再选择和TSMC继续合作,据称是因不满TSMC近年来越来越糟糕的代工服务能力。熟悉行业的玩家应该知道,AMD在GPU工艺升级方面一直比NVIDIA激进。依靠比NVIDIA快半步的工艺优势,赋予芯片更好的特性,常常能在竞争中给NVIDIA带来不少麻烦。但TSMC经常在新工艺启用的过程中给AMD带来麻烦,良率、价格、芯片质量一直是让AMD不满的问题。只是苦于没有别家代工厂有实力或愿意帮助AMD代工高性能GPU,只能勉强维持。但这样的局面在GF获得三星14nm LPP工艺授权后,迅速被打破。那么三星授权给GF的14nm LPP工艺究竟有什么特点,能从TSMC手中抢过代工大单?
其实在代工的选择上,AMD一直是很谨慎的,TSMC合作了多年,逼不得已AMD并不想换代工厂。但很显然,在经历了28nm的各种坑之后,TSMC向16nm过渡的情况也并不好,量产时间的推迟让TSMC先后丢掉了高通、博通等大单。虽说TSMC后续补救还算及时,在16nm FinFET(FF)之后,迅速推出了加强版的16nm FFP和针对低功耗的FFC工艺。但争分夺秒的竞争需要的就是时间上抢先,三星14nm工艺先于TSMC的16nm工艺量产,能为AMD争取到更早的流片和试产时间,可能是AMD放弃TSMC的一个重要原因。再加上在20nm时代,TSMC优先苹果订单,让AMD和NVIDIA不得不憋屈地使用28nm至今,也确实让AMD感到了威胁。所以将生产转回自家的GF可谓水到渠成。至于为何要同时交予三星,很可能是因为GF虽得到技术授权,但是产能估计难以满足AMD需求,需要借助三星保证芯片数量和质量吧。
Polaris核心的新工艺相比之前的平面工艺,具有显著的晶体管密度优势。
除了密度,FinFET相比传统工艺大优势在于提高了漏电控制,有利于提高芯片性能功耗比。
FinFET,相信大家不再陌生了,其全称是Fin Field-Effect Transistor,鳍式场效应晶体管。这个名词的首次出现还是在英特尔强推22nm工艺的时代,FinFET实际上就是当时英特尔大力宣传的“3D晶体管”。FinFET的目的是为了对抗越来越薄、越来越小的晶体管所拥有的不良物理特性(重要的就是漏电),并用于根本性改善20nm甚至更高级别制程下晶体管的性能。举例来说,在FinFET出现之前,AMD曾采用过多重电压岛、后偏置、高级时钟门控电路等多重技术,但都没有很好地解决漏电问题,导致芯片能耗比不佳,始终在竞争中受制于对手。从技术角度来看,FinFET将原本扁平、薄而不可靠的漏极和源极之间的连接“竖立”起来,在另一个维度上变相增加了厚度(或者面积),使得晶体管在继续缩小后还能够有比较好的性能表现。在使用了FinFET后,原本比较令人烦恼的漏电电流得到了有效控制,同时还带来了很多优秀特性,比如使用更低电压即可驱动、晶体管可承受电流上限也更高等。
AMD公布的对比图,显示在提供基本相同的图形性能出下,AMD新核心显卡(中)比NVIDIA当前的Maxwell架构显卡(下)功耗低得多。
而三星授权给GF用于制造Polaris核心的工艺,是继初代14nm Low Power Early(LPE)之后的改进版14nm Low Power Plus(LPP)工艺。LPE已经为我们带来过Exynos 7420等名满天下的产品,而LPP还将在LPE基础上进一步提升能耗比,减少15%以上漏电率,更利于制造高性能大体积芯片。
AMD在全新的Polaris核心上采用FinFET,有助于降低芯片发热、提高工作频率、降低驱动电流,终实现提高性能功耗比的目的。根据AMD的介绍,14nm FinFET相比28nm平面工艺,能在晶体管数量翻倍的情况下,还进一步缩小芯片面积。借此获得优秀得多的能耗表现和翻倍的性能。通过测试当前已经用14nm工艺流片成功的Polaris GPU,AMD宣称Polaris架构相比之前的Fiji等核心在能耗比上提升了2倍,也远远超过了当前NVIDIA的Maxwell架构。为此,AMD还特地公布了一段演示视频,视频中AMD使用了相同的软硬件平台,在相同设置下对比了某款Polaris架构GPU和GTX 950的功耗表现。在游戏画面都一样流畅的前提下,其中GTX 950的平台功耗为150W,而Polaris GPU的平台功耗仅为85W,只有前者的56%,整体表现相当令人满意。
我们说过,工艺只是重要的基础,架构是芯片性能的关键。Polaris核心显然不仅有三星的14nm LPP工艺撑腰,更重要的是AMD赋予了它一个全新的高效率架构。AMD在介绍Polaris架构时,提到了第四代GCN架构,也就是俗称的GCN 4.0。别看命名还是GCN,但和之前修修补补的初代GCN差别甚大。首先GCN 4.0架构下,跟执行效率关系紧密的GPU中指令调度器已经被重新设计。当然,跟指令调度器相关的周边模块也是重新设计或进行了大幅改进,以保证计算任务的调度更加高效和智能。不仅有更快的指令处理速度,还能根据负载和任务类型,自动划分指令,将复杂指令和重复性简单指令分别分派,尽可能让计算核心更多时候能处于高效率利用状态,提高整体计算性能。另外,跟计算性能关系紧密的几何处理器、流处理器核心、二级缓存等也是重新设计的,以进一步解决初代GCN流处理器集群使用效率不佳的问题。避免出现同一集群中,某些流处理器一直满载,而部分单元却无事可做的尴尬。与之匹配的外围显示引擎、显存控制器等也全部都经过了重新设计,能够达到更高的计算性能匹配,提供更小的核心和显存数据存取延迟,让整体性能和性能功耗比大幅度提高。至于显存搭配,并非全为HBM(后文会详细讲解)。在功能方面,此前只有Intel一家在视频编码、解码上独大,而GCN 4.0决定不再让其独美。除GPU计算核心,AMD还重新设计了多媒体协处理核心,全面加入了对H.265的支持,增加了原生的H.265 main10解码能力和H.265@60fps的编码能力。并加强了4K及其以上超高清分辨率硬件编、解码能力。借此,玩家们可以不再依靠高性能处理器,只需用GPU硬件辅助就能完成超高分辨率下的H.265影视流畅播放了。另外,GCN 4.0增加了原语丢弃加速器(Primitive Discard Accelerator)、硬件调度器、指令预取、高效着色器、显存压缩等功能,能够进一步配合DirectX 12 API、驱动等底层软件,提供更高的图形渲染效率。
名字里虽然依旧有GCN,但相比前代架构,Polaris架构重新设计了绝大部分功能组件,当得起“革命性”一词。
多媒体输出功能方面,Polaris架构正式开始支持HDMI 2.0a和DisplayPort 1.3两种先进的视频接口标准。HDMI 2.0a的主要特性在于带宽提升至18Gbps、支持3840×2160分辨率和50fps、60fps刷新率。音频方面能够提供多32个声道和1536kHz采样率,支持多个用户同时传输音频、视频流,还提供了对HDR传输格式的支持。而DP 1.3的规范则将带宽提升至32.4Gbps,拥有四条通道,实际传输速度高达25.92Gbps,高能够支持5120×2880分辨率,也同样支持多显示器。
显存将是本次产品更新的一个亮点。AMD已经在R9 Fury X上启用了HBM显存,其优势我们就不再赘述,其缺点则是被不少玩家诟病的大4GB容量问题。别担心,与Polaris架构搭配的新一代HBM2显存已经将大容量从此前的单颗1GB提高到了单颗大8GB。此前4颗HBM总计4GB,HBM2代4颗大可到32GB。另外,HBM引以为傲的位宽优势继续得到加强,HBM2单颗粒位宽可以达到2048bit,相比HBM的1024bit再次翻倍。当然,受制于高昂的成本,估计只有Polaris架构的旗舰产品能用上HBM2显存,且会有16GB标配和32GB高配之分。面向中端的Polaris产品则会搭配基于GDDR5改进的GDDR5X显存。GDDR5X相比GDDR5,预取数再次翻倍,从之前的8提升到了16,这样一来带宽又能在GDDR5的基础上继续提升。考虑到GDDR5转换至GDDR5X生产比较容易,成本控制应该也很容易让厂商接受,因此未来很长一段时间里,中端显卡将以搭配GDDR5X显存为主。
能耗比的大幅提升,显然更有利于Polaris架构GPU向移动设备部署。
在了解了Polaris架构的一些特性后,大家关心的应该是产品型号了。根据AMD Radeon事业部Raja Koudri的消息,Polaris家族目前有两款核心,分别被称为Polaris 11和Polaris10,两个一大一小,但目前并不知道确切的对应型号。只是说新显卡流片比较顺利,应该会在今年中发布,很可能在6月的台北电脑展上展示。
AMD还对比展示了14nm FinFET将带来的芯片面积上的变化
在CPU市场的持续失利,让AMD长期受困于亏损、裁员、拆分、重组等各种负面影响,甚至影响到了以往表现还不错的图形部门。以至于长达5年时间里,AMD都没有革新GCN架构,而是依靠GCN设计的先进性,先后力战了NVIDIA的Fermi、Kepler、Maxwell等多代架构。在Maxwell将GPU的性能功耗比推至28nm下的极限水平后,AMD更是大量丢失图形显卡市场份额。还好,充满激情的AMD还没有倒下,这次不仅公布了新显卡的消息,还公布了阔别已久的CPU架构换代计划。再加上有三星技术支持的GF终于在工艺上赶上了竞争对手的步伐,让AMD有了更大的逆袭资本。下半年好戏一定不会少,AMD很可能在CPU和GPU两个重要的市场上发布重量级产品,重新收拾旧山河,玩家们敬请期待。