Pascal架构GP106芯片主要有以下几个明显的特质。
★超过10组全新设计的,包含了几何引擎、光栅化引擎等的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PE。同时还管控5组基本的SM渲染单元,每个SM单元包含8个负责处理材质以及特种运算任务的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
★制程采用了来自台积电的16nm FINFET工艺。
★拥有3个64bit组(两个32bit为一组)的显存控制器,总计192bit位宽。每个32bit的显存控制器包含了8个ROPs单元和256KB二级缓存。所以,我们在终的规格表中可以看到GTX 1060拥有共计48个ROPs单元和1.5M二级缓存。
★针对PolyMorph Engine,PE引擎进行了改良。现在PE包含了为VR设计的The Simultaneous Multi-Projection Engine。在高负荷情况下,SMP引擎可以大量减少VR所需的渲染工作量。
可以看出,GTX 1060所采用的GP106核心仍然基于全新的Pascal架构,采用全新的16nm工艺制程。在16nm工艺的强大优势之下,GP106核心内部集成了44亿晶体管。虽然逊色于同为16nm工艺的GP104的72亿,却远远超过了相同定位的上一代产品GTX 960的29亿,超越幅度达到了50%,而核心面积却只有Maxwell架构的GTX 960的88%左右。
从规格表上可以看到,GTX 1060核心的流处理器数量为1280个,正好是GTX 1080的一半。纹理单元为106个,ROPs数量为48个,并且由三个64bit的显存控制单元组建了192bit/192GBps的显存通道,容量大小为6GB。而且单从频率上来看的话,其基础频率1506MHz,大Boost频率1703MHz的范围更是来势汹汹,遥遥领先上一代产品GTX 960。单从GP 106的规格来看的话,无疑它已经绝对领先于GTX 960,各项指标均有大幅度的提高。如果仅仅从规格上来看,GTX 1060相比GTX 980在CUDA数量上要逊色不少,接近800的CUDA流处理器数量缺口,能否凭借更高的频率、更高效率的核心架构以及更先进的制程工艺来弥补呢?NVIDIA宣称的超越GTX 980的性能是否能实现?我们将在稍后的测试中一一验证。
GP106核心
源自GP104的Simultaneous Multi-Projection硬件多重投影引擎