新闻中心

EEPW首页>嵌入式系统>业界动态> AMD大爆发 Vega GPU架构技术要点总结

AMD大爆发 Vega GPU架构技术要点总结

作者: 时间:2017-03-21 来源:微型计算机 收藏
编者按:在今年一月份的CES展会上,AMD对外披露了Vega的部分技术细节,虽然关键的性能指标还不得而知,但我们还是可以从下列资料中可以看出Vega所具有的巨大潜力。

  几何渲染引擎:更灵活、更快速

本文引用地址://m.amcfsurvey.com/article/201703/345466.htm

  几何计算是3D渲染的基础,在的GPU中,几何渲染还是由固定的几何着色引擎来完成。专属硬件的优点是运行效率高、速度快,缺点是硬件处理缺乏灵活性,每一次几何计算都必须机械化地执行,而很难进行优化。

  我们举一个例子,右边两张图片分别是PC游戏《杀出重围:人类分裂》中的巨像之城(Golem City)的场景和该场景的几何线框图。介绍说,这幅场景有多达2.2亿个多边形需要进行计算,但最终输出的画面其实只有 0.02 亿个多边形,也就是大多数的多边形,其实都是后台计算、不需要被显示出来,但它们耗费了超过98%的计算资源。


AMD大爆发 Vega GPU架构技术要点总结

  《杀出重围:人类分裂》游戏中的场景


AMD大爆发 Vega GPU架构技术要点总结

  《杀出重围:人类分裂》游戏场景对应的几何线框图

  有鉴于此,越来越多的开发者抛弃了传统的几何单元,改用灵活的计算着色器来进行几何处理—通过对算法的优化,可以将大量的中间计算省略,达到节省硬件资源、提高游戏性能的目的。

在Vega架构中,也引入了这套机制——GPU的几何流水线中新增了名为 Primitive Shader(图元着色器)的新型计算单元,这个新的着色器可以舍弃大量的无效几何计算,从而精简、快速地完成任务。AMD的最终目标是彻底抛弃传统的几何单元、以这套灵活的着色器来代替它。

  此外,为了持续提升几何处理性能,AMD还引入了名为“Intelligent Workgroup Dostributor(智能工作组分发器)”的计算单元,它可以支持更多的着色器引擎,并且可以根据负载情况智能地在各引擎间分配几何计算任务。而当前AMD的GCN架构最多只支持4个几何着色引擎,没有增强的潜力。而即便在同样4个着色引擎的情况下,GPU每周期也能处理11个多边形、相当于现有产品的两倍。


AMD大爆发 Vega GPU架构技术要点总结

  Vega中的智能工作组分发器,允许支持更多的几何引擎。


AMD大爆发 Vega GPU架构技术要点总结

  Vega的几何效率提升了两倍

  下一代像素引擎

  Vega的像素着色引擎同样进行大量的优化,AMD将它称为Draw-streaming binning rasterizer(简称 DSBR,渲染流分仓光栅器)。

  DSBR引擎在执行效率上获得质的飞跃,我们知道,复杂的3D画面,需要进行大量的渲染,而其中绝大多数的工作都是位于后台,真正展现出最终画面的有效渲染只占据极小的部分—这与我们前面说的几何渲染类似。之前AMD GPU对此并没有很好的优化,都是直接进入到渲染环节。而DSBR引擎则对工作流程作了优化:它会先在一个高速缓存中对3D场景给定的对象预先处理,然后GPU清空掉这个缓存、再拾取起其余的数据。而DSBR就可以让GPU抓取出有效渲染和非可视像素的无效渲染,并将无效的渲染操作省略掉,只专注于可视部分的像素渲染。


AMD大爆发 Vega GPU架构技术要点总结

  DSBR引擎同样通过优化、显著提升执行效率

  换言之,DSBR并不直接提升硬件的能力,而是通过削减无效渲染、减轻硬件负担,同样达到提升像素渲染性能的效果。这套机制同时也意味着,节省功耗、降低发热量,具备更高的性能提升潜力。

  为配合DSBR的运作,AMD对Vega的缓存架构进行重大改进,GPU的后端单元可以直接访问到片上的二级高速缓存,数据的访问、操作动作直接在此实现。而传统的GPU中,纹理和像素的内存读取操作并不一致,比如渲染纹理操作时,数据要先写到显存中、然后再被读取到纹理缓存里,也就是每一次数据都要来回搬动、效率低下。而如果开发者要执行纹理、像素同步渲染时,程序指令与硬件工作流程就会出现冲突,增加了编程的难度。显然,Vega的改进要渲染流程简单了许多,大量的数据访问都可以在片内二级缓存高效率地完成,对性能的增益显而易见。

AMD大爆发 Vega GPU架构技术要点总结

  Vega的后端渲染单元可直接访问二级缓存

  不过,DSBR只是Vega像素渲染的一个可选项,实际的任务还是根据游戏的情况来完成,有的游戏还是对传统架构进行编程,那DSBR暂时还无用武之地。但对支持该特性的新游戏而言,DSBR可以带来显著的效能提升。



关键词:AMDVega

评论


相关推荐

技术专区

关闭