研华支持采用了 AMD Fusion APU 的丰富显示应用

——

作者：Cameron Swen和Kelly Gillilan，AMD嵌入式解决方案时间：2011-11-03 来源：电子产品世界收藏

　　DirectCompute和OpenCL

本文引用地址：//m.amcfsurvey.com/article/125458.htm

　　OpenCL和DirectCompute这两种开创性的根据帮助开发人员从单线程标量软件转向了多相处数据并行软件应用。自从AMD收购ATI的3年里，通过GPU硬件加速应用的开发人员所使用的根据也经历了巨大变革。2007年以前，除了3D应用以外，开发人员的其它应用都局限在使用Radeon卡或FirePro加速器。然后，AMD首创推出了“CloseTo Metal”(CTM)接口为早期的GPU计算先驱们提供了一系列低阶的专用接口，可用于开发GPU加速应用。

　　一年后，AMD扩大了GPU软件工具包，发布了ATI Stream S D K 和 B r o o k+，是一种开源的类似于C语言的工具，可使用于计算任务的AMD GPU的使用更简化。 2010年，Khronos Group发布了跨平台标准进行并行计算的OpenCL，以及DirectCompute这一可辅助GPU计算应用的 Windows DirectX API。OEM目前在GPU计算中已经有了2个标准工具选项。DirectCompute的数据结构兼容DirectX 10和DirectX 11应用编程接口(APi)并简化了向上述嵌入式应用添加GPU加速的进程。

　　不使用Windows的OEM也可以选择OpenCL，尤其是已经采用相似OpenGL处理独立显卡的情况。OpenCL支持数据并行(如SIMD)和任务并行执行2种模式。它采用兼容 OpenGL API 的数据结构，因此可以简化向 OpenGL 应用添加GPU计算加速的步骤。AMD的OpenCL编译器支持Radeon 4000 和 5000系列GPU和多核 x86 处理器系列。

APU信号是集成的重大突破

　　AMD Fusion家族处理器采用了APU(加速处理单元)，因为APU集成了CPU和离散GPU，在降低功耗的同时提升了图形数据带宽。

　　尽管APU的标量x86内核和SIMD引擎共享系统内存的共同路径，AMD的第一代设计将该内存分为多个区域，一部分由运行x86内核的操作系统管理，其它区域由运行SIMD引擎的软件管理。AMD供应商提供了高速区块传输引擎，可在x86和SIMD内存分区之间移动数据。与外围框架缓存和系统内存之间的传输不同的是，这种传输从不会占用系统外部总线。软件开发人员可在其它区块执行数据传输的同时，对SIMD内存进行数据存取操作。 Insight 64预测将来APU架构将发展成为更加无缝内存管理模式，允许更高级的性能扩展。

　　AMD架构将x86核心和GPU核心集成到了耽搁芯片，以技术为主导的OEM即可将向量运算整合到之前受到传统多核CPU计算性能限制的程序中。向量设计强调单指令多数据(SIMD)操作，旨在为计算密集型应用提供更优越的性能。

　　总体系统性能也因为添加了离散GPU而提高。至今为止，晶体管的数量限制主要源于授权的双芯片解决方案。 APU的86 CPU核心和SIMD GPU引擎共享系统内存的公共路径，可有效防止这些限制。经过多年的辩论后，已经明了的是双方都是正确的;现在已经不是“非此即彼”，而是“既/又”的情形。一些在数值上密集的问题可交给并行算法，其他的则不需要。当优化后用于并行计算的设备不能以并行方式运算时，设备将做诶无效的标量处理器使用，且该设备的打过书并行计算都将专为空闲。相反的，优化后用于标量计算的处理器在很多算法中不能进行并行计算，因此受到标量处理速度的限制。标量处理器每次在数据阵列中运行一个元素。向量处理器，例如用在高级GPU中的，则可以同时支持数十个、甚至数百个计算单元同时计算。

新闻中心

研华支持采用了 AMD Fusion APU 的丰富显示应用

评论

相关推荐

技术专区