新闻中心

EEPW首页 > 消费电子 > 新品快递 > Tensilica发布四款用于SoC设计的视频处理引擎

Tensilica发布四款用于SoC设计的视频处理引擎

——
作者:时间:2006-12-12来源:收藏
  发布预先定制的四款用于设计的Diamond Standard VDO(ViDeO)处理器引擎,可以支持多标准多分辨率视频模块。面向移动手机和个人媒体播放器(PMPs)应用,这些视频子系统的设计是完全可编程,可以支持所有流行的VGA和SD(也称D1)视频编解码算法。包括H.264  Main Profile、VC-1 Main Profile, MPEG-4 Advanced Simple Profile (ASP)和MPEG-2 Main Profile。其算法的分辨率支持720x480 (NTSC) 和720x576 (PAL),同时也支持较低分辨率,如QCIF、QVGA、 CIF 和VGA。 

  Diamond Standard VDO 引擎在处理器上通过软件方式来实现所有视频关键处理的功能,包括网络抽象层(network abstraction layer,)、图像层、条代层(slice layer)、比特流解析、以及熵解编码,包括在H.264 Main Profile解码器中进行CABAC(Context-Adaptive Bin

ary Arithmetic Coding)解码。大多数其他解决方案都忽略了该功能,或采用独立的复杂且不可编程的硬件模块,或利用700MHz普通CPU来实现该功能(这种方法明显增加功耗)。通过在指令集扩展中实现对CABAC的支持,创造出一款低频低功耗, 面积少于典型CABAC硬件一半的CABAC模块。 
  Diamond VDO系列提供Baseline Profile和Main Profile两种解决方案 –Main Profile提供更佳的数据压缩率和视频质量,是面向高级手机和PMP应用的D1或者更高分辨率的更好的编解码机制。大多数其他的视频解决方案只实现Baseline Profile的视频效果。 

  总裁兼CEO Chris Rowen表示,“Tensilica已准备好向那些将开发高品质视频产品的半导体制造商和系统 OEM公司提供全部经过测试的新产品解决方案。希望创造出象HiFi音频引擎一样的成功方案。HiFi音频引擎已被广泛应用于数十款流行的手机设备中,其中包括摩托罗拉公司最新KRZR和RIZR手机。” 


  基于Xtensa处理器技术的架构 

  为开发新的Diamond Standard VDO系列,Tensilica采用了Xtensa®可配置且可扩展处理器技术,创造了一个双处理器的子系统模块,包括一个集成DMA引擎,能以极低时钟速率实现完整D1 Main profile的解码和ASP编码(完整的H.264 Main profile解码仅需172MHz,而MPEG-4 Advanced Simple Profile (ASP)的解码仅需156MHz)。 

  Diamond VDO双核架构包括基于Xtensa架构配置得到的一个流处理器和一个像素处理器。流处理器指令集对视频数据(熵解码、运动向量的预测等等)的串行式处理进行了优化。流处理器需要32K字节的本地数据存储器,40K本地指令存储器。其指令的宽度优化到32位。像素处理器指令集采用SIMD(单指令多数据)技术,对像素数据的并行式处理进行了优化。像素处理器需要40K本地数据存储器,24K本地指令存储器。处理器之间的内部通信是通过一个128位的直连接口实现的,而外部视频引擎接口通信是通过2个32位的总线实现的。 

  Tensilica在Diamond VDO系列中定义了400多条视频专用指令,与通用DSP或通用32位微处理器相比,性能显著提升。这些指令是针对视频处理中性能要求苛刻的部分优化得到的,这些算法部分包括:CABAC,它可得到H.264 Main profile视频的更高压缩效果;CAVLC(Context-adaptive variable-length coding),是一种用于H.264 Baseline Profile和 Main Profile的低复杂度压缩算法;Deblocking:去块效应,可减少在高压缩视频码流中的由块效应所引起的失真;Transforms:各种变换(H.264中有很多种变换,在这是说支持多种变换)进行空间域的压缩变换,类JPEG处理;运动补偿和运动估计,用于在低速码率条件下得到高质量画面的算法。 

  Tensilica提供全套软件包 —— 包括解码器和编码器 

  Tensilica针对新Diamond VDO引擎开发了编码器和解码器,客户能直接从Tensilica购买到软硬件完整的解决方案,设计工程师不用依赖第三方应用提供商。Tensilica同时提供全套与之适配的软件开发工具链,包括一个基于ECLIPSE框架的高级集成开发环境、一个世界级编译器、一个周期精确(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工业标准GNU工具链。另外,Tensilica广泛的合作伙伴网络提供操作系统、调试工具、ICE解决方案、以及其他有助于将Tensilica处理器快速设计进其产品中的支持。 

  基于处理器的视频解码的灵活性 

  新Diamond VDO引擎相比与基于硬件的视频加速器和常规CPU结合的传统方式会相当受欢迎。首先,Diamond VDO IP核减少了系统主控CPU的全部视频解码任务– 包括全部比特流解析。传统的硬件加速器仅可减少如运动估计那样的像素处理工作,而将大部分计算负担(经常需要100MHz的持续的主控CPU开销)交由系统控制器来完成。 

  第二,传统解决方案包括了一个CPU和一个硬件加速器,当数据通过系统总线在CPU和加速器间进行传输时会产生大量的功耗 –通常出于方便,其他方案不计算这部分功耗,这样使得他们宣

称的硬件加速器模块本身的消耗很低。 
  第三,当Diamond VDO引擎没有被用于进行视频处理时,可随时以一种相当于有500多 Dhrystone MIPS处理能力的通用CPU 来执行其他系统任务 – 相反一个特定的视频硬件模块是不能被重用的。 

  第四,Diamond VDO引擎是可编程的,因此可支持今后出现的视频标准。 

  最后,Diamond VDO引擎面积小,其面积在130nm工艺下仅有8mm2(包括处理器逻辑和内部存储器)。 


  SoC的小面积低功耗解决方案 

  Diamond Standard VDO系列针对移动应用而优化,比其他竞争产品具有更小面积、更低的功耗。通过运用Xtensa处理器的一种特征-细粒度门控时钟再结合可编程的电源管理指令(可以降低各种负载情况下视频处理的功耗),其动态功耗被降至最低。进一步的能耗利用率的提升是通过DMA引擎和流处理器与像素处理器间的接口实现,而后者令外部存储器带宽要求降至最低。在节省面积方面,例如,Diamond 383VDO,其面积包括存储器仅占10 mm2;全功能Diamond 388VDO可在D1分辨率下,提供完全的H.264 Main profile解码和MPEG-4 ASP编码的支持,而其包括存储器的面积仅有 12 mm2,且在TSMC 0.13G工艺技术下运行速度为200MHz。



评论


相关推荐

技术专区

关闭