新闻中心

EEPW首页>嵌入式系统>设计应用> ARM体系结构研究

ARM体系结构研究

作者: 时间:2016-11-28 来源:网络 收藏

4)2010年5月——Intel发布了最新的Intel Atom Processors系列,开创性在维持现有系统的高性能的同时地降低了功耗,使得制造轻薄的手持设备、Tablet PC、智能手机等成为可能。

从Intel投入的精力和一些列的动作我们可以看出Intel向弥补自己在移动计算领域缺席的决心,但是从时间上来看,intel同ARM相比起步晚太多了,所以至今为止,除了上网本有采用Atom架构的处理器外其它移动计算设备很少有采用Atom处理器的(Nokia的MeeGo平台也许算是一个吧)。Intel的Atom在移动计算市场上的劣势还不仅仅存在于起步太晚上。

自从Itanium的失败后,Intel的后来的高层始终坚信着一点——要保持向前兼容才能获得商业上的成功。于是Atom被无辜地套上了CISC的枷锁,如前所述,ARM芯片采用的是经过广泛验证的RISC体系,这无论是在功耗还是在性能上都优于RISC架构,但是Intel为了实现向前兼容的目标,并没有直接在Atom上采用RISC指令集。大家也许还认为先行的x86芯片还是CISC的架构,但其实,x86只是披着一件CISC外衣的RISC架构罢了,在Intel近期的CPU流水线中,使用的是一种叫做μops的指令集,从内存中调入的RISC指令会经过翻译,变成一条或多条μops指令(也有可能多条指令变成一条μops指令),而且还有极少数指令,需要通过rom译码之后执行,这些额外的操作无论是在功耗上还是在性能上无疑都是一个累赘。使用μops流水线无法越过Power的天堑,Intel工程师们剩下的只有CISC流水线了。无奈的设计人员第一个想到的是1989年发布的486处理器,这颗处理器使用了单发射(single-issue),顺序执行(in-order)的CISC流水线。即使是在那个时代,486也并不是一个顶级处理器,Atom处理器必须对此加以补充。多发射技术肯定是必须的,所以Atom处理器支持双发射。而现代处理器常用的乱序执行(Out-of-Order Execute)对于追求低功耗的Atom处理器是奢侈的,经过简单地评估,Intel设计人员暂时放弃了乱序执行这个已经被广泛验证,可以显著提高流水线执行效率的功能。同时486处理器使用的5级流水线并不利于处理器主频的提升,Atom处理器将其提高到16级,如图2.7所示。


图2.7Atom采用的16段流水线

这不是Atom处理器流水线的全部。Atom处理器还含有两级预先译码部件(Predecoder)。因为传统的x86指令并不等长,而是16b~120b不等的,Predecoder部件的作用是划分指令边界,然后将其导入L1指令Cache。因此虽然Atom处理器L1指令Cache的大小为36KB,而实际可利用大小仅为32KB,剩余的4KB用来存放SOI(Start of Instruction),EOI(End of Instruction),等一些TAG信息。Atom处理器可以直接处理多数CISC指令,但是仍然有一些过于复杂的CISC指令被分解为若干个μops,再进入指令流水线。但是Atom处理器的流水线并非没有可取之处,这颗处理器可以直接执行ALU/Memory指令。这类指令首先被分解为ALU和Memory两个微操作,然后成对进入流水线,虽然Memory操作仍不能先于ALU操作执行完毕,也明显提高了这类指令的执行效率。为了弥补没有使用乱序执行的缺憾,Intel的设计人员采用了Intel一向很称道的HT(Hyper-Threading)技术,即超线程技术,这种技术能够显著提升系统的响应性。因为它的主要设计理念是,在一个物理CPU上实现了两个逻辑的CPU,这两个逻辑的CPU拥有自己独立的寄存器组还拥有独立的APIC(Advanced Programmable Interrupt Controller)等其它资源,但是它们共用一条流水线,在一条线程由于执行某种耗时操作而挂起的时候,另一个线程的代码可以使用这条流水线,同时它们可以同时跟踪自己的中断,而互不干扰。

Intel工程师们为了实现向前兼容,还不得不放弃很多最新的、优秀的芯片设计方法。从而使得Atom处理器有一种背负历史使命的厚重感,少了一些现代的轻盈与高效。但是我们也看到,Atom处理器最开始是跑上网本的,也正是由于其一直秉承的向前兼容理念使得上网本上可以安装xp或者linux系统,然而,在上网本上跑各种PC中的软件却让人愈发感觉Atom处理速度的不足。Intel拥有着这个星球上最顶尖的芯片工程师,但是他们的才智却被花在了解决x86那些乖张、荒谬的处理逻辑上。性能并不是Atom处理器的优势,并不出乎体系结构专家的意外,在许多Benchmark程序下,Atom处理器落后于Cortex A9处理器,如图2.8所示。而且Atom处理器的功耗与ARM处理器目前并没有可比之处。

图2.8 Atom与Cortex Benchmark性能测试对比

由于早些时候,Atom投入的是Netbook上网本市场,相对来说先前兼容所带来的收益还是很有优势的,但自从乔布斯捧着一个iPad站在了PC大卖场的舞台后,Netbook时代就此终结了。而这时候唱主角的,却是ARM与苹果。

注释:

【1】System-on-Chip技术是一种高度集成化、固件化的系统集成技术,其核心是要把整个应用电子系统全部集成在一个芯片中,它通过在单一芯片中嵌入软件,实现多功能和高性能,以及对多种协议、多种硬件和不同应用的支持。

一、小结

二、参考文献

1.http://www.hyqb.sh.cn/publish/portal2/tab270/info1268.htm提高嵌入式系统的Java应用性能的技术——Jazelle DBX。

2.http://www.arm.com/products/processors/technologies/jazelle.php——ARM主页。

3.ARM指令集详解——来自WWW。

4.http://www.hudong.com/wiki/arm#5——互动百科。

5.http://www.cnblogs.com/leaven/archive/2010/10/28/1863744.htm l——Cortex系列ARM核心及体系结构介绍

6.http://en.wikipedia.org/wiki/ARM_architecture#Advanced_SIMD_.28NEON.29——维基百科。

7.NEON Support in the ARM - White Paper——Sep. 2008。

8.http://www.intel.com/technology/atom/——Intel Home Page


上一页 1 2 下一页

关键词:ARM体系结

评论


技术专区

关闭