新闻中心

EEPW首页>手机与无线通信>编辑观点> 透视麒麟9010:博采众长但依旧任重道远

透视麒麟9010:博采众长但依旧任重道远

作者:lijian 时间:2024-04-23 来源:EEPW 收藏

随着华为系列手机的发布,两个半导体器件单元又一次成为万众关注的焦点,相比于图像传感器的RYYB技术变革,显然受到的关注更多。作为一款曾经有望成为业内第一颗3nm工艺的应用,因为美国的全面技术管制不得不反复修改其设计和工艺选择,最终华为交出了如今这样水准的着实难得。

本文引用地址://m.amcfsurvey.com/article/202404/457968.htm

让我们更好审视麒麟9000S

从热度上,麒麟9010相比横空出世的麒麟9000S似乎要小不少,毕竟麒麟9000S是华为被完全管控后独立推出的第一款麒麟应用,不仅肩负着为华为IC设计能力正名的机会,更要扛起华为消费电子品牌的未来,否则以华为前面一年多选择骁龙产品带来的手机业务下滑态势,曾经扛起高端手机国产大旗的华为品牌可能面临被边缘化的风险。在这样的内忧外困前提下,华为顶着诸多压力推出麒麟9000S实属无奈之举,这也是麒麟9000S诸多要素到现在都没有披露的重要原因。不过既然该踩的雷和该牵连的队友都已经让麒麟9000S顶风趟出来了,那么麒麟9010面临的压力就明显小了很多,因此诸多媒体似乎终于有机会好好研究一下麒麟9010这款代表华为目前芯片设计水平的处理器了,这也让我们可以从它身上好好分析一下华为的移动应用处理器设计思路。

图片.png

目前在网上能够看到一些所谓自媒体曝光了麒麟9010的芯片底部刻字,笔者个人认为不靠谱或者只是官方的宣传图,毕竟芯片底部刻字标识了生产信息,所谓2035这个被制裁的时间点印在芯片上为了时刻提醒的理由实在牵强。更重要的是,麒麟9010又不外卖,如果想要真的看芯片信息无疑要拆掉PCB上的焊接单元,这对很多自媒体来说似乎要求有些高了。至于从工艺上来说,笔者打听了一下,应该还是跟之前的麒麟9000S一样的工艺水平,可能在良率方面略有提升,整体成本会稍微下降一些,笔者预估大概在2%-3%左右吧。这方面笔者说不太透,建议大家观看TechInsight去年的详细报告,点到为止不多赘述。从现在的部分功耗测试来说,这个工艺的改进目前也比较有限,因为大核的频率下来了但处理器功耗并没有降低多少,从这点上我们可以暂时认为工艺水平保持一致比较合理,这也许是目前非美技术之外能够做到的最先进水平了。

说完最基本的工艺,我们还是更关注性能表现和设计思路方面的变化。相比于少得可怜的麒麟9000S处理器结构,麒麟9010资料倒是相对齐全,各类跑分数据也很详尽。麒麟9010的各种跑分数据目前网上可以查到很多版本,内核测试的基本情况也大抵相似,我们暂时选择其中的一些数据作为参考基础进行分析。首先,麒麟9010的结构方面已经比较明显,按照华为一贯命名规则,麒麟9010应该是麒麟9000S的迭代版本,那么基础结构应该是差不多的。根据目前了解的信息,其大核为一颗2.3GHz的泰山核心,中核为3颗2.18GHz的泰山核心,小核为4颗1.55GHz的A510,GPU是Maleoon 910。从几个内核架构以及华为之前麒麟的设计思路来说,泰山应该是V8架构基础上华为自己开发的内核,大小核都是基于V8架构在保持架构统一性的同时,避免了采用华为无法选择的V9架构,从而规避未来迭代的风险。这种设计风格类似于苹果A系列处理器的内核,也是手机处理器中仅有的两家自行设计内核的厂商。

至于这颗很神秘的Maleoon 910架构未知,但从命名规则猜测似乎有Arm Mali的一些影子,不过海思以前一直用Mali的GPU,而且这颗GPU的优化在麒麟9000S里表现实在不太好,很多游戏的适配性并不好,从这点上看似乎跟Mali架构并不亲近。因此Maleoon 910应该是华为自行开发的GPU架构,目前看性能表现尚可但GPU最大的问题往往是适配性,这个因为麒麟9000S时很多应用还是基于安卓架构开发,所以表现不佳也非常能理解,这点我们文末会继续深入剖析。

博采众长:Arm TCS+ Apple

1大核+3中核+4小核,麒麟9010这种内核布局像极了Arm在2020年开始的TCS移动计算解决方案的全新架构,虽然华为并不能直接采用Arm的全新内核,但处理器布局设计还是可以借鉴参考的。按照Arm在推出TCS时的介绍,相比于苹果依然沿用的大小核结构,这种三个不同等级内核的结构能够大幅提升处理器的能效,根据不同任务需求进行更好地处理资源分配。相比于9000S,麒麟9010目前看处理器最大的改变就是大核的主频从2.62GHz下降到2.3GHz,但单核的处理能力从1314提升到1442,麒麟9010的IPC值达到了627(作为对比,骁龙8Gen2 IPC值为636。,而骁龙8+ Gen 1 IPC值为578。),相比麒麟9000S的501提升了25%,这意味着在相同的时钟周期内,麒麟9010能够执行更多指令,从而实现更高的运算效率和更强的单线程处理能力。IPC的全称是( Instruction Per Clock,每时钟周期指令数),也就是说在同样的频率下,IPC越高,CPU干的活越多,当然性能就越强。在多核处理器时代,IPC这个指标参考价值更多代表着对复杂任务的处理能力。对处理器来说,增加内核是提升IPC最简单粗暴的办法,但在内核数量一定情况下,提升IPC就只能靠优化处理处理线路、架构和指令集,或者提升缓存效率等方面。按照Arm对Cortex-X新内核的优化路线看,每一代的IPC提升在11%-13%左右,如果超过20%那就意味着有明显的架构大幅优化,比如X3这个系列因为彻底抛弃32位代码而实现性能大幅提升。从这个角度看,麒麟9010的大核架构优化应该是上了一个层次,这是一个非常值得期待的突破点。根据部分数据对比,麒麟9010走的是大IPC低主频策略,因为主频偏低,所以麒麟9010的大核单核虽然IPC方面拥有巨大提升,但整体性能依然落后当前顶级处理器不少。当然,主动降低大核主频,麒麟9010大概是从两个方面进行了权衡,其一是对功耗的控制,高主频意味着高功耗,降低大核主频有助于控制整体功耗,毕竟9000S的功耗表现并不算出色。虽然按Arm一贯的宣传口径,高主频带来高处理能力,这可以让同样负载量的任务用更短时间执行完成,从而整体功耗会大幅降低。但这种思路的适用性在系统的结构中实际表现如何,也许需要很长时间才能证明。第二个就是对新架构调整的裕量控制,毕竟调整架构之后的实际表现如何,华为受限于被管制无法充分模拟仿真,为了确保系列的用户体验,不妨先做个温柔的主频设定看一下大规模应用后的实际效果,如果实际表现达到预期,那么下一代只需要提升主频到2.6,就能够实现至少15%的单核性能提升,这样稳扎稳打的策略适合巩固华为手机的市场份额。

图片.png

图注: Arm TCS的结构基本就是大中小三种内核集成到一个应用处理器上,内核分配和华为麒麟9010S内核基本一致。

图片.png

图注:苹果A14的大核微架构和麒麟9010的大核微架构一样,皆为8解码8发射的前端宽度,其中ROB深度更是高达630,同时两者后端的整数执行单元数量也一样为6个

如果说麒麟9000S是被美国全面管控后华为处理器设计思路探索的开路先锋,那么麒麟9010则给出了华为内部探索路线后的一个选择(当然未必以后都是这个方向),那就是选择和Apple(那个性能震惊业界的M1,A14的大核整数IPC较麒麟9010的大核高出31%,这主要是工艺受限的原因)一样的路线——低主频高IPC。这个选择意味着什么呢?从瞄准目标上看,意味着麒麟9010处理器瞄准的未来市场更为开阔,更意味着华为对自己的系统充满信心。低主频带来的是热损耗降低,高IPC带来的是单核处理效率更强大,这种设计更多的是体现了处理器和操作系统之间的默契程度。当年苹果的M1问世第一次让移动处理器从处理性能方面实现了对桌面处理器的超越,受限于散热和尺寸,移动处理器的主频无法跟桌面处理器抗衡,只能大幅修改架构提升IPC来追平处理器性能表现,当然这种性能表现背后的逻辑无疑是封闭的,对于冗余度过高的系统是无法体现优势的,甚至会拖累实际表现。而苹果和华为目前的共通点就是一个封闭的生态系统,这是麒麟9010选择低主频+高IPC设计思路的最大支撑。只不过,苹果的出发点是要代替英特尔的处理器,而华为的选择则有很多无奈,比如无法选择更新的Arm V9架构导致处理器主频提升受限,比如无法选择先进的工艺降低功耗所以只能靠降低主频减少热损耗,比如芯片内传输接口传输的速度也无法做到极致,比如没有先进封装无法在封装方面弥补工艺差距带来的密度不足……

综合来说,麒麟9010的性能该如何定位其实是个比较尴尬的问题,毕竟在工艺、EDA和速率各方面均受限的前提下,麒麟9010性能测试表现出来实际水平略逊于骁龙8 Gen 1的数据(2年前),这已经是很难得的成就了。从工艺上和架构上,麒麟9010大概用三到四年左右差距实现了2年左右的性能差距,对于正常的公司都是值得尊敬的成就,何况是几乎先进技术全面受限的华为呢。

还是要看鸿蒙

摩尔定律映射到手机上的迭代速度是多少现在已经很难统计,不妨我们按照Arm TCS的性能递进速度每年10%左右的速度推测,大概三年左右处理器表现更新一代。那么一款两年前旗舰水平的处理器是否撑得起整机旗舰表现呢?笔者的回答很简单,看操作系统。

基本上已经一统江山的Arm为啥不断拼命提升移动平台的整体性能?一方面是为几个客户提供持续保持竞争力的内核和解决方案,另一方面也是不断优化自己内核IP的设计以巩固自身优势并争夺更多MPU和CPU的市场。从手机器件处理器的性能来看,其实对于95%以上的用户是明显过剩的,最近两年手机市场更新换代速率的下滑虽然大部分厂商归咎于经济下行消费不足的原因,但更主要的原因是旗舰手机的性能足够其支撑三四年而使用体验没有明显下滑。

选手机不等于选处理器,毕竟我们选购手机的目的不是没事跑个分互相比较分值高低,而是要感受手机带来的全方位体验。在这个大前提下,操作系统和处理器的配合要远比处理器跑分的性能更代表手机的实际表现。当年的麒麟9000为何能够在性能上实现对同期骁龙的反超,很大程度是华为对UI的优化和处理器设计是同步的,这一点上,安卓系统可怕的冗余和百花齐放的各种UI无疑让骁龙始终无法像苹果A系列处理器一样轻装上阵。当年苹果的M1芯片强悍的性能表现在Window和IOS上跑分差异可以达到17%以上,说明了封闭系统对硬件性能的激发作用非常重要,而对麒麟9010来说,鸿蒙系统的加持也许能够助其弥补在内核跑分性能方面的诸多不足。多说一点,基于麒麟9000S的Mate 60在某些游戏和图形化应用上的表现不佳,很大程度上来自于相关APP对鸿蒙系统兼容性方面需要专门设计和优化,而最近的12306卡顿问题,也是因为该APP是针对安卓设计的,在鸿蒙OS下优化不够以至于在海量数据情况下的体验不佳。

图片.png

这也就是华为在Pura系列上另一个值得关注的变革,华为计划全面推行的操作系统,并且在过去的一年多时间里一直在跟各个APP开发者进行基于鸿蒙OS的APP专门设计开发,比如前段时间的微信和华为之间的问题就是双方就专门开发基于鸿蒙OS的微信应用之间的探讨。可以预见在短期的一两年内,这是华为在鸿蒙生态中最主要的工作,也是彻底告别安卓生态的必经阶段。一旦基于鸿蒙专门设计的生态软件APP全部得以实现,那么鸿蒙就如现在的IOS一样,可以更好地管理应用程度对处理器资源的调用,从而实现更高的工作效率,届时硬件差异在实际体验中带给用户的感受差别将会越来越微小。只是这一步要真的走成了,未来整个移动应用生态也许会产生剧变,一如当年淘宝上线免费跨行转账功能一样震撼。

思考及期待

麒麟9010作为一款基本透明的处理器,能够让我们更好地了解目前华为的设计实力以及处理器设计思路。从目前的性能指标上看,麒麟系统的主频短期内可能需要近一步提升以确保单核性能。毕竟对比苹果A16的2大核3.46GHz和4小核的2.02Hz,以及高通骁龙1个3.3GHz X4 超大核 + 3个3.15GHz A720 大核 + 2个2.96GHz A720 大核 + 2个2.27GHz A520,在主频方面受限于工艺的表现可能存在不小的差距,即使架构优化提升了IPC,但毕竟主频差距过大还是会影响单核处理能力。

另一个问题则是工艺和良率。虽然TSMC的3nm据说今年会用到A17上,在华为手机国内竞品方面则最早也要2025年4月才能上市。但是毕竟华为只能用国产工艺,短期内等效密度从7提升到5的可能性不会太大,加上3D封装技术也存在一些受限情况,那么可能未来两三年内麒麟系列处理器的工艺节点不太可能形成突破,或者即使有所突破但良率和成本可能无法支撑起P和M全系的用量,从目前工艺的成本和良率方面信息看,Pura系列的高价格有很大一部分是要为工艺投入埋单了。

最近据说12nm的FDSOI技术量产了,不知道未来是否国内可以参考一下这个特殊工艺,该工艺主要技术来自于欧洲,虽然12nm似乎应用到手机处理器上有点落伍,但如果能够有更好地工艺手段加成,也许等效密度可以达到7甚至5,而FDSOI技术在提升频率方面的优势和平面工艺对封装的低要求,对麒麟系列来说似乎并非没有可取之处,如果用到手机处理器……



评论


相关推荐

技术专区

关闭