新闻中心

EEPW首页>嵌入式系统>市场分析> 中国服务器芯片迎来高光时刻

中国服务器芯片迎来高光时刻

作者: 时间:2023-11-16 来源:半导体产业纵横 收藏

最近,中国本土出现两大亮点:首先,又进一步,特别是以山东大学部署的采用CPU 的服务器为代表,十分引人关注;其次,基于自研架构的高性能芯片继续取得本土客户的认可,凸出代表就是华为和龙芯自研的 CPU,特别是华为的,市场接受度进一步提升。

本文引用地址://m.amcfsurvey.com/article/202311/452945.htm

中国芯片和系统进展

RISC-V 指令集架构是免费、开源的,提供了一种更快、更便宜的芯片设计方案,而且,RISC-V 的结构使其非常适用于处理各种应用和复杂计算需求的云原生环境。近些年,RISC-V 对英特尔和 AMD 使用的 x86 架构,以及亚马逊、苹果、三星和高通等公司使用的 Arm 架构的威胁越来越大,虽然短期内还无法实现替代,但长期发展前景非常好。也正是因为如此,国内外多家厂商和科研机构都在 RISC-V 技术和产品研发方面加大投入。

在中国大陆市场,还存在减少对西方芯片技术依赖的问题,在此情况下,RISC-V 的优势就更凸出了。

10 月,山东大学部署了一个采用 RISC-V CPU 的服务器集群,该系统共有 3072 个核,有 48 个 64 位 RISC-V CPU 节点。阿里巴巴生态系统总监陈大伟在加利福尼亚州圣克拉拉举行的 RISC-V 峰会上发表演讲时表示,这是 RISC-V 集群在云端的首次部署,目前,该系统主要用于山东大学的教学和科研项目,部分功能也可用于商用云计算。

据悉,山东大学的 RISC-V 系统采用了国内某公司的 SG2042 芯片,该芯片主频为 2GHz,缓存为 64MB。系统支持 PCIe Gen 4 接口。今年早些时候,该公司发布了 RISC-V 芯片,阿里巴巴与其合作将 Linux 操作系统引入该服务器集群。不过,目前的 RISC-V 软件生态系统还比较弱,需要时间去培育。

目前,中国已经实现流片的 RISC-V 芯片主要采用 110nm 和 28nm 制程工艺,但相关产品和系统仅用于科学研究,未完全达到商用水平。

今年,中国科技部资助了多个 RISC-V 芯片的研发工作,许多大学和科研院所都开始专注于 RISC-V 芯片开发。

中国科学院 (CAS) 正在与阿里巴巴、腾讯和中兴通讯等中国本土顶尖企业合作开发名为「香山-v3」的 RISC-V 芯片,同时,相关的新型操作系统也在开发过程中。CAS 希望该芯片的性能能与 Arm 于 2021 年发布的 Neoverse-N2 服务器 CPU 相当。据悉,中国相关企业和科研机构正在开发专门用于 RISC-V 芯片设计的开源 EDA 工具。

经过这些年的推广和积累,中国相关企业和科研机构已经成为全球 RISC-V 芯片和解决方案的主要贡献者。2022 年,全球生产了 100 亿颗 RISC-V 芯片,其中,一半在中国制造。

国际厂商在 RISC-V 方面的进展

十年前,当 RISC-V 问世后,迅速获得了包括苹果公司在内的国际芯片大厂的支持,最近几年,英特尔也很看好 RISC-V 的发展前景,并加大了投入。

如前文所述,RISC-V 的软件生态系统比较弱,针对于此,英特尔的 Codeplay 软件部门发布了 OneAPI 套件,其中包括供开发人员在 x86 PC 上的模拟 RISC-V 环境中测试代码的工具。该套件的标志性功能是支持 SYCL,它允许编码人员在不同的硬件架构上编译应用程序。该套件包括对英特尔 DPC++/C++编译器的支持,允许重新编译 C++代码,可以跨多个硬件架构使用。

如果没有硬件和软件协同设计的架构,编码人员就会习惯性地使用 x86 和 Arm 系统。对此,英特尔的做法是:在芯片发布之前就提供 Linux 驱动程序,以确保硬件与最新版本的操作系统兼容。

开发人员还可以在类似 Raspberry Pi 的开发板或 Milk-V、StarFive 等公司的系统上测试 RISC-V 代码,这两家公司都提供支持 Linux 的 64 位 RISC-V 系统。

目前来看,一些 RISC-V 软件包(如 Pytorch、GCC、TensorFlow 和 OpenJDK)可以正常工作,但尚未完全得到支持,近些年,对 LibreOffice 和 Firefox 等开源应用程序的支持正在建立过程中。厂商方面,谷歌正在加速对 RISC-V 上的 AOSP(Android 开源项目)的支持,这将是下一个架构规范的重要组成部分。

RISC-V制造商 Esperanto Technologies 和 Ventana Micro Systems 已经推出了用于云计算的芯片,其中,Esperanto 已将 Meta 的 Open Pre-Trained Transformer 模型移植到其 RISC-V 服务器上。不过,总体来看,这两家公司涉及软件支持和编程模型的产品和服务并不多。

负责开发和推进 RISC-V 标准的 RISC-V International 正在研发架构规范,试图通过建立 RISC-V 软件生态系统(称为 RISE),为 RISC-V 系统创建底层软件工具和中间件,该项目的支持者包括谷歌、英特尔、英伟达、高通、三星和 Ventana 等公司。

在欧洲,英特尔正在与巴塞罗那超级计算中心(BSC)合作,为超级计算机制造 RISC-V 芯片。BSC 希望高性能 RISC-V 处理器能尽早商用,他们希望利用 Chiplet(小芯片)技术,将 RISC-V 内核整合到 Chiplet 架构中,这正是英特尔的强项,未来,英特尔将会制造越来越多的 Chiplet 架构芯片,以增加设计灵活性,因为它能将 CPU、GPU、I/O、内存、电源管理和其它电路功能放入同一个封装中。如果能将 RISC-V 与内存通过 Chiplet 架构封装在一起,则可以降低眼下的内存带宽瓶颈,从而拓宽 RISC-V 在机器学习应用领域的发展道路。

最近,Meta 也推出了一款基于 RISC-V 架构的 AI 推理芯片。

由于中国已经是全球 RISC-V 产业的重要组成部分,因此,国际产业界一直在呼吁加强与中国的合作。RISC-V International 首席执行官 Calista Redmond 表示:「健康的合作和竞争可以推动最先进技术向前发展。我想强调一点,正确的全球标准支撑着我们在历史进程中所见过的最重要的技术,无论是 USB 还是以太网,以及 HTTPS 等网络协议。这些东西可以创造公平的竞争环境,让我们能够创新。」

业界普遍反对政府对 RISC-V 开发与合作的限制和干扰,美国业界人士表示:「任何限制都只会减少美国对一项重要新兴技术的参与,同时巩固 Arm 作为现有嵌入式 CPU 垄断供应商的地位。」

RISC-V 距离规模商用依然较远

目前来看,RISC-V 处理器在高性能计算领域的应用和研究依然处于探索阶段。软件生态系统、芯片、电路板和系统的可靠性问题并没有解决。除了技术,商业问题也很凸出。

目前,RISC-V 处理器仅能满足嵌入式应用场景,对于高性能服务器来说,还无法承担那样的性能负荷,不要说服务器,就目前而言,RISC-V 还不能满足 PC 的应用要求。

就目前的发展阶段和性能来看,RISC-V 并不适合做高性能 CPU。RISC-V 标准指令集非常精简,32 位基础指令是 47 条,64 位基础指令是 15 条,基础指令共 62 条,加上并入标准的扩展指令,总数在 300 条左右,而 Arm 的指令数超过 2000 条,x86 则更多。由于 RISC-V 的功能比较简单,用 RISC-V 和龙芯实现同样的功能(GCC 编译器),RISC-V 会比龙芯多用 20% 的指令。

虽然 RISC-V 允许拓展指令集,但这并不能解决一切问题,因为软件生态系统支持不足的话,单靠拓展指令集是远远不够的,因为商家自己拓展的不是 RISC-V 标准指令集,很容易产生碎片化问题,缺乏统一性的话,软件生态系统建设就会缺乏锚点,很难让一套软件生态满足所有拓展出的 RISC-V 指令要求。

中国本土 CPU 新势力崛起

除了 RISC-V 处理器,近期,中国本土其它架构高性能计算产品也在不断突破应用极限,华为、龙芯等都有好消息传出。

2022 年底,英伟达的高性能 GPU 芯片 H100(全球人工智能应用系统的首选处理器)被禁止销往中国大陆,那之后,中国本土企业只能购买降低了内存带宽的版本,也就是 H800 和 A800,但是,近期,这些降速版本的 GPU 也被禁售了。

在这样的背景下,华为自研的昇腾 910 和昇腾 310 处理器,特别是性能更高的昇腾 910,及其最新版本芯片得到了越来越多中国本土 IT 系统设备和互联网大厂的青睐,订单量持续提升。这两款芯片是华为在 2018 年发布的,同期还推出了神经网络计算架构、开发工具包和跨 AI 的云训练框架。

今年 8 月,中国人工智能公司科大讯飞董事长刘庆峰高度评价了华为开发的处理器,将它比作英伟达的 A100。刘庆峰表示,科大讯飞正在与华为合作进行硬件开发。当然,不止科大讯飞一家,有几家中国本土头部 IT 和互联网大厂都在与华为合作,开发高性能计算系统。

英伟达在 2020 年和 2022 年分别推出了 A100 和 H100 芯片,凭借多年的技术积累,以及先发优势,英伟达占据了全球 AI 芯片市场的最大份额,而生成式 AI 的兴起进一步巩固了该公司的行业地位。在生态系统方面,华为要想与英伟达竞争,最大的劣势是人工智能软件生态,这方面,英伟达已经非常完善了,需要后来者付出几倍的努力才有赶超希望。

近些年,华为也在建设自己的人工智能生态系统,被称为 CANN。不过,据专家介绍,与英伟达的生态系统相比,华为在训练 AI 模型方面存在局限性,需要补的课还很多。

除了华为,龙芯是另一大看点。

近期,龙芯确认,将在 11 月底正式推出处理器 3A6000,测试数据显示,3A6000 的 SPEC 性能达到了英特尔 10 代酷睿 4 核处理器的水准。

虽然龙芯一直受到质疑,但是,其每一代处理器的性能提升确是肉眼可见的。这次,3A6000 依然基于该公司自研的 LoongArch 指令集架构,工艺制程依旧是 12nm,内核升级为 LA664,也就是 64 位。3A6000 为 4 核处理器,所以拥有 4 个 LA664 核心,支持 128 位向量处理扩展指令(LSX)和 256 位高级向量处理扩展指令(LASX)。

另外,3A6000 的一个非常大的变化是首次支持同步多线程技术,也就是超线程技术,所以,3A6000 实际为 4C8T。频率依旧是 2.5GHz,L3 为 16MB,支持 DDR4-3200 内存。

龙芯还推出了服务器 CPU 芯片 3C6000 和 3D6000,以及具有较高性价比的桌面级 CPU 芯片 2K3000,可用于上网本、工控、迷你主机等。

龙芯也在 GPU 方面发力,近期推出了 9A1000,对标 AMD 的 RX 550 显卡,计划在 2024 年第三季度流片。9A1000 支持科学计算加速和 AI 加速。

结语

目前,PC 和手机应用发展已经达到瓶颈期,未来几年,主要拼存量市场,对增量市场已经没有什么期待了。因此,在处于成长阶段的中国大陆半导体市场,特别是各个系统必需的 CPU、GPU 等处理器,必需要以有巨大增量市场为主要目标,而高性能计算和 AI 的发展前景非常广阔。

在这样的大背景下,中国本土相关企业和科研院所正在加大对拥有较大发展潜力的技术领域的投入,这其中就包括 RISC-V,同时,也不能放下自主处理器架构的开发,只有两条腿走路,一条充分与国际接轨,另一条立足于自主,才能在未来的竞争中拥有更多筹码。

中国本土企业之间,以及与相关的科研院所,也需要进一步加强沟通与合作,这样可以提升芯片和系统研发效率。



关键词:RISC-V服务器芯片

评论


相关推荐

技术专区

关闭