新闻中心

EEPW首页 > 智能计算 > 市场分析 > 三款芯片,英伟达的量身定制

三款芯片,英伟达的量身定制

作者:asiatimes时间:2024-01-24来源:半导体产业纵横收藏

据报道,全球最大的图形芯片供应商将在今年第二季度为中国大陆客户量产三款精简版人工智能(AI)芯片。

本文引用地址://m.amcfsurvey.com/article/202401/455060.htm

这家总部位于美国加州的公司原计划于去年 11 月为中国市场推出三款 AI 芯片——H20、L20 和 L2,但由于该公司希望检查这些芯片是否符合美国的出口管制,因此推迟到 2024 年推出。

根据加拿大科技新闻网站 Wccftech 发表的一篇文章,这三款芯片完全符合美国的出口政策,并将在今年第二季度生产。

报告称,第一批 H20 芯片可能会在 2024 年第二季度中后期交付给客户。

「在参数方面,H20 的性能密度和计算能力符合美国的出口政策」,一家深圳公司的一位中国作者在周二发表的一篇文章中说。他说,在 FP8 Tensor Core 操作中,H20 的速度为每秒 296 万亿次浮点运算(teraflops 或 tflops),而 H100 为 1979 tflops,H200 为 3958tflops。H200 是世界上最强大的 AI 芯片,比 H20 快 13 倍。

同时,已公布的报道表明,H20 是一台相对精益求精的机器。Semianalysis 分析师迪伦·帕特尔(Dylan Patel)在去年 11 月发表的一篇文章中表示,在大型语言模型(LLM)推理方面,H20 实际上比 H100 快 20% 以上,这可用于使用非常大的数据集生成内容。他说,虽然 H100 比 H20 快 6.68 倍,但在衡量其性能时,人们还应该考虑 MFU(模型 FLOP 利用率)或实际利用率。

由于 H100 的 MFU 只有 38.1%,而 H20 可以达到 90%,因此,H20 在实际多 GPU 互联环境下的性能接近 H100 的 50%。

其他技术专家表示,H20 在功耗方面具有优势,因为它的热设计功率为 400 瓦,低于 H100 的 700 瓦。

中国市场

这个传奇可以追溯到 2022 年 8 月,当时拜登政府禁止向中国大陆和俄罗斯出口的 A100 和 H100,以及 AMD 的 MI250 芯片,因为这些芯片具有很高的互连带宽——每秒 600 GB 或更高。

针对中国大陆市场,随后推出了 A800 和 H800 处理器,它们分别以每秒 400 GB 和 300 GB 的速度工作。IT 专家表示,A800 和 H800 的性能分别是 A100 和 H100 的 70% 左右。

2023 年 10 月 17 日,美国商务部工业与安全局(BIS)表示,将使用「性能」和「性能密度」作为新参数对受限芯片进行分类。根据新规定,英伟达的 A800、H800、L40、L40S 和 RTX 4090 芯片被禁止运往中国大陆。英伟达希望通过将 H20 运往该国来填补由此产生的空白。

一些分析师表示,如果这款新芯片能够达到 H100 速度的 50%,而功耗比 H100 低 43%,那么它可能会对中国客户有吸引力。

「虽然 H20 的计算能力低于 H100,但它的价格会更低,并且支持英伟达的特殊功能,如 NVLink 和 CUDA 平台」,总部位于香港的 TF 国际证券集团有限公司的技术分析师郭明錤说:「中国客户仍然对 H20 芯片有浓厚的兴趣。」

最新特规版显卡

英伟达于近期发布了搭载 AD102-250 的中国特规版显卡,名为 GeForce RTX 4090D,取代限制出口的旗舰产品 GeForce RTX 4090。

2023 年 10 月 17 日美国对中国大陆出口的人工智能相关芯片、半导体制造设备祭出严格限制,导致英伟达高端游戏市场的显卡 GeForce RTX 4090 在中国大陆销售受限,为解决这个问题,决定开发定制化的 GeForce RTX 4090 D 显卡,通过降低部份规格,以符合美国出口管制要求。

因应美国政府对中国人工智能芯片最新出口管制,RTX 4090 D 需要满足综合运算性能(TPP)4800 限制,RTX 4090 无论 FP8 还是 FP16 的 TPP 都是 5286,比限制值超出 10% 左右。

正常来说,英伟达需要在 RTX 4090 基础上适当削减规格,最直接就是减少 SM、Tensor 和 CUDA 等配置数量,但是,RTX 4090D 要与 RTX 4080 SUPER 之间保持一定的距离。

英伟达表示,将持续完全地遵守美方规定,英伟达确实提供服务给在新加坡的中国大陆客户,包括字节跳动、腾讯的国际云端事业与阿里巴巴集团。申报文件显示,英伟达对在新加坡的客户(包括陆企)销售额,占整体营收约 15%。

RTX 4090 D 和 RTX 4090 都使用台积电 N4 制程,若获得美国商务部核准,将成为英伟达中国市场逆转胜关键。

相对于中国竞争对手的优势正在缩小

H20 在性能和效率上仍比中国本土 AI 芯片具有优势,但这种优势正在缩小。在政策和财政支持下,许多中国本土芯片厂商正在快速增长,有朝一日将打破英伟达在人工智能芯片市场的垄断地位。

事实上,一些中国大陆科技公司已经转向使用本地芯片。

英伟达面临的压力可能会减弱。2023 年 12 月 2 日,美国商务部长吉娜·雷蒙多(Gina Raimondo)在一个论坛上表示,如果任何一家美国公司围绕特定的切割线重新设计其芯片,使中国公司能够进行人工智能,美国政府将在第二天控制它。

不能排除这样一种可能性,即如果 H20 的表现确实能达到 H100 的 50%,雷蒙多可能会进一步收紧出口规则。



关键词: 英伟达

评论


相关推荐

技术专区

关闭