初创公司助英特尔在关键人工智能测试中击败AMD和Nvidia
这是AI硬件军备竞赛的最新转折,Numenta采用了一种新颖的方法来提高CPU性能,Numenta已经证明,通过应用一种新颖的方法,英特尔至强CPU在人工智能工作负载上的性能可以远远超过最好的CPU和最好的GPU。
本文引用地址://m.amcfsurvey.com/article/202310/451289.htm据Serve the Home称,这家初创公司利用基于这一理念的一系列技术,以Numenta智能计算平台(NuPIC)为品牌,在人工智能推理方面解锁了传统CPU的新性能水平。
真正令人惊讶的是,它的性能明显优于专门为处理人工智能推理而设计的GPU和CPU。 例如,Numenta采用了Nvidia报告的A100 GPU性能数据的工作负载,并在增强型48核第四代Sapphire Rapids CPU上运行。 在所有场景中,基于总吞吐量,它都比Nvidia的芯片更快。 事实上,它比第三代IntelXeon处理器快64倍,比A100 GPU快10倍。
利用神经科学提升人工智能性能
Numenta以其受神经科学启发的人工智能工作负载方法而闻名,它严重依赖稀疏计算的理念——这就是大脑在神经元之间形成连接的方式。
如今,大多数CPU和GPU都是为密集计算而设计的,尤其是人工智能,这比大脑工作的上下文方式更加暴力。 尽管稀疏性是提高性能的必由之路,但CPU却无法以这种方式良好工作。 这就是Numenta发挥作用的地方。
这家初创公司希望通过将其“秘密武器”应用于通用CPU,而不是专门为处理以人工智能为中心的工作负载而构建的芯片,从而释放人工智能模型中稀疏计算的效率增益。
虽然它可以在CPU和GPU上运行,但Numenta采用了IntelXeon CPU,并应用了其高级矢量扩展(AVX)-512和高级矩阵扩展(AMX),因为英特尔的芯片是当时最可用的。
这些是x86架构的扩展——作为额外的指令集,可以让CPU执行更苛刻的功能。
Numenta使用Docker容器提供NuPIC服务,并且可以在公司自己的服务器上运行。 如果它在实践中发挥作用,这将是重新利用数据中心中已部署的CPU来处理AI工作负载的最佳解决方案,特别是考虑到Nvidia业界领先的A100和H100 GPU的等待时间较长。
评论