从企业级到个人全覆盖: 英特尔锐炫专业卡打造普惠型AI部署路径
2025年10月16日,在深圳举行的湾区半导体大会上,英特尔发表了题为《英特尔锐炫多卡方案助阵AI应用落地部署》的演讲。其中着重介绍了英特尔为加速企业AI部署所推出的创新路径——通过打造基于英特尔锐炫多卡的Battlematrix(战斗阵列)推理工作站平台,为从边缘、工作站到服务器的广泛应用场景,提供高效且极具成本效益的AI部署方案,让更多企业将AI转化为实际生产力。
▲英特尔中国区显卡和AI高级产品总监徐金平先生在本届湾芯展上发表主题演讲
英特尔中国区显卡和AI高级产品总监徐金平先生在演讲中提到,目前感知AI、生成式AI、智能体AI,以及物理AI是当前四个重点的AI发展领域,而且经过这几年的飞速发展,AI大模型已经从之前的3亿多的参数,进化到了像Kimi K2的1万亿以上的参数。基于参数越大,其能力越强的特性,大模型在参数方面的竞争仍然会进行下去 。与此同时,也有不少大模型开发团队也在研究如何让较小参数的模型具备更大参数模型相媲美的能力,从而在更广泛的设备和场景下部署。
▲徐金平先生表示,感知AI、生成式AI、智能体AI,以及物理AI是当前四个重点的AI发展领域。
▲AI大模型已经进化到了1万亿以上的参数,但徐金平先生也强调,目前也有不少开发团队在研究如何让较小参数的模型具备更大参数模型相媲美的能力。
AI大模型在能力方面的发展如此之快,部署和落地自然也要紧跟脚步。就目前而言,中小型企业、工作室以及个人,对AI大模型,尤其是推理大模型都有着非常高的使用和本地化部署的需求。对此,徐金平先生也在主题演讲中强调,英特尔锐炫多卡方案希望凭借灵活的扩展能力,不仅高效承接多模态数据的密集型计算需求,又能降低企业AI部署的成本与复杂度,从而赋能AI的大规模、普惠化落地。
▲英特尔锐炫Pro B60显卡是专门面向推理工作站的产品
作为上述解决方案的核心硬件,英特尔锐炫Pro B60显卡基于Battlemage核心的Xe2架构GPU,关于Battlemage核心及Xe2架构,我们在之前B50显卡首发评测中进行了简明扼要的技术细节分享,感兴趣的小伙伴可以参考(短小精悍的AI与图形工作站专业之选——英特尔锐炫 Pro B50显卡首发评测)这里。
而在其他核心规格上,24GB的大显存和456GB/s的高内存带宽是英特尔锐炫Pro B60显卡的关键亮点。英特尔的官方资料显示,大显存和高内存带宽可以满足AI推理对显存容量的迫切需求,让大参数模型流畅运行,让海量数据高效吞吐。不仅如此,197 TOPS的峰值算力也可以为各类复杂AI推理任务提供算力保障。
英特尔的官方资料显示,在10项对比测试中,除了14b模型的测试中英特尔锐炫Pro B60显卡的性能表现略逊于RTX 5060 Ti,其他测试项目英特尔锐炫Pro B60显卡都展现出了优于RTX 5060 Ti和RTX 2000的性能。
针对不同体量的企业,以及不同需求的用户,英特尔认为在AI硬件部署方面也会有分层架构的考量,也就是分为企业中央级、企业部门级和个人员工这3个层级。其中企业中央级是要部署企业的私有云或公有云,把全局的企业数据进行集中化的处理,而企业部门级部署的AI服务器或推理工作站则主要处理的是部门的AI数据,至于末端的企业个人和员工,英特尔自然主推的是AI PC。
▲英特尔认为不同体量和需求的用户,在AI硬件部署方面也会有分层架构的考量。
简单来说,上述思路其实就是从用户在并发量级、模型性能等方面的实际需求出发,寻求成本与业务场景需求的平衡点。例如在高并发、高性能的需求场景下,英特尔锐炫Pro B60 GPU的另一大亮点——支持多显卡协同工作,就能轻松胜任。
英特尔设计了基于锐炫Pro B60 GPU的多卡互联方案——Battlematrix(战斗阵列)推理工作站平台。它最多可搭载8/16张英特尔锐炫Pro GPU,显存最高可达192GB/384GB,支持100B+参数模型,可处理大规模数据集与复杂模型等任务,从而满足企业对“高算力+大显存+成本效益”的多重诉求。在实际应用中,英特尔工程师团队借助该方案,将原本需数天完成的代码修复全流程缩短至数小时,充分验证了多卡互联方案在复杂任务处理中的高效与可靠。
▲ 针对高并发、高性能的需求场景,英特尔推出了Battlematrix(战斗阵列)推理工作站平台
以英特尔锐炫Pro B60和锐炫多卡解决方案为核心,英特尔为不同场景的AI部署提供了灵活的产品形态选择。具体而言:
个人和边缘侧轻量级AI推理场景:提供搭载1块英特尔酷睿处理器和1-2块英特尔锐炫Pro B60 GPU的方案,支持7B至32B模型,实现单用户到16+多用户的并发处理。
通用工作站及服务器场景:通过搭载英特尔至强处理器平台,并配置4块英特尔锐炫Pro B60 GPU,可支持32B至70B模型,满足50+用户的并发需求。
专用AI服务器场景:可借助2块英特尔至强处理器平台和8-16块英特尔锐炫Pro B60,支持32B至100B模型,服务100+以上用户。
▲ 英特尔锐炫Pro B60显卡可满足全场景下的AI大模型硬件部署需求
由此一来,无论是个人电脑、边缘设备、通用工作站/服务器,乃至专用AI服务器,都能找到与之匹配的高效且具备成本优势的部署方案。
不难看出,灵活的多设备协同架构,英特尔锐炫Pro B60显卡及其多卡解决方案,为不同规模的AI应用提供了高效且经济的部署路径。例如在单卡层面,其大容量显存设计有效支撑了复杂模型的高效运行,使企业能够流畅处理海量数据与多模态任务,避免了传统硬件因显存不足导致的性能瓶颈。而在多卡互联方案上,通过模块化扩展能力,企业可根据实际需求灵活配置计算资源,在保证精度的同时显著降低硬件投入成本,尤其适合需要长期迭代和持续优化的AI项目。
该方案在垂直场景中展现出非常强的适配能力,从边缘设备的轻量级推理到数据中心的大规模模型训练均能覆盖。例如,在紧凑型工作站中,双卡配置实现了空间与性能的平衡,为冷链物流、智能制造等场景的实时数据处理提供了可能;而在专用服务器集群中,多卡并联模式则支持超大规模模型的本地化部署,加速了金融、医疗等领域的AI数字化转型。
不仅如此,软件生态的深度整合还进一步降低了开发门槛和周期,开发者可通过标准化接口快速部署应用,结合容器化技术实现跨平台无缝迁移,缩短了从原型验证到商业落地的周期。
以英特尔锐炫Pro B60显卡为核心的解决方案,不仅推动了AI技术向中小企业的渗透,还催生了跨行业协作的新模式。通过联合硬件厂商与软件开发商构建开放生态,英特尔帮助企业在控制成本的同时获得持续的技术迭代支持,加速了AI从实验室走向生产环境的进程。随着多模态应用和生成式AI的普及,这种兼顾性能与灵活性的解决方案正成为企业智能化转型的关键基础设施。
部分文章和图片来源于网络,若涉及版权问题,请及时与我们联系,我们将第一时间删除并致歉。友情提示