英伟达的CPU野心藏不住了: 巴掌大能跑大模型, 首秀就要掀桌子

  • 2025-07-17 06:23:59
  • 563

前段时间市值刚破4万亿美元的英伟达,依然在四面出击。日前,黄仁勋到访中国,英伟达宣布恢复H20在中国市场的供货,且将推出一款全新且完全兼容的NVIDIA RTX PRO GPU,黄仁勋称该产品“是为智能工厂和物流打造数字孪生AI的理想选择”。

在牢牢占据GPU王座的同时,英伟达正在加速侵入CPU市场。在前段时间举办的台北电脑展上,英伟达正式发布了GB10超级芯片,作为他们进军CPU市场的先锋。此前雷科技也曾写过一篇文章,详细分析了GB10在CPU市场的定位,不过当时确实没有想到首款产品会这么快就发布。

根据最新消息,华硕将在7月22日举办一场发布会,正式发布搭载英伟达GB10的Ascent GX10,华硕将其称为“掌上AI超算”。单凭这个描述,我想大家就已经多少猜到Ascent GX10的产品定位了,一款超迷你的AI工作站。

图源:华硕

老实说,在此之前我确实没有想过一台工作站级别的AI PC,可以做得只有巴掌大小,英伟达似乎正在以一种野蛮的方式,改写整个AI PC市场。

巴掌大的工作站,性能够用吗?

从华硕公布的数据来看,Ascent GX10搭载了一颗NVIDIA GB10,算力约为1000 TOPS(FP4),并配备了128 GB LPDDR5X的统一内存,256-bit位宽,总带宽为273GB/s,标配1TB固态硬盘,官方最高可选配4TB。

单从配置来看,最大的特点就是高达128GB的内存,不过GB10的内存是直接集成在芯片内部,并不支持单独升级。英伟达给到如此多的内存,其实就是为了确保PC的性能可以满足AI模型的推理需求,后续或许会增加别的内存规格供大家选择,比如192GB版本,以便适配更大参数规模的AI模型。

图源:华硕

如果不考虑其他因素影响,这个规格的PC最高可以在FP4精度下运行参数规模达到200B的AI大模型(FP4精度),如果是FP8精度则是100B参数规模。虽然与动辄六七百B,甚至上千B的满血DeepSeek等AI模型无法比,但是已经足够部署一个甚至数个专业垂类AI模型。

所以,不难看出英伟达对这款产品的定位,并非为了运行超大规模的AI模型设计,而是作为企业的桌面AI解决方案来提供的。一些不方便放到云端的数据和AI模型,可以直接在Ascent GX10上运行,不需要担心数据在云端泄漏风险。

不过,这款PC的售价高达2999美元(约合人民币21494元),想要给每个人都配一台似乎不太现实?其实这种想法最开始就是错误的,AI PC工作站与传统PC的使用方式其实并不相同,你可以将其看做一个部署在你身边的小型服务器,周围的PC可以通过无线或有线网络的方式桥接到Ascent GX10上,在调用AI功能时再将运算交给Ascent GX10。

图源:华硕

以这种方式部署的话,理论上一台Ascent GX10可以满足一个小组(10人以内)的轻度AI需求,或者满足4~5人的常规AI需求,此时再将成本分摊一下的话,你会发现其实并不算贵(特别是对欧美企业来说)。

此外,对于AI研究、开发等方面的人员来说Ascent GX10就像是一个可以随身携带的AI开发套组,这玩意的性能可比一般的笔记本电脑强多了,不管是接入随身屏幕还是酒店屏幕,都可以随时进行AI开发和调试。

而且,据英伟达透露,采用GB10的AI PC工作站均支持双机直连(通过ConnectX-7),可以通过这种方式将算力和统一内存直接翻倍且损失的性能在可接受范围内,而且在这种情况下将支持最高405B的AI模型运行,参数规模已经接近满血版DeepSeek的三分之二。

除了可以作为桌面AI工作站部署外,Ascent GX10仅3L大小的机身也让其成为边缘计算设备的选择之一,可以被部署在一些关键的边缘网络节点中,充当AI推理的计算中枢。

图源:servethehome

虽然从AI性能上来看,一台以GB10为核心设计的Ascent GX10与一张RTX 5070Ti差不多,而后者售价仅为749美元。但是,RTX 5070Ti过高的性能和过大的体积,加上配套的一系列硬件,使其并不能直接满足对设备体积有严格要求的使用场景,更何况其显存只有16GB,支持的AI模型数量也远不及前者。

单就迷你AI PC工作站这个赛道来说,以Ascent GX10为代表的产品可以说是独一无二的,至于性能如何,我只能说在同等体积下,你可能找不到比他更强的AI PC。

AI工作站,迷你化是新的趋势

既然是英伟达十分看重的第一款Arm架构CPU,自然不会只有华硕一家品牌跟进,从小雷查询到的信息来看,戴尔、 惠普、联想都有计划在Q3季度发布基于GB10打造的迷你AI PC工作站,而宏碁、技嘉、微星等品牌则会在Q4季度跟进,相关产品的测试机已经在台北电脑展上展出过。

不难发现,基本上PC市场里叫得上名号的一、二线国际PC品牌基本来齐了,作为当下的半导体龙头,英伟达的号召力可见一斑。不过,根据进一步的搜索,我们发现以上品牌的首批产品均归属于NVIDIA DGX Spark计划,如无意外应该是采用相同的主板设计,只不过在设计等方面存在区别。

图源:惠普

以华硕为例,他们就选择了极致小型化的路线,仅3L的大小甚至可以被单掌托起,是目前已公布的迷你AI PC工作站里最小的,其余几款都在4L以上。不过,即使外观有所不同,其硬件规格和接口配置也基本相同,所以小雷猜测他们的售价也会十分接近。

当然,如果在功能上真的一点区别都没有,那么这个市场也将缺乏竞争,所以一些品牌也努力做出了一些独有的卖点。比如惠普的ZGX Nano AI Station就主要面向媒体与教育市场,预计将提供更多的多媒体接口,而联想则是为企业及用户提供一系列的全栈解决方案,可以帮助客户快速完成Lenovo ThinkStation PGX及周边配套设备(联想的GB10迷你AI PC)的部署。

图源:雷科技

对于正处在AI风口的企业来说,Ascent GX10等迷你AI PC工作站可以提供一个便捷且强大,还具有一定性价比的开发平台,这也是其他类型PC工作站难以给到的。甚至从某种程度上来说,以Ascent GX10为代表的PC才是正式引爆“个人AI超算”概念的起始点。

在此之前,AI超算型PC的体积、价格都不便宜,即使是用消费级显卡来组装PC也同样如此,而且消费级显卡还往往缺乏足够的开发生态支持,而GB10的出现则改变了这一点,

很多人或许觉得花两三万买一台迷你PC很贵,事实上这类产品对标的是此前售价在3万-10万元的传统GPU工作站,而非普通的个人电脑,对于企业来说两三万的生产工具投入成本并不算高,只要它足够好用即可。

那么Ascent GX10等产品好用吗?即使尚未正式开售,我们也能从英伟达官网及各品牌的描述里看到,Ascent GX10等产品走的是正儿八经的“企业线”,可以获得来自英伟达及品牌供应商的企业生态支持(即使并非全部),但也拥有消费级显卡所不具备的优势,使其更适合用于AI开发和部署。

图源:英伟达

不过对于规模较大或有更高性能要求的企业来说,GB10的性能确实有点不够看,但是英伟达也早有准备,在戴尔的Dell Pro Max展示页面中,除了有搭载GB10的迷你款外,还有搭载GB300的桌面款。后者的配置则极为夸张,拥有496GB LPDDR5内存和288GB HBM3e显存,FP4算力高达20000 TOPS,可支持最高10000B参数的AI模型。

过去,类似算力的AI工作站都是机柜级别的(立式空调见过吧?机柜比那玩意还宽大,只是没那么高),现在却已经能被浓缩到一个桌面机箱级别的设备里,不得不让人感慨半导体技术之快。

在雷科技看来,迷你化的AI工作站必然会成为未来的趋势之一,就像普通计算机从原本占据整个房间的设备,变成能被随身携带。随着AI的需求增长,AI工作站也必然会出现类似的变化:个人化、便捷化、一体化,如此才能更好地迎合AI普及的需求。

老实说,英伟达的这一招确实狠,对于英特尔和AMD来说,他们现在或许要重新考虑自己的AI战略了。