关于ZAKER Skills 合作
雷科技 7小时前

英伟达 RTX Spark 确实很强,但在 Agent 时代不算好电脑

这周,微软拿出了一台很不像 Surface 的 Surface Laptop Ultra,是微软迄今最强的 Surface Laptop,也是首款搭载英伟达 RTX Spark 的 Windows 笔记本电脑。

但未必是一台 Agent 时代的好电脑。

按照微软的定位,Surface Laptop Ultra 面向创作者、开发者和 AI builders,是为了大型 3D 场景、长时间编译、本地模型和数据集。英伟达则把 RTX Spark 定义为面向个人 AI Agent 的 Windows PC 超级芯片:

6144 个 CUDA 核心、第五代 Tensor Core、FP4 精度,通过 NVLink-C2C 连接一颗 20 核 NVIDIA Grace CPU,最高支持 128GB 统一内存。

作为结果,RTX Spark 可以在本地运行 1200 亿参数大模型和最高 100 万 token 上下文,渲染 90GB 以上 3D 场景,剪辑 12K 4:2:2 视频,生成 4K AI 视频,也能在 1440p 下以超过 100 帧运行 3A 游戏。

图片来源:英伟达

强得有点不像传统笔记本。

RTX Spark 的强,主要还是 GPU 的强,是 CUDA、Blackwell GPU、统一内存和本地模型推理能力的强。如果 AI PC 的问题还是能不能在本地跑一个更大的模型,RTX Spark 的确很有说服力。但雷科技认为,如果问题已经变成 Agent 能不能长期替用户执行任务,答案就没那么简单了。

Agent 意味着拆任务、调应用、查文件、跑代码、开网页、维护沙盒、处理权限、等待外部响应,还要在不同任务之间切换上下文。这些负载需要云端的强大模型能力,也更依赖端侧 CPU、I/O、系统调度、安全隔离、应用接口和云端状态。

相反,端侧模型的性能远远不够支持 Agent 的模型能力需求,即便是 RTX Spark 这种「怪兽」,也更像是把一台小型 AI 工作站压进笔记本形态,而不是为 Agent 时代重新设计的一台个人电脑:

或者说,它在用 2023 年的本地大模型想象,回答 2026 年的 Agent 问题。

英伟达并不是突然对 PC 处理器产生了兴趣。

从短期生意看,这家公司甚至没有太多必要亲自下场做一颗 PC SoC。它在 PC 市场本来已经足够舒服:独立显卡长期占据绝对优势,游戏、创作、专业图形和 CUDA 生态都握在自己手里;数据中心 GPU 更是供不应求,排队买卡的客户比英伟达更着急。

但 AI PC 改变了 PC 的负载结构,也改变了英伟达在 PC 里的位置。(注:AI PC 主要指笔记本电脑,不包括 DIY 电脑主机。)

过去 PC 的核心负载主要围绕 CPU 和图形性能展开。英伟达只需要把 GPU 做得越来越强,再通过 PCIe 接进 PC,就能稳稳站在性能链条上游。

可进入 AI PC 时代后,越来越多负载开始围绕本地推理、多模态理解、语音视频处理、语义搜索、本地知识库和系统级 AI 功能展开,NPU 比 GPU 更贴近日常 PC 形态。

NPU 的低功耗、常驻、安静、长续航、系统级调用,正是 AI PC 早期最需要的体验。而传统独显的数据要在系统内存和显存之间来回搬运,功耗一上来风扇起飞,续航也很难看。

对于笔记本这种天然受限于电池、散热和体积的瘦终端来说,NPU 的逻辑很有吸引力。

2024 年,微软用 AI+ PC(最早是 Copilot+ AI)划了一条线:NPU 算力至少 40TOPS,才能跑新一代 Windows AI 功能。高通、AMD、英特尔轮番上场,PC 厂商也终于有了一个比 CPU 多核性能、屏幕素质和续航时间更新鲜的卖点。

图片来源:微软

但如果未来的 PC AI 负载都被 NPU 接管,英伟达在 PC 里的角色就可能从平台定义者退回到高端图形配件。

所以英伟达要做 RTX Spark,把 CUDA、RTX、TensorRT、OptiX、DLSS、FP4、Blackwell GPU 和统一内存一起带进 Windows 笔记本,让 PC 不只是运行 AI 功能点,还有本地 AI 工作流,避免 AI PC 时代绕开 GPU 和 CUDA。

在微软 Build 的连线中,黄仁勋提到,三年前他就与微软 CEO 萨蒂亚 · 纳德拉讨论了一种新的个人电脑:既适合设计师和创作者,也适合人工智能;既有本地处理能力,也能和 Windows、创作软件以及 AI 软件栈深度整合。

图片来源:X

RTX Spark 和 Surface Laptop Ultra 就是那次对话的结果。它确实回答了一个问题:如果 Windows 阵营想造一台真正能跑本地大模型、本地创作、本地 AI 开发的高端笔记本,硬件应该有多激进。

但三年时间,AI 已经变了太多。

三年前,整个行业还处在 ChatGPT 刚刚爆发后的本地推理想象里,很多人相信,AI PC 的关键是把模型跑到本地。这样一来,用户不用把隐私数据丢进云端,不用为每次调用付 token 账单,也能获得更低延迟、更稳定的 AI 体验。

这个逻辑没有错,今天也依然成立一部分。但 2026 年的 AI 已经不只是聊天机器人。从推理到 Agent,上下文、推理链、KV cache ……几乎所有要求都在提高,本地设备和云端模型之间的能力差距在很多任务上也被进一步拉大。

事实上,今天几乎所有针对 Agent 进行训练过的大模型,对硬件的要求都大幅超过了以往,量化压缩的模型并不能满足 Agent 的良好运行,以及用户对于 Agent 表现的要求。

简言之,至少目前来看,端侧根本无法支撑好的本地 Agent 体验,基于云端必然。所以对个人 PC 来说,CPU 反而更重要。

到了 Agent 时代,用户不只是要一个答案,而是希望 AI 完成任务。

但完成任务和本地生成文本不是一回事。一个 Agent 要执行任务,往往需要访问网页、调用软件、运行代码、读取文件、处理权限、验证结果,还要在后台持续运行。它像一个操作员,而不是一个离线模型。越是复杂的工作流,越需要 CPU、I/O、系统调度、浏览器环境、沙盒和云端服务协同。

与此相对的,RTX Spark 的重点几乎都在 GPU 和 AI 侧:1 petaflop AI 性能、6144 个 CUDA 核心、Blackwell RTX GPU、128GB 统一内存、本地 120B 模型、百万 token 上下文。

CPU 上,英伟达选择了联发科,采用了 10 核 Cortex-X925、10 核 Cortex-A725。这两个核心已经是 Arm 两年前发布的 IP,被广泛用于过去两年的旗舰、次旗舰手机 SoC 上,包括天玑 9400、天玑 8400、玄戒 O1、Exynos 2500 等。

而去年的天玑 9500,已经用上了 Arm 最新的旗舰架构 C1-Ultra,同时采用下一代 C2 核心的 SoC 也预计将在未来几个月推出。

图片来源:Arm

当然,RTX Spark 的 CPU 核心数量要多得多,但从规划到预期,CPU 恐怕都不是英伟达打造这款消费级 PC SoC 的核心。

这也不奇怪,英伟达最强的护城河本来就是 GPU 和 CUDA。可智能体时代会重新抬高 CPU 的地位。英伟达面向数据中心发布的 Vera CPU,本质上也承认了当 AI 从聊天机器人走向智能体,代码执行、数据处理、沙盒环境、任务编排都会变成关键路径,CPU 不再只是给 GPU 打杂。

但 RTX Spark 把太多预算、功耗、芯片面积和系统想象都压在了 GPU 和本地推理上,却没有真正回答智能体最关键的执行、调度、长期状态和跨设备协同问题。

而与 Surface Laptop Ultra 同场发布的 Project Solara,则是微软想出的另一个答案。

按照微软 Applied Sciences Group 负责人 Steve Bathiche 的说法,Project Solara 是一个「芯片到云」平台,为 agent-first experiences 和新的设备形态而设计。它不是把智能带进 PC、浏览器或手机,而是让智能进入工作流、环境和任务现场,设备不再围绕 App 设计,而是围绕 Agent 设计。

对了,Project Solara 用的还是 Android,而非 Windows。

更重要的是,Project Solara 的状态不是只放在某一台设备里,而是经由 Azure 覆盖一组专用设备。微软展示了便携形态以及桌面形态,并且明确高通和联发科会是第一批芯片合作伙伴。

Project Solara,目前还有两款设备,图片来源:微软

这条路线看起来没 Surface Laptop Ultra 那么震撼,甚至还很早,但它更接近 Agent 的真实需求。Agent 的价值不在于每个入口都拥有一整座本地 AI 工厂,而在于能不能在正确的时间、正确的地点、正确的设备上出现,并且把任务交给云端状态和后台智能继续推进。

换言之,Surface Laptop Ultra 是把 PC 做「大」,Project Solara 是把设备做「瘦」。Agent 时代更需要的,可能恰恰是后者。

本地算力不是不重要。

隐私数据、本地文件、低延迟交互、离线场景、创作素材和开发环境,都需要足够强的端侧能力。Surface Laptop Ultra 对专业用户,对于需要本地模型、本地渲染、本地视频生成、本地 CUDA 工作流的人来说,它可能会是一台很好的机器。

但 Agent 时代的个人电脑应该长什么样,Surface Laptop Ultra 可能不是最好的答案。

Agent 天然更适合云端作为中心,再由多个轻设备作为入口。手机、PC、工牌、桌面屏、耳机、眼镜都可以成为 Agent 的触点,但它们不必都变成一台小型 AI 工作站。

从这个角度看,Surface Laptop Ultra 和 RTX Spark 这类 AI PC,确实像是用 2023 年的本地推理想象,回答 2026 年的 Agent 问题。它们很强,也重要,但不是下一代 Agent 设备的起点。

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容