首页 > 热点
x

黄仁勋详解NVIDIA AI成本优势:软硬协同压低单Token生成成本

热点 2026-04-22 菜科探索 +
简介:

【菜科解读】

我是牛贵,但我产出的“奶”却格外便宜。

在2026年Cadence Live大会上,NVIDIA首席执行官黄仁勋直面外界关于AI硬件价格高企的讨论。

他坦承,NVIDIA的AI系统确属高端定价,但其单位算力输出所对应的token生成成本,目前处于全球最低水平。

Token是人工智能运算的基本单元,相当于AI语言处理中的最小语义片段。

大模型生成文本、响应指令、完成推理等所有过程,均依赖对token的持续处理与调度。

因此,单位时间内生成token的数量与效率,直接决定了系统的实际性能表现和长期使用成本。

黄仁勋指出,提升token生成效率绝非仅靠堆叠更高规格的硬件即可达成。

单纯依赖芯片算力硬性加速,并不能实现AI计算的最优路径。

唯有软硬协同――即以高度成熟、深度优化的软件生态为支撑,才能充分激发硬件潜能,显著提升每瓦特、每美元投入所换来的token产出量。

NVIDIA多年持续构建并迭代的CUDA软件生态,正是其实现token单位成本极致压缩的关键所在。

对于硬件本身的高售价,黄仁勋并未回避。

他说明,Blackwell架构平台及即将发布的Rubin架构平台等旗舰级AI系统,单套设备售价可达数百万美元。

但这类系统具备前所未有的token吞吐规模,可支撑超大规模AI服务部署,在商业应用中已实现数十亿美元级别的收入转化。

摊薄至每个token,其综合生成成本为全球最低。

同时,这些系统的能效比亦居行业首位,单位功耗所能生成的token数量同样领先全球。

黄仁勋用一句简明的话概括了这一逻辑:“采购规模越大,单位成本下降越显著。

在他看来,这种优势的根源在于NVIDIA坚持多年的全栈式技术布局。

AI产业的发展正加速走向垂直整合阶段,未来竞争的核心,将是覆盖底层芯片、系统架构、开发工具、运行时环境及上层应用的完整技术链条。

只有打通全栈能力,企业才能在AI时代持续保持技术主导权与市场引领力。

基于此,NVIDIA也同步重构了AI基础设施的评估体系:衡量一套AI系统价值的核心标准,不再局限于理论峰值算力或吞吐指标,而是聚焦于生成每个token所需的实际成本与能耗。

当前,Agentic AI正成为推动行业演进的新引擎,NVIDIA亦面临来自多方的技术竞逐与供应链层面的现实约束。

然而,回溯其过去十余年间在AI领域的战略投入与落地成果,可以明确的是,在可预见的未来,它仍将稳居全球AI产业的引领位置。

黄仁勋详解NVIDIA AI成本优势:软硬协同压低单Token生成成本

点击下载文档

格式为doc格式