【菜科解读】
我是牛贵,但我产出的“奶”却格外便宜。
在2026年Cadence Live大会上,NVIDIA首席执行官黄仁勋直面外界关于AI硬件价格高企的讨论。
他坦承,NVIDIA的AI系统确属高端定价,但其单位算力输出所对应的token生成成本,目前处于全球最低水平。
Token是人工智能运算的基本单元,相当于AI语言处理中的最小语义片段。
大模型生成文本、响应指令、完成推理等所有过程,均依赖对token的持续处理与调度。
因此,单位时间内生成token的数量与效率,直接决定了系统的实际性能表现和长期使用成本。
黄仁勋指出,提升token生成效率绝非仅靠堆叠更高规格的硬件即可达成。
单纯依赖芯片算力硬性加速,并不能实现AI计算的最优路径。
唯有软硬协同――即以高度成熟、深度优化的软件生态为支撑,才能充分激发硬件潜能,显著提升每瓦特、每美元投入所换来的token产出量。
NVIDIA多年持续构建并迭代的CUDA软件生态,正是其实现token单位成本极致压缩的关键所在。
对于硬件本身的高售价,黄仁勋并未回避。
他说明,Blackwell架构平台及即将发布的Rubin架构平台等旗舰级AI系统,单套设备售价可达数百万美元。
但这类系统具备前所未有的token吞吐规模,可支撑超大规模AI服务部署,在商业应用中已实现数十亿美元级别的收入转化。
摊薄至每个token,其综合生成成本为全球最低。
同时,这些系统的能效比亦居行业首位,单位功耗所能生成的token数量同样领先全球。
黄仁勋用一句简明的话概括了这一逻辑:“采购规模越大,单位成本下降越显著。
”
在他看来,这种优势的根源在于NVIDIA坚持多年的全栈式技术布局。
AI产业的发展正加速走向垂直整合阶段,未来竞争的核心,将是覆盖底层芯片、系统架构、开发工具、运行时环境及上层应用的完整技术链条。
只有打通全栈能力,企业才能在AI时代持续保持技术主导权与市场引领力。
基于此,NVIDIA也同步重构了AI基础设施的评估体系:衡量一套AI系统价值的核心标准,不再局限于理论峰值算力或吞吐指标,而是聚焦于生成每个token所需的实际成本与能耗。
当前,Agentic AI正成为推动行业演进的新引擎,NVIDIA亦面临来自多方的技术竞逐与供应链层面的现实约束。
然而,回溯其过去十余年间在AI领域的战略投入与落地成果,可以明确的是,在可预见的未来,它仍将稳居全球AI产业的引领位置。