英伟达刷新DeepSeek V4推理纪录:单Token成本降至15

发布时间:2026-07-01 14:21

  英伟达昨日发布博文,宣布在英伟达 Blackwell 平台上,通过优化全栈推理,相比较 DeepSeek V4 模型 1 个月前上线初期,

  注:单 Token 成本指模型生成或处理单个 token 的成本指标,常用于比较不同硬件、软件栈或部署方式的推理成本表现。

  英伟达在博文中表示已将单 Token 成本列为 AI 总拥有成本的核心指标,并表示针对 DeepSeek v4 模型,Blackwell 平台已将其降低至行业最低水平。

  性能方面,英伟达通过分离式服务、大规模专家并行、基于 NVIDIA NVLink 的并行通信、NVFP4 精度以及多 token 预测等技术,叠加优化后,Blackwell 平台单 GPU 的 token 吞吐量最高可提升 20 倍。

排行

精选