谷歌推出DiffusionGemma文本扩散模型：本地AI推理速度提升4倍

发布时间：2026-06-11 09:39

　　谷歌今天发布公告，宣布推出 DiffusionGemma，是基于文本扩散机制的开放 AI 模型，

　　注：自回归模型是当前主流的大语言模型架构，按照从左到右的顺序逐个生成 Tokens。该架构在云端批处理场景下效率较高，但在本地推理时受限于内存带宽，存在计算资源浪费问题。

　　而扩散模型通过从噪声中逐步去噪的方式生成输出。与自回归模型逐个生成 token 不同，扩散模型并行处理所有 token，逐步优化整体输出质量，在本地低带宽计算环境下具有显著的推理速度优势。

　　开源方面，该模型能力与其他 Gemma 4 模型相当，但推理效率显著更高。该模型采用 Apache 2.0 许可证开源，用户可从 Hugging Face 下载模型权重。

　　质量方面，模型还支持迭代优化，能在生成过程中主动纠正错误，输出更加稳定一致。采样速度达到 1479 tokens / 秒，开销仅 0.84 秒，生成效率显著提升。

　　数学能力表现亮眼，AIME 2025 取得 23.3%，超越对比模型的 20.0%，展现出扩散架构在推理任务上的潜力。

　　速度方面，英伟达在官方博文中指出，该模型的扩散设计，能充分发挥英伟达 GPU 的 Tensor Core 并行计算能力。

上一篇：港股异动电力设备股跌幅居前东方电气跌近10% 油气价格上涨或抑制燃气轮机需求

下一篇：港股异动汽车股延续跌势 5月乘用车零售销量同比下滑超两成机构指难有系统性上涨机会

排行

1罗技（Logitech）停止生产Harmony遥控器

2据报道，小米正在使用Snapdragon 8xx SoC开发

3小米MIXFOLD液态镜头有什么用小米MIXFOLD液

4三星计划将全自动洗衣机领域的市场份额

5IDC报告：尽管芯片短缺，但2021年第一季度

6iPhone 11 Pro背面的苹果标志位置有瑕疵，售

7小米手环6nfc版怎么唤醒小爱同学

8小米11ultra有耳机孔吗？

9来自5亿个LinkedIn帐户的数据在线泄漏

10Facebook将总部的一部分变成了疫苗站点

精选

北汽集团与中国长安汽车达成战略合作

中国铁路：1至5月全国铁路完成固定资产

为期三年！香港海事处将推出两项绿色船

7月再次加息？欧洲央行拒绝提前定调但

华为正式发布鸿蒙7全场景智能操作系统

港股异动理想汽车-W涨超8% 全新理想L8将

华为发布DevEco Code鸿蒙开发AI Agent工具

港股午评恒生指数早盘涨2.02% 中资券商股

同程旅行发布《2026暑期非遗目的地指南》

新股前瞻｜从精密线材到AI算力：同亚科

“换芯”重生！联发科告别成熟业务低迷

鸿蒙PC包管理器HarmonyBrew已支持超4700条常

招银国际：首予MiniMax-W“买入”评级目标

港股异动力勤资源涨超5% 预计上半年纯利

港股异动龙蟠科技早盘涨超6% 拟斥1.6亿美

HDC2026上，华为擎云交出鸿蒙商用新答卷

佰泽医疗存仓市值总计14.91亿港元其中股

Polymarket豪赌SpaceX“开门红”：上市首日市

HASHKEY HLDGS拟动用不超过1亿港元进行股份

放弃经典版？微软确认新版Outlook将迎5大

推荐

惠普以4.25亿美元收购了HyperX

三星Galaxy A82可能配备64万像素摄像头

如何在Microsoft Edge中禁用Windows 10 Alt + Ta

创建混合神经网络的未来

　

联系我们版权声明晋ICP备2025056884号-1