全国运营商首个，华为与湖北移动完成AI推理加速方案现网测试

发布时间：2026-06-26 09:32

　　6 月 24 日，在 2026 MWC 上海展期间，华为与中国移动通信集团湖北有限公司联合宣布，双方已成功完成全国运营商首个 AI 推理加速解决方案现网测试。

　　称，随着 AI 应用加速向 Agent形态演进，长上下文序列已成为典型场景，但传统算力卡高带宽内存容量有限，严重制约了 KV Cache 的命中率。华为在 2025 年底重磅推出了 UCM 推理记忆数据管理技术，打破高带宽内存和 DRAM 的容量限制，通过外置存储提供 PB 级的 KV Cache，并对 KV Cache 进行全生命周期的分层管理与调度，不仅在单次对话时大幅扩展上下文窗口，还能在多轮对话中复用历史 KV Cache，避免重复计算。

　　本次测试在湖北移动现网环境中部署 vLLM-Ascend 框架，针对MiniMax M2.5、GLM-5.1等主流大模型，模拟了 8K 至 190K 长序列输入场景。测试结论如下：

　　华为表示，测试表明，随着上下文长度增加，AI 推理加速方案优势持续放大，有效解决了长序列推理中的 KV Cache 容量瓶颈。

上一篇：美图公司6月24日斥资2977.18万港元回购780万股

下一篇：云英谷科技因超额配股权获悉数行使而发行792.88万股

排行

1苹果将于本月晚些时候推出首款采用

2iPad 2021，我们所知道的一切

3尽管Mini-LED面板供应受限，本月仍将推出

4魅族18怎么开启防误触

5小米将于4月23日在印度推出更多Mi 11手机

6台积电表示，随着需求激增，收入增长了

7超过一百万Clubhouse用户的数据在线泄漏

8支付宝怎么预约新冠疫苗接种

9绘画和截图工具现已在Microsoft Store上提供

10三星的Galaxy SmartTag +使用AR查找丢失的东西

精选

保险经纪巨头Hub International秘密递表美股

上市五年海外营收近八成森松国际以人才

中信证券：K型分化走到阶段性极致 A股走

飞龙股份控股股东及其一致行动人拟减持

华为用户久等了：消息称星闪音箱将至，

苹果再失大将：Vision Pro主管加盟OpenAI，加

新股消息大秦数能递表港交所

中远海能委任李建辉、陈岗和程燕为独立

Anthropic“闯关”成功：Mythos 5获美政府解

鹰瞳科技-B6月26日斥资60.32万港元回购5.

美股异动热门中概股普涨霸王茶姬涨逾

申万宏源将于8月19日派发末期股息每10股

舍图控股发布年度业绩，净利润45.3万港元

AOC推出“U34P2CN”34英寸带鱼屏显示器，

翠华控股发布年度业绩，股东应占溢利

微博部分用户出现功能异常，官方致歉称

荃信生物-B拟收购赛孚士约34.0001%的股权

龙源电力拟收购巴丹吉林公司49%股权巩固

三巽集团：接管人已向法院申请指令，以

ST雪发：实控人张劲集资诈骗案终审被判

推荐

Google提供的文件现在可让您设置“收藏夹

苹果：情人节特别礼物的建议

华为Mate X2有四种颜色选择

三星Galaxy A72和Galaxy A52将分别推出两种版

　

联系我们版权声明晋ICP备2025056884号-1