国信证券：百万上下文进入普惠时代国产算力成功适配需求爆发将至

　　国信证券发布研报称，密切关注国产模型和国产芯片。Deepseek的进一步在架构设计层面“降本增效”，推动国产模型更普惠实现百万上下文长度，密切关注国产模型厂商进展。寒武纪、华为昇腾的Day 0适配表明，表明国产芯片在已达到商业可用的成熟度，密切关注国产算力进展。

　　国信证券主要观点如下：

　　4月24日，DeepseekV4发布。根据DeepSeek的官方介绍，V4系列包含两个MoE模型：DeepSeek-V4-Pro总参数1.6T、激活参数49B，DeepSeek-V4-Flash总参数284B、激活参数13B，两者均原生支持100万token上下文。

　　根据公司官方，在Agentic Coding评测中，V4 Pro已达到当前开源模型最佳水平。目前DeepSeek V4已成为公司内部员工使用的AgenticCoding模型，据评测反馈使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但仍与Opus4.6思考模式存在一定差距。从第三方评测来看，Arena.ai在X上将V4 Pro定性为相较DeepSeek V3.2的重大飞跃，在代码开源模型榜单中位列第3位、综合第14位。另一家测评方Vals AI表示，V4在其Vibe Code Benchmark中是开源模型榜首。

　　DeepSeek V4开创了一种全新的注意力机制，在token维度进行压缩，结合DSA稀疏注意力，实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。在1M上下文设置下，DeepSeek V4 Pro的单token推理FLOPs只有V3.2的27%，KVCache只有10%；V4-Flash更极端，分别压到10%和7%。价格方面，Deepseek实现了高性价比。

　　DeepSeek-V4-Pro输入/输出百万Token价格12元/24元；对比国内1T模型，比如小米输入/输出百万Token价格$1/ $3 ；$2/ $6。Deepseek-V4-Flash价格更低，为输入/输出百万Token价格1元/2元。

　　V4在技术报中表示，在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP方案。根据官网，下半年昇腾950超节点批量上市有望继续推动V4 Pro降价。根据华为云官方，昇腾一直同步支持DeepSeek系列模型，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销，大幅提升推理性能，结合多种量化算法，实现了高吞吐、低时延的DeepSeekV4模型推理部署。昇腾A3超节点系列产品也全面适配，同时为便于用户快速微调，提供了基于昇腾A3超节点的训练参考实现。寒武纪Day 0适配DeepSeek-V4。寒武纪已基于vLLM推理框架完成285BDeepSeek-V4-flash和1.6TDeepSeek-V4-pro的Day 0适配，适配代码已开源到GitHub社区。这一成果得益于寒武纪长期积累的自研NeuWare软件生态与芯片设计技术，也是寒武纪对芯片与算法联合创新持续投入的延续。

　　宏观经济波动风险、下游需求不及预期风险、核心技术水平升级不及预期的风险、AI快速迭代平权化下竞争加剧等。

国信证券：百万上下文进入普惠时代国产算力成功适配需求爆发将至

排行

精选

推荐

国信证券：百万上下文进入普惠时代 国产算力成功适配需求爆发将至

排行

精选

推荐

国信证券：百万上下文进入普惠时代国产算力成功适配需求爆发将至