国信证券发布研报称,密切关注国产模型和国产芯片。Deepseek的进一步在架构设计层面“降本增效”,推动国产模型更普惠实现百万上下文长度,密切关注国产模型厂商进展。寒武纪、华为昇腾的Day 0适配表明,表明国产芯片在已达到商业可用的成熟度,密切关注国产算力进展。
国信证券主要观点如下:
4月24日,DeepseekV4发布。根据DeepSeek的官方介绍,V4系列包含两个MoE模型:DeepSeek-V4-Pro总参数1.6T、激活参数49B,DeepSeek-V4-Flash总参数284B、激活参数13B,两者均原生支持100万token上下文。
根据公司官方,在Agentic Coding评测中,V4 Pro已达到当前开源模型最佳水平。目前DeepSeek V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。从第三方评测来看,Arena.ai在X上将V4 Pro定性为相较DeepSeek V3.2的重大飞跃,在代码开源模型榜单中位列第3位、综合第14位。另一家测评方Vals AI表示,V4在其Vibe Code Benchmark中是开源模型榜首。
DeepSeek V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。在1M上下文设置下,DeepSeek V4 Pro的单token推理FLOPs只有V3.2的27%,KVCache只有10%;V4-Flash更极端,分别压到10%和7%。价格方面,Deepseek实现了高性价比。
DeepSeek-V4-Pro输入/输出百万Token价格12元/24元;对比国内1T模型,比如小米输入/输出百万Token价格$1/ $3 ;$2/ $6。Deepseek-V4-Flash价格更低,为输入/输出百万Token价格1元/2元。
V4在技术报中表示,在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP方案。根据官网,下半年昇腾950超节点批量上市有望继续推动V4 Pro降价。根据华为云官方,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeekV4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。寒武纪Day 0适配DeepSeek-V4。寒武纪已基于vLLM推理框架完成285BDeepSeek-V4-flash和1.6TDeepSeek-V4-pro的Day 0适配,适配代码已开源到GitHub社区。这一成果得益于寒武纪长期积累的自研NeuWare软件生态与芯片设计技术,也是寒武纪对芯片与算法联合创新持续投入的延续。
宏观经济波动风险、下游需求不及预期风险、核心技术水平升级不及预期的风险、AI快速迭代平权化下竞争加剧等。










