4月24日 ,DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源。华为官微发文称,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同 ,实现昇腾超节点全系列产品支持DeepSeek V4系列模型 。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法 ,实现了高吞吐 、低时延的DeepSeek V4模型推理部署;昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。

华为表示 ,昇腾950超节点重新定义长文本推理的性能天花板,实现DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低时延推理。DeepSeek介绍,目前DeepSeek V4-Pro版本的API访问服务吞吐十分有限,预计下半年昇腾950超节点批量上市后 ,Pro的价格会大幅下调 。