AI News

DeepSeek 与华为 Ascend 适配

DeepSeek V4 被曝适配华为 Ascend 芯片,相关团队还称完成 V4-Pro 后训练,这让国产 AI 算力从宣传进入更真实的工程验证阶段。

DeepSeek 与华为 Ascend 适配

事件概览

DeepSeek V4 发布后,外界高度关注它与华为 Ascend 芯片的关系。多家公开报道提到,V4 被适配到华为 Ascend AI 处理器;随后又有报道称,包含华为在内的研究团队使用 Ascend 910C 集群完成了 DeepSeek V4-Pro 的全参数后训练。虽然这些信息仍需要更多公开基准和工程细节验证,但它已经让国产 AI 算力从“能不能跑模型”的讨论,进入“能不能支撑前沿模型训练和服务”的压力测试。

为什么这件事重要

过去中国 AI 公司高度依赖 NVIDIA GPU,尤其是训练和高性能推理场景。出口管制之后,国产芯片能否承担大模型负载,成为产业链关键问题。DeepSeek V4 如果能在 Ascend 生态中稳定运行,意味着中国模型公司在算力选择上有了更现实的替代路径。即使性能、软件生态和稳定性仍有差距,只要能完成部分训练、后训练和推理任务,就会改变供应链谈判和部署策略。

后训练和预训练的区别

需要注意的是,后训练不等于完整预训练。预训练需要从海量数据中学习基础能力,计算规模极大;后训练更多关注指令遵循、对齐、安全和特定能力增强。报道中提到的 Ascend 集群后训练成果,不能直接证明国产芯片已经完全替代 NVIDIA 进行前沿模型预训练,但它证明了国产硬件正在进入更核心的模型生命周期,而不仅是低端推理。

对企业和开发者的影响

企业短期不必关心底层芯片型号,但应该关注由此带来的部署选择。如果 DeepSeek 这类模型能在国产算力上稳定运行,政企、金融、能源、制造等对数据本地化要求高的行业,会更容易采用本地或半私有化 AI 系统。开发者也会看到更多国产云、国产服务器和 DeepSeek 模型组合方案,成本和供应稳定性可能改善。

风险和不确定性

国产算力生态仍面临软件栈、编译器、驱动、集群互联、故障率、生态工具和开发者经验等挑战。单次后训练成功不代表大规模商业部署已经成熟。企业选型时仍要做真实压测:吞吐、延迟、稳定性、故障恢复、成本和模型效果都要测,而不是只看宣传指标。

趋势判断

DeepSeek V4 与 Ascend 的结合,是中国 AI 产业从模型创新走向全栈自主的关键观察点。未来竞争不只是模型论文和 API 价格,也包括芯片、框架、数据中心、模型服务和应用生态的协同能力。谁能把这些环节跑通,谁才有长期韧性。

参考来源:Reuters 相关报道、Tom's Hardware、Investing.com、DeepSeek V4 官方资料及公开产业分析。