AI News

DeepSeek V4 价格战继续

DeepSeek V4 Flash 和 Pro 的定价、缓存与长上下文能力,让企业开始重新评估闭源模型、开源模型和混合路由的总体成本。

DeepSeek V4 价格战继续

事件概览

DeepSeek 自 R1 以来一直被外界关注的一个核心点是成本。V4 Preview 延续了这种路线:Flash 面向高性价比推理,Pro 面向更强能力,同时支持长上下文和多种 API 兼容方式。官方 pricing 页面显示,V4 Flash 与 V4 Pro 都支持 1M 上下文、JSON 输出、工具调用和双模式。结合此前 DeepSeek 的上下文缓存能力,企业使用模型时不再只比较“单次回答效果”,而要比较长期运行成本。

为什么成本会成为核心竞争点

当 AI 只是偶尔写文章或回答问题,模型价格不太敏感;但当企业把 AI 接入客服、搜索、代码助手、知识库、数据分析和 Agent 工作流时,调用量会迅速放大。尤其 Agent 会多轮调用模型、检索资料、调用工具、检查结果,token 消耗远高于普通聊天。一个模型如果能力接近但价格更低,就能让原本无法规模化的业务变得可行。

Flash 和 Pro 的使用策略

企业最不应该做的是所有任务都默认走 Pro。更好的策略是建立成本分层:Flash 处理 FAQ、摘要、分类、轻量客服和批量内容;Pro 处理复杂代码、长文档审查、多步骤推理和高价值分析。对于长上下文任务,可以先用检索和规则缩小输入范围,再决定是否调用 Pro。这样既保留质量,又能控制预算。

缓存和复用很关键

DeepSeek 早前推出过上下文缓存能力,核心思路是重复输入不必每次重新计算。对企业来说,这非常适合固定知识库、系统提示词、产品说明、合同模板和代码仓库场景。只要输入有大量重复部分,就可以通过缓存降低成本和延迟。开发者应关注 API 返回中的缓存命中信息,并根据业务设计更稳定的提示词和上下文结构。

对市场的影响

DeepSeek 的成本路线会迫使其他模型服务商更重视价格透明度和推理效率。闭源模型仍然有强能力、稳定服务和生态优势,但企业会越来越倾向于混合路由:一部分任务用闭源前沿模型,一部分任务用 DeepSeek 这类高性价比模型,一部分任务用本地开源模型。最终竞争的不是单模型价格,而是整套 AI 工作流的单位成本。

趋势判断

DeepSeek V4 把价格战从“便宜 API”升级为“能力、上下文、缓存和 Agent 成本”的综合竞争。未来企业评估 AI 项目时,必须计算每月调用量、平均 token、缓存命中率、失败重试和人工审核成本。只有把这些账算清楚,AI 才能从试点走向长期业务能力。

参考来源:DeepSeek Models & Pricing、DeepSeek Context Caching 文档、DeepSeek V4 Preview 官方资料、公开市场报道。