AI News

DeepSeek V4:1M上下文来了

DeepSeek V4 Preview 已开放 Pro 和 Flash 两个版本,1M 上下文、双模式推理和开放权重让长文档、代码仓库与 Agent 工作流进入新阶段。

DeepSeek V4:1M上下文来了

事件概览

DeepSeek V4 Preview 是 DeepSeek 在 2026 年最重要的一次模型更新。官方资料显示,这一代模型分为 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个版本:Pro 面向高能力推理、编码和复杂 Agent 任务,Flash 面向更快、更经济的日常调用。两个版本都支持 1M 上下文长度,并可通过 chat.deepseek.com 的 Expert Mode 和 Instant Mode 体验,也已经开放 API 调用。

为什么 1M 上下文重要

过去大模型处理长文档时,常见做法是切分、检索、摘要,再把片段喂给模型。这种方式仍然有效,但一旦任务涉及整本书、完整代码仓库、长合同、多轮会议记录或大量日志,信息会在切分中丢失。1M 上下文的意义不是让用户一次粘贴更多文字这么简单,而是让模型能在更完整的信息环境里做判断。比如分析一个大型项目的依赖关系、审查一批合同条款、比较多份行业报告、让 Agent 连续处理长任务,都会更自然。

Pro 和 Flash 的分工

DeepSeek-V4-Pro 采用更大的 MoE 架构,官方称其总参数规模达到 1.6T,每次激活约 49B,重点放在复杂推理、数学、代码和世界知识。DeepSeek-V4-Flash 则更轻,总参数 284B、激活约 13B,更适合高频问答、批量内容处理、客服、轻量 Agent 和成本敏感场景。企业实际落地时,不应该只选一个模型,而应该把两者组合起来:普通任务走 Flash,复杂任务走 Pro。

对开发者的影响

V4 的 API 仍然保持与 OpenAI ChatCompletions 和 Anthropic 接口兼容,这降低了迁移成本。开发者更需要关注的是任务路由、上下文预算和成本控制。1M 上下文很强,但并不意味着每次都要塞满上下文。真正成熟的做法是:先通过检索和规则筛出必要材料,再把高价值上下文交给模型;对于重复材料,配合缓存策略降低成本;对于长任务,记录中间状态,避免每一步都重新读取全部资料。

趋势判断

DeepSeek V4 的重点不是单点跑分,而是让开源模型进入“长上下文 + Agent + 低成本 API”的综合竞争。未来企业选择模型时,会越来越看重能否处理长材料、能否接入现有工具、能否控制成本、能否私有化或半私有化部署。DeepSeek V4 把这些问题同时推到了台前。

参考来源:DeepSeek V4 Preview 官方发布、DeepSeek API 文档、TechCrunch、The Verge 等公开报道。