中国 AI 实验室深度求索(DeepSeek)正式推出最新大语言模型 DeepSeek V4 的两款预览版本——V4 Flash 与 V4 Pro。这是去年 V3.2 以及引爆 AI 圈的 R1 推理模型之后最受业界期待的一次更新。
突破性参数规模:全球最大开源 MoE 模型
两款新品均为混合专家(Mixture-of-Experts)架构,支持 100 万 token 的上下文窗口,足以将大型代码库或长篇文档完整纳入提示词。
| 模型 | 总参数量 | 活跃参数量 |
|---|---|---|
| V4 Pro | 1.6 万亿 | 490 亿活跃 |
| V4 Flash | 2840 亿 | 130 亿活跃 |
对比同类竞品,V4 Pro 的参数规模大幅领先:
- Moonshot AI Kimi K 2.6:1.1 万亿
- MiniMax M1:4560 亿
- DeepSeek V3.2:6710 亿(V4 Pro 超其两倍以上)
性能逼近前沿模型,但知识储备略有差距
深度求索表示,得益于架构优化,V4 Flash 与 V4 Pro 均比 V3.2 效率更高、性能更强,在推理基准测试中已"几乎追平"当前前沿的闭源与开源模型。
具体表现上:
- V4-Pro-Max(V4 Pro 的高配版)在推理测试中优于所有开源对手,部分任务超越 OpenAI GPT-5.2 和 Gemini 3.0 Pro
- 编程竞赛基准中,V4 系列表现"可比肩 GPT-5.4"
不过,在知识类测试中,V4 系列仍小幅落后于 GPT-5.4 和 Gemini 3.1 Pro。官方评估认为其"发展轨迹大约落后最前沿模型 3 至 6 个月"。
另外,两款模型目前仅支持文本,不像多数闭源竞品那样提供图文音视频理解与生成能力。
价格屠夫:成本仅为 GPT-5.4 系列的零头
V4 系列延续了深度求索一贯的高性价比路线: V4 Flash(小杯):输入 $0.14 / 百万 token,输出 $0.28 / 百万 token,低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 和 Claude Haiku 4.5。
V4 Pro(大杯):输入 $0.145 / 百万 token,输出 $3.48 / 百万 token,同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。
发布时机敏感:恰在美国指控"工业窃密"之后一天
值得注意的是,新模型发布恰逢美国zf 指控中国通过数千个代理账户大规模窃取美国 AI 实验室知识产权的次日。此前,Anthropic 和 OpenAI 也已公开指控深度求索存在"蒸馏"(distillation)——即通过技术手段复制其模型行为。


评论