深度求索 V4 系列预览版发布：参数规模翻倍，价格不到 GPT-5.4 的零头

AI领域评论20字数 611阅读2分2秒阅读模式

中国 AI 实验室深度求索（DeepSeek）正式推出最新大语言模型 DeepSeek V4 的两款预览版本——V4 Flash 与 V4 Pro。这是去年 V3.2 以及引爆 AI 圈的 R1 推理模型之后最受业界期待的一次更新。

两款新品均为混合专家（Mixture-of-Experts）架构，支持 100 万 token 的上下文窗口，足以将大型代码库或长篇文档完整纳入提示词。

模型	总参数量	活跃参数量
V4 Pro	1.6 万亿	490 亿活跃
V4 Flash	2840 亿	130 亿活跃

对比同类竞品，V4 Pro 的参数规模大幅领先：

深度求索表示，得益于架构优化，V4 Flash 与 V4 Pro 均比 V3.2 效率更高、性能更强，在推理基准测试中已"几乎追平"当前前沿的闭源与开源模型。

具体表现上：

V4-Pro-Max（V4 Pro 的高配版）在推理测试中优于所有开源对手，部分任务超越 OpenAI GPT-5.2 和 Gemini 3.0 Pro
编程竞赛基准中，V4 系列表现"可比肩 GPT-5.4"

不过，在知识类测试中，V4 系列仍小幅落后于 GPT-5.4 和 Gemini 3.1 Pro。官方评估认为其"发展轨迹大约落后最前沿模型 3 至 6 个月"。

另外，两款模型目前仅支持文本，不像多数闭源竞品那样提供图文音视频理解与生成能力。

V4 系列延续了深度求索一贯的高性价比路线： V4 Flash（小杯）：输入 $0.14 / 百万 token，输出 $0.28 / 百万 token，低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 和 Claude Haiku 4.5。

V4 Pro（大杯）：输入 $0.145 / 百万 token，输出 $3.48 / 百万 token，同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。

值得注意的是，新模型发布恰逢美国zf 指控中国通过数千个代理账户大规模窃取美国 AI 实验室知识产权的次日。此前，Anthropic 和 OpenAI 也已公开指控深度求索存在"蒸馏"（distillation）——即通过技术手段复制其模型行为。

延伸阅读