深度求索 V4 系列预览版发布:参数规模翻倍,价格不到 GPT-5.4 的零头

内容管家 AI领域评论1字数 611阅读2分2秒阅读模式

中国 AI 实验室深度求索(DeepSeek)正式推出最新大语言模型 DeepSeek V4 的两款预览版本——V4 Flash 与 V4 Pro。这是去年 V3.2 以及引爆 AI 圈的 R1 推理模型之后最受业界期待的一次更新。

突破性参数规模:全球最大开源 MoE 模型

两款新品均为混合专家(Mixture-of-Experts)架构,支持 100 万 token 的上下文窗口,足以将大型代码库或长篇文档完整纳入提示词。

模型 总参数量 活跃参数量
V4 Pro 1.6 万亿 490 亿活跃
V4 Flash 2840 亿 130 亿活跃

对比同类竞品,V4 Pro 的参数规模大幅领先:

  • Moonshot AI Kimi K 2.6:1.1 万亿
  • MiniMax M1:4560 亿
  • DeepSeek V3.2:6710 亿(V4 Pro 超其两倍以上)

性能逼近前沿模型,但知识储备略有差距

深度求索表示,得益于架构优化,V4 Flash 与 V4 Pro 均比 V3.2 效率更高、性能更强,在推理基准测试中已"几乎追平"当前前沿的闭源与开源模型。

具体表现上:

  • V4-Pro-Max(V4 Pro 的高配版)在推理测试中优于所有开源对手,部分任务超越 OpenAI GPT-5.2 和 Gemini 3.0 Pro
  • 编程竞赛基准中,V4 系列表现"可比肩 GPT-5.4"

不过,在知识类测试中,V4 系列仍小幅落后于 GPT-5.4 和 Gemini 3.1 Pro。官方评估认为其"发展轨迹大约落后最前沿模型 3 至 6 个月"。

另外,两款模型目前仅支持文本,不像多数闭源竞品那样提供图文音视频理解与生成能力。

价格屠夫:成本仅为 GPT-5.4 系列的零头

V4 系列延续了深度求索一贯的高性价比路线: V4 Flash(小杯):输入 $0.14 / 百万 token,输出 $0.28 / 百万 token,低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 和 Claude Haiku 4.5。

V4 Pro(大杯):输入 $0.145 / 百万 token,输出 $3.48 / 百万 token,同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。

发布时机敏感:恰在美国指控"工业窃密"之后一天

值得注意的是,新模型发布恰逢美国zf 指控中国通过数千个代理账户大规模窃取美国 AI 实验室知识产权的次日。此前,Anthropic 和 OpenAI 也已公开指控深度求索存在"蒸馏"(distillation)——即通过技术手段复制其模型行为。

延伸阅读

 
内容管家

发表评论