MiniMax 发布致歉公告，MiniMax-M3 API 永久五折！

2026年6月8日内容管家

内容管家

1332
文章

0
评论

AI领域评论5字数 2622阅读8分44秒阅读模式

摘要MiniMax M3 上线数日后，控制台弹出一则致歉公告，同时宣布 M3 API 五折优惠改为永久五折。比起重复介绍模型参数，我更关注公告背后的几件事：发布准备不足、稳定性压力、C...

MiniMax M3 控制台公告截图

6 月 8 日，我登录 MiniMax 控制台的时候，看到了这张关于 MiniMax M3 的公告。

这事我觉得挺值得写一下。

MiniMax M3 不是今天才发布。官方 Release Notes 里写得很清楚，MiniMax-M3 是 2026 年 6 月 1 日 发布的。也就是说，我看到这则公告的时候，M3 已经上线了几天。

所以这篇文章不想再重复介绍“M3 有多强”。1M 上下文、Coding、Agent、多模态这些点，关注这个领域的人基本都已经看过了。更值得看的，是 MiniMax 这次公告背后暴露出来的几个问题：交付压力、套餐变化、价格竞争，以及开发者对“能不能长期稳定用”的重新判断。

我第一眼注意到的是“发布准备不充分”

这张公告里，MiniMax 说 M3 相比 M2 系列能力提升明显，但也带来了超预期的系统复杂度；同时承认这次发布准备并不充分，系统后续还不够稳定。

这几句话其实挺重的。

一般模型发布之后，厂商更愿意讲跑分、讲参数、讲速度、讲价格、讲生态。很少有人主动把“发布准备不足”“未来系统还不够稳定”这种话写到控制台公告里。

但我反而觉得这比普通发布稿有信息量。

因为对开发者来说，最怕的不是厂商承认问题，而是厂商只告诉你模型很强，却不告诉你真实调用时会不会卡、会不会限、会不会高峰期不稳、套餐到底还能用多久。

M3 这类模型不是简单聊天模型。长上下文、Coding、Agent、多模态全都上来之后，背后就是更复杂的调度、更高的 token 消耗、更难预测的并发压力。

MiniMax 过去最香的点，其实是 Coding Plan 的价格安全感

我觉得这次公告不能只看“长期五折”，还要放到 MiniMax 过去的价格优势里看。

MiniMax 之前吸引很多个人开发者和 vibe coding 用户，一个很重要的原因就是 Coding Plan 给人的感觉比较爽：低月费、按请求窗口、用起来不像传统 API 那样每次都盯 token。

第三方 MiniMax M2.5 API 使用指南里也提到过，MiniMax 当时有 Coding Plan 和 credit-based access 两套方式；Coding Plan 给的是每 5 小时窗口的 prompt quota，而直接 API 调用则按 token 费率扣 credits。

这就造成一个很真实的用户感受：以前用 Coding Plan 做代码任务，很多时候更像“买了一个月套餐，就可以比较放开地跑”。对于个人开发者来说，这种心理安全感很重要。

但现在 MiniMax 官方文档里的 Token Plan 逻辑明显不一样了。MiniMax 自己写的是，Token Plan 是在 former Coding Plan 基础上的扩展，覆盖语言、语音、视频、音乐、图像等更多资源；使用额度以 usage bar 显示，对于有按量价格的 API，使用会按对应端点价格从 Token Plan quota 里扣。

这就从“看请求次数”更明显地变成了“看 token 和资源消耗”。

对轻度用户来说，这未必是坏事，因为它覆盖了更多模态，也更统一。但对以前冲着 Coding Plan 来的重度 coding 用户来说，感觉会变。

以前你会觉得自己买的是“能跑很多次代码任务的套餐”。现在你会更关心：M3 一次长上下文任务会吃掉多少 quota？Agent 多轮调用会不会很快把额度打没？周额度和 5 小时窗口到底怎么叠加？超出后怎么扣 credits？

换句话说，MiniMax 曾经很强的那种“量大管饱感”，在 M3 和 Token Plan 之后弱了不少。

更麻烦的是，DeepSeek 和 MiMo 也在打更狠的价格战

如果市场上大家都贵，那 MiniMax 长期五折当然很有吸引力。

问题是，最近国内模型价格战已经卷到很夸张了。

DeepSeek 官方价格页现在列出的 DeepSeek-V4-Flash 价格是：cache miss 输入每百万 tokens 0.14 美元，输出每百万 tokens 0.28 美元；DeepSeek-V4-Pro 是 cache miss 输入 0.435 美元，输出 0.87 美元。cache hit 输入更低，Flash 是 0.0028 美元，Pro 是 0.003625 美元。

Reuters 也报道过，DeepSeek 把 V4-Pro 的 75% 降价做成了永久降价，相当于把旗舰 Pro 模型成本压到原价四分之一。

Xiaomi MiMo 这边也在跟进。MiMo 官方站点显示，MiMo-V2.5 和 V2 系列支持 token-based billing，并且覆盖多个模型；MiMo-V2.5-Pro 本身也是 1M 上下文、面向 agentic 和长任务的模型。第三方价格追踪和媒体报道则显示，MiMo-V2.5 系列在 5 月底做了大幅降价，MiMo-V2.5 和 DeepSeek V4 Flash 一样进入了非常低的 token 价格区间。

这就是 MiniMax 现在尴尬的地方。

M3 的 50% off 看起来不错，OpenRouter 当前展示的 MiniMax M3 价格是输入 0.30 美元/百万 tokens、输出 1.20 美元/百万 tokens。但如果旁边 DeepSeek V4 Flash、MiMo-V2.5 这种模型已经打到 0.14 / 0.28 美元这个级别，MiniMax 的“长期五折”就不再是碾压式优势了。

更关键的是，MiniMax 原本不是只靠模型价格便宜吸引人，它还靠 Coding Plan 那种订阅体验。现在如果 Coding Plan 的优势被 Token Plan 改弱，而按量价格又被 DeepSeek、MiMo 追着打，那 MiniMax 等于把自己曾经很重要的优势弄薄了。

所以这次“长期五折”，我更愿意理解成补救

公告里说，M3 API 原本“限时五折”的优惠，调整为“无期限”。

如果不看背景，这句话很像福利。

但放到现在的价格战里，我觉得它更像是 MiniMax 在补回用户的价格安全感。

因为用户心里会算账。

以前 MiniMax Coding Plan 便宜、能跑、额度感觉宽松，大家愿意忍一些小问题。现在 M3 更强了，但 token 消耗也可能更高，套餐逻辑也更像按量，系统还承认不够稳定。与此同时，DeepSeek 和 MiMo 又在更低价位打。那用户自然会问：我为什么还要继续把 MiniMax 当主力？

所以 MiniMax 必须给开发者一个明确理由。

长期五折是一个理由，但还不够。因为价格只是第一层，真正让人继续用下去的是：稳定、透明、可预期。

M3 的压力不是模型本身，而是“好模型怎么卖、怎么稳、怎么让人放心用”

从模型能力看，M3 肯定不是没有亮点。1M 上下文、Agent、Coding、多模态，本身都很适合现在的开发者工作流。

但问题在于，越是这种模型，越容易遇到两个现实问题。

第一，用户任务变重了。

长上下文会让大家塞更多代码、更多文件、更多日志；Agent 会让一次请求变成多轮调用；多模态会让资源调度更复杂。这些都会把后端压力打出来。

第二，用户对成本更敏感了。

以前很多人愿意用 MiniMax，是因为它便宜得很明显，用起来有“放开跑”的感觉。现在大家开始按 token 看成本，旁边又有 DeepSeek、MiMo 这种更激进的价格锚点，MiniMax 就必须讲清楚自己的价值到底在哪里。

是 M3 的能力明显更强？

是 Token Plan 实际可用量更适合日常 coding？

是高峰期稳定性更好？

是开源后能自部署？

这些都需要后续拿结果说话。

我现在更关心 MiniMax 后续怎么补这几件事

这次公告里，MiniMax 已经把问题说出来了。接下来我更关心它怎么补。

Token Plan 要讲得更清楚，尤其是 M3 在真实 coding / agent 任务里的消耗预估。
最好能给出旧 Coding Plan 和新 Token Plan 的等价使用说明，不然老用户很容易觉得被“换算法”了。
高峰期 TPS 和稳定性要尽快改善，否则长期五折只是降低尝试成本，不能提高生产信任。
M3 开源要给出清晰时间表、许可证、部署文档和量化方案。
如果要打 DeepSeek、MiMo 的价格战，就要把“同等任务实际总成本”讲清楚，而不是只写输入/输出 token 单价。

尤其是最后一点很重要。

Agent 任务不是简单看每百万 token 单价。一次任务到底会消耗多少 token、失败重试多少次、上下文缓存怎么收费、模型能不能少走弯路，这些都会影响真实成本。

如果 MiniMax 想证明 M3 值得用，就应该多给开发者看这种真实任务成本，而不是只把模型能力和折扣摆出来。

我的判断

这次公告本身不一定是坏事。

至少它说明 MiniMax 知道问题在哪里：M3 上线后，不只是模型强不强的问题，而是系统复杂度、稳定性、调度、价格、开源这些东西都要一起处理。

但它也说明 MiniMax 现在确实站在一个比较尴尬的位置上。

旧 Coding Plan 的“便宜又能跑”的优势在变弱；新 Token Plan 更统一，但也更容易让重度用户盯着 token 消耗；DeepSeek、MiMo 又把低价打到了更夸张的位置；M3 还需要时间证明稳定性。

所以我不会因为这则公告唱衰 M3，但也不会只把“长期五折”当成福利来看。

对 MiniMax 来说，接下来真正要赢回来的不是一次折扣，而是开发者心里的那种感觉：我敢长期用它，敢把任务交给它，敢把成本算进去。

这个信任要是回来了，M3 仍然很有机会。

如果回不来，那用户自然会去 DeepSeek、MiMo，或者其他更便宜、更稳、更清楚的选择。

参考资料

MiniMax API Release Notes：MiniMax-M3 发布记录
https://platform.minimax.io/docs/release-notes/models
MiniMax Token Plan Overview
https://platform.minimax.io/docs/token-plan/intro
MiniMax Token Plan Pricing
https://platform.minimax.io/docs/guides/pricing-token-plan
OpenRouter：MiniMax M3 模型与价格信息
https://openrouter.ai/minimax/minimax-m3/pricing
DeepSeek 官方 API 价格页
https://api-docs.deepseek.com/quick_start/pricing
Reuters：DeepSeek V4-Pro 永久降价 75% 报道
https://www.reuters.com/world/china/chinas-deepseek-make-permanent-75-price-cut-flagship-v4pro-ai-model-2026-05-23/
Xiaomi MiMo 官方首页
https://mimo.mi.com/
Xiaomi MiMo-V2.5-Pro 官方介绍
https://mimo.xiaomi.com/mimo-v2-5-pro/
AI API Pricing Comparison 2026：DeepSeek、MiMo 等模型价格对比
https://devtk.ai/en/blog/ai-api-pricing-comparison-2026/