MiniMax致歉新模型计费,老用户获补偿退款
稀宇科技(MiniMax)近期推出的新一代旗舰模型 MiniMax-M3,在计费模式上由原有的按次付费悄然转向了按 Token 消耗量进行计量。此番调整因未充分预先告知用户,且在执行过程中,同等任务下的 Token 消耗量远超开发者预期,导致大量深度用户月度使用额度迅速耗尽,引发了开发者群体的高度不满与集中投诉。
面对日益增大的舆论压力,MiniMax 于 6 月 2 日晚间发布了官方致歉声明,承认此次计费模式调整在沟通上存在不足,过渡方案的考虑不够周全,以及对老用户周限额的处理方式欠妥。公司解释称,全新的 M3 模型在模型尺寸、原生多模态能力以及高达 100 万的上下文长度支持方面均有显著提升,这必然增加了算力资源的消耗。同时,转向行业普遍采用的按 Token 计量方式,旨在为用户提供更灵活的订阅额度使用体验,使其能够跨模态自由支配额度。
为弥补此次失误并表达对订阅用户的歉意,MiniMax 宣布了一系列补偿和权益调整方案。对于在 2026 年 3 月 22 日前购买并享有无周限额权益的老用户,其 M2.7 和 M3 模型将继续保留无周限额的特权。而对于在 3 月 22 日至 6 月 5 日 10:00 之间购买 Token Plan 的用户,将在其有效订阅周期内,M3 模型的周限额额外增加 50%。此外,公司已统一重置了用户额度,并在 6 月 1 日至 6 月 7 日期间,临时将所有订阅用户的“5 小时/周”使用额度翻倍。此前发放的补偿积分有效期已从 1 个月自动延长至 1 年,同时,线上自助退款通道也已于 6 月 3 日(周二)上线,为有需求的用户提供便利。
MiniMax-M3 模型作为一款拥有强大能力的旗舰模型,其核心亮点在于超大的模型尺寸、对原生多模态的完整支持,以及极为惊人的 100 万 Token 上下文长度。这些特性使其在处理复杂、长篇幅的输入内容,以及理解和生成多模态信息方面具有显著优势。然而,伴随而来的是对算力的巨大需求,这也直接体现在了按 Token 计费模式下,同等任务下更高的消耗量。对于开发者而言,其输入形式涵盖了文本、图像等多种模态,输出形式也更加多样化,但其上手门槛和实际使用成本,尤其是在进行大规模或持续性任务时,需要进行更为精细的成本核算和模型选择。
此次计费模式的调整,也折射出当前大模型行业在商业化进程中面临的普遍挑战。此前,月之暗面(Kimi)也曾因类似的计费策略调整引发用户维权。业内专家分析认为,随着大模型向 AI 智能体(Agent)等更复杂的应用场景演进,单次任务的 Token 消耗量呈几何级增长,厂商转向按 Token 计费是出于控制算力成本的必然选择。然而,在这一商业化转型的关键时期,如何确保用户的知情权,建立透明、可信的消费体系,成为了整个行业共同亟待解决的课题。