MiniMax M3 大模型开源,三大能力独步全球
稀宇科技于 6 月 1 日正式推出其最新一代大语言模型 MiniMax M3,该模型在技术指标上实现了多项国内乃至全球范围内的首创。M3 模型集成了领先的编程能力,并支持高达 100 万(1M)的超长上下文窗口,同时具备原生多模态交互能力。这三项尖端技术指标的融合,使其成为国内首个达成此成就的大模型,也是目前全球范围内唯一开源的具备此类全面性能的模型。
在多项权威性能评测中,MiniMax M3 展现了强大的竞争力。在极具挑战性的编程评测集 SWE-Bench Pro 上,M3 取得了 59.0% 的高分,超越了 GPT-5.5 和 Gemini 3.1 Pro,并逼近了行业标杆 Claude 3.5 Opus 的水平。此外,在衡量 AI 智能体调度能力的 Claw-Eval 评测以及考察多模态文档解析能力的 OmniDocBench 测试中,M3 同样取得了行业最高分,或在部分指标上领先于 Gemini 3.1 Pro。

M3 模型性能的飞跃与其底层架构的革新息息相关。其采用了全新的稀疏注意力架构 MSA(MiniMax Sparse Attention)。基于这一底层设计,模型在处理 100 万的超长上下文时,每个 Token 的计算量仅为上一代模型的二分之一。这一优化直接带来了显著的速度提升:在 Prefilling(预填充)阶段,模型运行速度提升超过 9 倍;而在 Decoding(解码生成)阶段,加速更是达到了惊人的 15 倍以上,极大地降低了算力成本。
作为一款原生多模态模型,MiniMax M3 在理解文本的基础上,还支持图片、视频的主动输入,甚至能够直接执行复杂程度的电脑桌面自动化操作。伴随 M3 的发布,稀宇科技同步升级了旗下的 AI 编程助手产品 MiniMax Code,并面向开发者推出了三种不同层级的 Token Plan 订阅方案:Plus(49 元/月)、Max(119 元/月)和 Ultra(469 元/月),以满足各类开发者的多样化需求。
MiniMax M3 的 API 接口现已向公众开放。为了鼓励开发者积极参与生态建设,官方还推出了限时优惠活动,其中 512k 上下文版本的 API 将享有为期 7 天的 5 折促销。值得关注的是,稀宇科技承诺将在 10 天内向全球开发者正式开源 M3 模型的完整权重以及详尽的技术报告。这种全面的开放策略,有望进一步推动端侧及应用层 AI 技术的快速发展和创新。
MiniMax M3 的原生多模态能力和超长上下文窗口,使其在处理复杂文档、长篇内容创作、以及需要深度理解多模态信息的应用场景中潜力巨大。其高效的架构优化也降低了开发和部署成本,有望加速 AI 技术在更广泛领域内的普及。开发者可以通过 API 接口快速上手,体验其强大的文本理解和生成能力,而开源策略则预示着社区驱动的创新将迎来新一轮高潮。