MiniMax M3:国产AI大模型挑战GPT-5.5
稀宇科技发布新一代大模型MiniMax M3,多模态能力与长文本处理创行业新标杆
稀宇科技于今日正式推出其最新一代人工智能大模型MiniMax M3,该模型在多个关键技术指标上实现了重大突破,尤其是在编程能力、超长上下文处理以及原生多模态交互方面,为国内AI领域树立了新的标杆。MiniMax M3不仅具备强大的编程效能,更首次实现了高达100万的超长上下文窗口,能够处理极为庞大和复杂的信息输入。

在权威性能评测中,MiniMax M3展现出令人瞩目的实力。在业界公认的编程能力评测集SWE-Bench Pro上,该模型取得了59.0%的得分,超越了GPT-4.5和Gemini 1.5 Pro,直逼顶尖模型Opus 4.7。此外,在评估AI智能体交互能力的Claw-Eval测试以及多模态文档理解测试集OmniDocBench中,MiniMax M3同样获得了最高分或领先的成绩,显示出其在复杂任务处理和跨模态理解方面的卓越性能。
MiniMax M3的性能飞跃得益于其全新的稀疏注意力架构(MSA)。这一创新性的技术使得模型在处理百万级超长上下文时,单token计算量大幅降低至上一代模型的二十分之一,从而在理解阶段实现了超过9倍的速度提升,生成答案的速度更是提升了15倍以上。该模型目前已通过API向开发者开放使用,并且稀宇科技承诺将在未来10天内向全球开发者开源模型权重和技术报告。
MiniMax M3的原生多模态能力尤为值得关注,它能够直接处理图像、视频输入,并支持电脑桌面操作,这是国内首个集成这三项核心能力并开源的大模型。这意味着用户不仅能输入文本,还能通过多媒体内容与模型进行更丰富、更直观的交互。在实际应用场景中,其超长上下文的处理能力将极大赋能于需要分析海量文档、代码或日志的工作,例如法律合同审查、大规模代码库分析、深度学习模型训练数据整理等。同时,其多模态能力则为内容创作、智能客服、人机协作等领域带来了更广阔的可能性,降低了人机交互的门槛,提升了工作效率。